问题描述
我正在使用 Ruby 的标准 RSS::Parser 来解析 RSS 和 Atom 的提要。 RSS 不匹配,但 Atom 有点复杂。
我使用:
require 'open-uri'
require 'RSS'
Feed = RSS::Parser.parse(open(Feed_url).read,false)
如果我这样做了
first_post = Feed.items.first
if Feed.Feed_type == 'atom'
first_post.link.href
end
我得到了 first_post
的第一个链接对象,它不是指向博客文章的常规 URL。我希望得到类似 http://thisblog.com/2020/07/11/this-blog-post 的东西,但我得到了一个提要的链接。我可以看到有 5 个链接对象 (first_post.links
),但是如何确保从这 5 个链接对象中获得博客文章的“正常”网址?我假设会有类似 first_post.link[type="text/html"]
之类的东西,但在文档中找不到任何信息。
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)