问题描述
||
我很难找到从哪里开始。我从外部网站获取信息,并将一些内容放在页面上。我想我需要做两件事。 1.谷歌搜索,使用给出当前对象名称的顶部搜索的网址。 2.一种检查结果来源并输出具有特定类别的标签信息的方法。
为了更好地解释这一点,我将创建一个假设的情况:假设我有一个列出床垫并进行评论的网站。假设我要添加其他网站的评论,并且在此网站中有一个类似3.5 / 5的标签。然后,我想显示此评论以及指向外部页面的链接。有没有一种方法可以搜索\“ site:http:// mattressreviewsite / @ matress.name \”这样的站点,提取该顶部URL,然后在源中搜索字符串“ class = \'rating \'\”并显示在我看来?
感谢您的帮助或指导。我正在使用Rails 3。
解决方法
为此,您需要一个HTTP客户端(httparty,net / http-default)并进行一些解析以获取所需的结果。
去研究google的url模式(据我记得是google.com?q=search_string),然后使用http客户端进行请求(获取/发布)。解析结果(也有许多HTML解析器gem)可用,以获取所需的内容以及任何后续的HTTP请求。别忘了Google的“我感到很幸运”功能仅返回一个结果。
祝一切顺利!