问题描述
我正在尝试在任何亚马逊搜索中抓取产品及其价格,因此我正在使用 R 中的 rvest 库来做到这一点。
例如,对于这个搜索:
我想提取所有产品名称及其价格。我尝试了以下操作:
library(rvest)
link='https://www.amazon.com.mx/s?k=gtx+1650+super&__mk_es_MX=%C3%85M%C3%85%C5%BD%C3%95%C3%91&ref=nb_sb_noss_2'
simple=read_html(link)
simple %>% html_nodes("[class='a-size-base-plus a-color-base a-text-normal']") %>% html_text()
使用 Chrome,类 'a-size-base-plus a-color-base a-text-normal' 是 存储的产品名称。
该代码运行良好,我得到了所有产品名称。所以,我试图用这个来获得他们的价格:
simple %>% html_nodes("[class='a-offscreen']") %>% html_text()
使用 Chrome 时,“a-offscreen”类是其存储价格的位置。
该代码会返回搜索中的每个价格,但如果您看过搜索,则并非所有产品都有价格。因此,该代码会返回带有价格的产品,而我无法将产品与其价格相匹配。
有没有办法让它成为可能?也许可以只过滤那些具有“a-offset”类的产品并获取其价格?
谢谢。
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)