浏览无限滚动网页并在浏览器Python中打开x链接

问题描述

我想

  1. 访问网站
  2. 登录
  3. 在无限滚动页面中浏览一堆块。
  4. 检查每个块中的某些内容,如果匹配,请在该块上“单击”以在新的浏览器选项卡中打开链接页面。对内容匹配的前x个匹配项执行此操作。
  5. 冲洗,每小时重复一次。

#1很简单

#2-我将尝试How can I login to a website with Python?,尽管有些评论似乎表明某些发布的解决方案不适用于更新版本的Python。

#5-我将尝试Scheduling Python Script to run every hour accurately

#3,4 最大的挑战是我不确定如何处理无限滚动。 (还应注意,无限滚动页面的div / <div class="Navbar__Wrapper-someID"...>...</div>

中包含一个永久的标题/导航栏。

接下来,我是文本分析的新手,所以对匹配内容的任何建议将不胜感激。 无限滚动页面按块组织。每个块都包裹在div中

<div width="210px" class="ProductGrid__FeedTileWidthWrapper-someID">
  <a id="" scaleonhover="1" data-source="" data-id="SomeID" class="FeedTile__Wrapper-SomeID" href="/Feed/tabbed_Feed_latest/product/ProductID">...</a>
</div>

在div / block中,我要检查是否存在

<div color="#f8fafb" class="FeedTile__UrgencyInventoryBySpec-Some ID">

如果有,那么我想在上方div的锚点中打开链接,即

/Feed/tabbed_Feed_latest/product/ProductID
在新的浏览器标签中。

但是我不想让进程永远运行,所以我想在打开的x个新浏览器选项卡上画线。

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)