如何在以主动方式更改内容的网站上抓取数据?

问题描述

我想从下面的页面中获取卫星位置,但我不确定抓取是否合适,因为该页面似乎每秒都在使用一些内部代码进行更新(在我断开与互联网)。背景信息可以在我在 Space Stackexchange 上的问题中找到:一种更好的方法来下载 Orbcomm-2 卫星的位置。

我需要同时包含四个项目的“快照”:

  • UTC 时间
  • 纬度
  • 经度
  • 海拔

现在我使用屏幕截图和手动输入。由于这些值正在由页面更新 - 传统的网络抓取在这里是否有效?我发现了一个“屏幕抓取”标签,我应该尝试了解它吗?

我正在寻找获得这四个值的最简单的解决方案,我想知道我是否可以只使用 urllib 或 urllib2 并避免安装新的东西?

示例页面:http://www.satview.org/?sat_id=41186U 我需要从 41179U 到 41189U(SpaceX 刚刚送入轨道的 11 颗 Orbcomm-2 卫星)

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)