问题描述
最初,我想为这个网站编写一个网络爬虫:
https://ope.ed.gov/programs/maped/storymaps/trio/
该网站有一张地图,其中每个点 - 当点击时 - 显示学生计划的信息。然而,点击一个点会动态地将 HTML 添加到页面中,所以我编写一个简单的网络爬虫来提取信息不再是一种选择。
我注意到 - 然而 - 通过使用 Chrome 中的网络选项卡 - 当页面加载时,它会多次调用服务。以下是请求网址之一:
在另一个选项卡中打开此网址会使 Chrome 下载 PBF 文件 (.pbf)。这个文件看起来很难解析,所以我想知道如何将这个文件转换成 CSV 文件?我做了一些研究,我想象这个文件中的每个“节点”都有我需要的以下信息(见下面的例子):
- 位置名称/程序类型(包含在同名中)
- 示例:学生支持服务:宾夕法尼亚曼斯菲尔德大学
- 总资金
- 265,802 美元
- 参与者总数
- 200
- 项目总监 (PD) 姓名
- 金·谢尔顿
- PD 电子邮件
- kshelton@mansfield.edu
- PD电话
- 570-662-4368
- 网址
我找到了这个工具 (https://wiki.openstreetmap.org/wiki/Osmconvert),但我不知道如何在 MAC OS 上运行它。有什么提示吗?
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)