用scrapy抓取ajax页面；网址略有调整的情况

编程问答 2022-05-30

问题描述

我正在用scrapy 抓取一些网站，并且遇到了一些ajax 页面。我启用了 Scrapy ajax 中间件，但这确实为我提供了这些页面的 html 数据。

我注意到该网站提供了 ajax 页面的 html 版本，与常规 url 仅略有不同：

ajax 页面：https://www.example.com/general/search/#&ajax=true&page=2
html 等效：https://www.example.com/general/search/?&ajax=true&page=2

所以基本上用 ?将页面从ajax更改为html。根据这个观察，我有几个问题：

这是一种常见的网站方式，只需替换一个字符即可访问 ajax 页面的 html 内容吗？
Scrapy ajax 中间件不应该处理这些“简单”的变化吗？

解决方法

暂无找到可以解决该程序问题的有效方法，小编努力寻找整理中！

如果你已经找到好的解决方法，欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@）

ajax extractor python scrapy

相关问答

Selenium Web驱动程序和Java元素在(x，y)点处不可单击其他元素将获得点击?

Selenium Web驱动程序和Java。元素在(x，y)点处不可单击。其...

Python-如何使用点“” 访问字典成员？

Python-如何使用点“。” 访问字典成员？

Java 字符串是不可变的到底是什么意思？

Java 字符串是不可变的。到底是什么意思？

Java中的“ final”关键字如何工作？我仍然可以修改对象

Java中的“ final”关键字如何工作？（我仍然可以修改对象。...

“loop:”在Java代码中这是什么，为什么要编译？

“loop:”在Java代码中。这是什么，为什么要编译？

java.lang.ClassNotFoundException：sun.jdbc.odbc.JdbcOdbcDriver发生异常为什么？

java.lang.ClassNotFoundException：sun.jdbc.odbc.JdbcOdbc...