如何将javascript渲染模块集成到scrapy中?

我正在开发一个网络抓取程序,但我遇到了一个使用scrapy生成 javascript内容的问题.我知道scrapy不是用来做这种类型的刮擦,但我一直在尝试使用 scrapyjssplash来完成我需要的东西.

但是,我不能让这两个模块中的任何一个与scrapy一起正常工作.我的问题是,如果有人有一个最小的例子,他们可以显示使用scrapyjs或splash来呈现javascript页面

编辑:
我的平台是ubuntu,我使用python.对于scrapyjs我只是把源放在scrapy项目的最上面的目录中,我还没有找到关于如何使用splash的真正指南.我之所以要问泼溅的原因是因为它似乎是一个更强大的javascript渲染模块,并且在与scrapjs相同的对话中被提及了很多.

解决方法

我相信你所要做的就是实现 process_links in your Spider

def proxy_url(url):
        return "http://localhost:8050/render.html?url=%s&timeout=15&wait=1" % url


def process_links(self,links):
        for link in links:
            link.url = proxy_url(link.url)
        return links

相关文章

前言 做过web项目开发的人对layer弹层组件肯定不陌生,作为l...
前言 前端表单校验是过滤无效数据、假数据、有毒数据的第一步...
前言 图片上传是web项目常见的需求,我基于之前的博客的代码...
前言 导出Excel文件这个功能,通常都是在后端实现返回前端一...
前言 众所周知,js是单线程的,从上往下,从左往右依次执行,...
前言 项目开发中,我们可能会碰到这样的需求:select标签,禁...