将scrapy爬虫与Django集成

问题描述

在将其标记为重复之前，请先阅读。我已经研究了很多，但没有发现任何东西（虽然是同一个标题的不同问题）。

在我的项目中，我想从用户那里获取一个 URL 并使用 Scrapy 蜘蛛/爬虫抓取该 URL。我首先尝试通过将抓取代码直接放在我的 views.py 中来做到这一点，但是 twisted.internet.reactor 的启动/停止导致了问题。另一种方法是使用调度程序，例如 Scrapyd。但关键是特定视图中的下一个操作必须在爬虫完成抓取后才发生。 Scrapyd 只会调度爬虫。

如果我对 Scrapyd 的假设有误，或者我可以使用一些 API 来跟踪抓取进度，请纠正我。如果没有，请建议我可以做些什么来实现这一目标。 TIA。

解决方法

暂无找到可以解决该程序问题的有效方法，小编努力寻找整理中！

如果你已经找到好的解决方法，欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@）

django scrapy scrapyd twisted