错误:AttributeError:进行YouTube网络抓取时,“协程”对象没有属性“ newPage”

问题描述

我正尝试在youtube上进行网络抓取,以从视频中获取信息,但是它给出了一个错误,并且似乎在requestshtml的renders()中,如下代码

from requests_html import AsyncHTMLSession
import pyppdf.patch_pyppeteer
import pyppeteer

import asyncio
if asyncio.get_event_loop().is_running(): # Only patch if needed (i.e. running in Notebook,Spyder,etc)
    import nest_asyncio
    nest_asyncio.apply()
    
url = "https://www.youtube.com/watch?v=3vY2L0ikq8w"

session = AsyncHTMLSession()
# inserindo a query e o numero da pagina na url
print(url)
# enviado requisição para o youtube
response = await session.get(url)
# executando Java-script
await response.html.render(sleep=1)
# renomear o arquivo
link_name = re.search('v=(.*)',link).group(1)
# Salvando arquivo HTML na pasta dados_brutos
with open("./dados_brutos/videos/video_{}.html".format(link_name),'w+',encoding='utf8') as output:
    output.write(response.html.html)
    
time.sleep(2)

错误描述

--------------------------------------------------- ---------------------------- AttributeError Traceback(最近一次调用 最后)在async-def-wrapper()中 19#renomear o arquivo 20链接名= re.search('v =(。*)',链接).group(1) ---> 21#Salvando arquivo HTML na pasta dados_brutos 22 with open(“ .. dados_brutos / videos / video _ {}。html” .format(link_name),'w +', encoding ='utf8')作为输出: 23 output.write(response.html.html)

〜\ AppData \ Local \ Continuum \ anaconda3 \ lib \ site-packages \ requests_html.py 在render(自我,重试,脚本,等待,向下滚动,睡眠,重新加载, 超时,keep_page) 596尝试: 597 -> 598内容,结果,页面= self.session.loop.run_until_complete(self._async_render(url = self.url, 脚本=脚本,睡眠=睡眠,等待=等待,内容= self.html, 重新加载=重新加载,向下滚动=向下滚动,超时=超时, keep_page = keep_page)) 599除了TypeError: 600次通过

〜\ AppData \ Local \ Continuum \ anaconda3 \ lib \ site-packages \ nest_asyncio.py 在run_until_complete中(自己,将来) 93提高RuntimeError( 94'事件循环在Future完成之前停止。) -> 95返回f.result() 96最后: 97个事件。_set_running_loop(old_running_loop)

〜\ AppData \ Local \ Continuum \ anaconda3 \ lib \ asyncio \ futures.py在 结果(个体) 176 self .__ log_traceback = False 177如果self._exception不为None: -> 178提高自我._exception 第179回 180

〜\ AppData \ Local \ Continuum \ anaconda3 \ lib \ asyncio \ tasks.py在 __step( 解析参数失败 ) 221#我们直接使用send方法,因为协程 222#没有__iter____next__方法。 -> 223结果= coro.send(无) 224: 225结果= coro.throw(exc)

〜\ AppData \ Local \ Continuum \ anaconda3 \ lib \ site-packages \ requests_html.py 在_async_render中(自我,网址,脚本,向下滚动,睡眠,等待,重新加载, 内容,超时,keep_page) 503“”“处理页面创建和js渲染。render/ arender方法的内部使用。”“” 504尝试: -> 505页=等待self.browser.newPage() 506 507#等待呈现页面,以防止超时。

AttributeError:“协程”对象没有属性“ newPage”

帮我运行这段代码

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)