问题描述
我正在尝试抓取一个带有 chromedp 的网站,在某些时候有多个页面,我需要点击每个页面。我成功地点击了第 2 页(每个页面都是一个 <a href>
元素)并且 scrape 是它的内容,但是当我的代码需要点击第 3 页时,我出现了 Could not find node with given id (-32000)
错误。 >
对于我在其他问题上看到的情况,它可能来自滞后的服务器,所以我在 HTML 元素上测试了 waitVisible
和 waitReady
,这些元素存储了我需要刮取的结果 但我仍然有这个问题。
我可能知道是什么导致了这个错误,当我点击下一页的链接时,页面被刷新但不是 url,所以我怀疑包含我的 a href
链接的节点数组是无效。
这是我实际尝试过的
ctxWithTimeOut,cancel := context.WithTimeout(ctx,time.Second*45)
defer cancel()
err = chromedp.Run(ctxWithTimeOut,chromedp.WaitVisible(".EnTeteTableau",chromedp.ByQuery))
if err != nil {
log.Printf("impossible de trouver l'élément .EnTeteTableau")
log.Fatal(err)
} else if numberOfPages > "1" {
log.Printf("dans le if page > 1")
err = chromedp.Run(ctx,chromedp.Sleep(time.Second*3))
if err != nil {
log.Fatal(err)
}
// Récupération des liens <a> des pages
var pages []*cdp.Node
err = chromedp.Run(ctx,chromedp.Nodes("td.pagination>a",&pages,chromedp.ByQueryAll))
if err != nil {
log.Fatal(err)
} else {
log.Printf("a trouvé les éléments paginations")
var specIDList []string
for _,v := range pages {
fmt.Println("nodes pages ",v)
log.Printf("dans le for,taille de page",len(pages))
// Récupération de chaques lignes du tableau
err = chromedp.Run(ctx,chromedp.Nodes(".light a,.dark a",&nodes,chromedp.ByQueryAll))
if err != nil {
log.Fatal(err)
}
specIDList = append(specIDList,getSpecID(nodes)...)
log.Println(specIDList)
err = chromedp.Run(ctx,chromedp.MouseClickNode(v))
if err != nil {
log.Fatal(err)
}
log.Printf("a cliqué")
// Après le clic sur la page suivante on a besoin d'attendre que le tableau s'affiche à nouveau sinon on déclenche l'erreur
// Could not find node with given id (-32000)
err = chromedp.Run(ctxWithTimeOut,chromedp.ByQuery))
fmt.Println(v.NodeID)
if err != nil {
log.Printf("impossible de trouver l'élément .EnTeteTableau")
log.Fatal(err)
}
// err = chromedp.Run(ctx,chromedp.Sleep(time.Second*3))
// if err != nil {
// log.Fatal(err)
// }
}
}
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)