问题描述
我使用页面爬虫设置了 Azure 搜索索引。
当我检索搜索数据时,我识别出仅包含在页面类型的搜索字段设置中设置为可检索、可搜索等的字段。
当我查询索引时,我发现页面的HTML中的所有内容词都被找到了。所以它们必须在该索引中的某个位置。
我的问题:如何访问 Azure 搜索索引中的爬网内容?
我想用它来显示搜索结果中的内容预览。
页面的大部分内容不在同一个页面节点中。它存储在子节点中并由列表小部件重复。所以我不能只对页面爬虫抓取的所有 HTML 内容使用一些页面字段。
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)