如何使用Asp.net进行抓取过程来获取网站的所有URL?

问题描述

| 如何获取网站的所有URL 假设我想在一个网站中抓取部分数据,该数据在不同的网页中如何获取所有url的列表以进入所有这些相似的页面。 假设在一个手机网站中,我想获得一个品牌的所有手机,如何才能获得网站中不同URL上的手机。我发现所有手机的Div标签类别均为\“商标名称\” Div Class \“ Nokia \” ....我希望将div class为nokia的网站的URL。     

解决方法

        您可以使用HTML解析器(例如Html Agility Pack)从锚点,表单中提取所有网址,...如果该网址不是您要解析的HTML的一部分,您将无法(除了猜测)知道所有内容对于给定的域,可能存在子域和url。     

相关问答

依赖报错 idea导入项目后依赖报错,解决方案:https://blog....
错误1:代码生成器依赖和mybatis依赖冲突 启动项目时报错如下...
错误1:gradle项目控制台输出为乱码 # 解决方案:https://bl...
错误还原:在查询的过程中,传入的workType为0时,该条件不起...
报错如下,gcc版本太低 ^ server.c:5346:31: 错误:‘struct...