从网站解析文本,无需提供类和ID

问题描述

我可以解析网站,如果网站上缺少类和ID。 xpath也不起作用,或者我做错了。 我想获取有关游戏的信息-系统要求,数据和其他信息。我如何做到这一点,以便输出看起来像在草稿中?

enter image description here

我的完整代码-https://github.com/FreedomEssence/Torrent-Ighruha_Parser/blob/master/__init__.py

解决方法

您可以使用css选择器#dle-content > div:nth-child(3)来定位此元素。

divtext = soup.select('#dle-content > div:nth-child(3)')[0].text

输出-

'\nДата обновления: 2019Жанр: Action,Tank,3D,Online-onlyРазработчик: Wargaming.netИздательство в России: Wargaming.netТип издания: ЛицензияЯзык интерфейса: РусскийЯзык озвучки: РусскийТаблетка: Не требуетсяСистемные требования:Операционная система:  XP / Vista / 7 / 8 / 10Процессор: Pentium 4 2,4 GHzОперативная память: 4 ГбВидеокарта: 512 Mb - 1024 Mb / nVIDIA / ATI Radeon®Звуковая карта: Звуковое устройство DirectX® 9.0сСвободное место на жестком диске: 16 Гб\n \n\n   \n\n\n'

相关问答

依赖报错 idea导入项目后依赖报错,解决方案:https://blog....
错误1:代码生成器依赖和mybatis依赖冲突 启动项目时报错如下...
错误1:gradle项目控制台输出为乱码 # 解决方案:https://bl...
错误还原:在查询的过程中,传入的workType为0时,该条件不起...
报错如下,gcc版本太低 ^ server.c:5346:31: 错误:‘struct...