有人可以推荐一个兼容Python-3的库或模块来解析这些数据吗?对于Python 2.x,我的Google-fu似乎出现了SGMLParser,但这当然已被弃用(并且完全从Py3k中移除).
许多人似乎建议使用lxml,但由于依赖性问题,这对我来说不是一个选择.
我知道BeautifulSoup非常适合凌乱的标记,但A)最后我听说它不兼容py3k,而且B)这个内容结构合理.
> BeautifulSoup4