如何在lxml中获取html的源代码？

HTML 2020-08-29

import urllib
import lxml.html
down='http://blog.sina.com.cn/s/blog_71f3890901017hof.html'
file=urllib.urlopen(down).read()
root=lxml.html.document_fromstring(file)
body=root.xpath('//div[@class="articalContent  "]')[0]
print body.text_content()

当我运行代码时,我得到的是文本内容,我如何获得它的html源代码,而不是文本内容？

解决方法

使用

html = lxml.html.tostring(node)

并请：先阅读您正在使用的工具的基本文档.

Vue+elementUI 自定义动态数据菜单导航组件实现展开收缩+路由跳转router-view渲染数据路由跳转到同一个页面带参数ID 自动刷新数据

准备:导入ElementUI 看官网教程数据准备:JSON数据转换成树状...

vue阻止冒泡事件阻止点击事件的执行结合div和组件阻止点击事件

vue阻止冒泡事件阻止点击事件的执行 <div @click=&a...

自用代码css获取任意网址的/favicon.ico的方法教程

尝试过使用网友说的API接口获取找到的都是失效了暂时就使用...

JS实现 JSON扁平数据转换树状数据

后台我拿的数据是这样的格式: [ {id:1 , parentId: 0, name:...

JAVA下载文件防重复点击,防止多次下载请求，Cookie方式快速简单集成教程

JAVA下载文件防重复点击,防止多次下载请求，Cookie方式快速简...

Mip是什么意思以及作用有哪些

如何在lxml中获取html的源代码？

解决方法

相关文章