提取正则表达式匹配的一部分

问题描述

( )在 regexp 和python 中使用group(1)来检索捕获的字符串(如果没有找到结果re.search会返回,所以不要 直接 使用):None group()

title_search = re.search('<title>(.*)</title>', html, re.IGnorECASE)

if title_search:
    title = title_search.group(1)

解决方法

我想要一个正则表达式来从 HTML 页面中提取标题。目前我有这个:

title = re.search('<title>.*</title>',html,re.IGNORECASE).group()
if title:
    title = title.replace('<title>','').replace('</title>','')

是否有正则表达式可以仅提取 的内容,因此我不必删除标签?</p> </div></div><div class="topcard-tags"></div> </div> </div> </div> <!-- row end--> </div> </div> <footer id="footer"> <div class="container"> <div class="copyright"> Copyright © 2018 编程之家. 当前版本 V7.0.16<br> <span class="ml5">编程之家 版权所有 <a href="https://beian.miit.gov.cn/" target="_blank" rel="nofollow">闽ICP备13020303号-8</a> </div> </div> </footer> <script src="https://m.jb51.cc/js/count.js"></script> </body> </html>