问题描述
我只是想在没有 HTML 部分的情况下替换以下文本
designed to display special types of text:<b>- Bold text<strong> - Important text<i> - Italic text<em> - Emphasized text<mark> -
使用此正则表达式将 <
和 >
之间的所有内容替换为空
html = html.replace("/(<\/*\w+?>)/g",'');
但我的正则表达式似乎不起作用,如何获得准确的?
解决方法
如果您不打算使用组,则无需使用 __version__
分组。一个相对简单的正则表达式就足够了:
- 匹配
()
- 匹配任意数量的字符,non-greedy
<
- 匹配
.*?
- 适用于所有
>
- 替换为
g
''
警告 请注意,使用正则表达式解析 HTML 并不可靠。它可能适用于您的场景,但非常很容易打破/提供一个不起作用的字符串。