问题描述
|
我有以下代码。我想从中提取最后一个文本(
hello64
)。
<span class=\"qnNum\" id=\"qn\">4</span><span>.</span> hello64 ?*
我使用了下面的代码,但它删除了所有整数
questionText = questionText.replace(/<span\\b.*?>/ig,\"\");
questionText=questionText.replace(/<\\/span>/ig,\"\");
questionText = questionText.replace(/\\d+/g,\"\");
questionText = questionText.replace(\"*\",\"\");
questionText = questionText.replace(\". \",\"\"); i want to remove the first integer,and need to keep the rest of the integers
解决方法
它是第三行“ 3”,它替换整数。如果要保留整数,则不要替换
\\d+
,因为它匹配一个或多个数字。
顺便说一下,您可以在一行上完成所有这些操作-无需在那里进行多次替换:
var questionText = questionText.replace(/((<span\\b.*?>)|(<\\/span>)|(\\d+))/ig,\"\");
这样做与代码的前三行相同。 (当然,如果您不想删除数字,则需要按照答案的第一部分删除|(\\d+)
。
[编辑]
关于您要替换第一个整数而不是后续整数的评论:
正则表达式字符串将在很大程度上取决于可能的输入是什么样子。问题是您给了我们一些随机的HTML代码;我们不知道您是否期望它始终采用这种精确的格式(例如,几个跨度的内容,然后在最后保留一点)。我假设情况就是这样。
在这种情况下,整个事情要简单得多的正则表达式是用空白替换<span
....ѭ8within中的eveything:
var questionText = questionText.replace(/(<span\\b.*?>.*?<\\/span>)/ig,\"\");
这将消除整个<span>
标签及其内容,但不包括任何内容。
在您的示例中,这将提供理想的效果,但是正如我所说,在不了解您的预期输入的情况下,很难知道这是否在所有情况下都适用。
通常,用正则表达式解析任意HTML代码被认为很困难。 Regex是\“ Regular Expressions \”的缩写,可以说它们擅长处理具有'regular \'语法的字符串。任意HTML不是“常规”语法,因为它具有无限可能的嵌套级别。我要在这里说的是,如果您所提供的内容比简单的HTML代码段复杂,那么最好使用HTML解析器提取数据。,这将匹配完整的字符串,并将最后一个</span>
之后的部分放到下一个单词边界\\b
处,并将其放入捕获组1中。您只需要然后用组1进行替换,即$1
。
searched_string = string.replace(/^.*<\\/span>\\s*([A-Za-z0-9]+)\\b.*$/,\"$1\");
捕获的单词可以由ѭ15组成。如果您还有其他需要,只需将其添加到该组中即可。