虽然
regexp不是完全解析
HTML文档的正确工具,但我发现很多人盲目地忽略了有关regexp的任何问题,如果他们在提议的文本中看到
一个HTML
标签那么多.
由于我们看到很多正则表达式的例子不是正确的工具,我在此问你的意见:简单的模式匹配比使用完整的解析引擎更好的解决方案是什么?
如果您想要使用正则表达式解析的HTML集合已知符合某种模式.例如如果您知道没有注释掉的HTML或复杂的场景等.
例如我经常宣称你不应该使用HTML的regexp,但是如果我有一套我熟悉的HTML,很简单并且我可以很容易地检查后操作,那么我对使用正则表达式没有任何疑虑那.