正则表达式匹配中文

现在基本所有的编程语言都支持中文，代码里默认是用unicode来处理字符串，所以中文和unicode是等价的，所以正则表达式中匹配中文可以用unicode码来代替

1、如果你想匹配特定的中文，比如：你好，你可以直接用中文你好来匹配

比如想匹配 hello你好中的你好两个中文，可以写成

你好

也可以把你好先转换成unicode码

\u4f60\u597d

上面两种是等价的

2、但是你想匹配出一段文本中的所有中文字符，就只能用unicode码了，因为你无法穷尽所有的中文

[\u4e00-\u9fa5]+

如果报错，把\转义就可以了

相关文章