现在基本所有的编程语言都支持中文,代码里默认是用unicode来处理字符串,所以中文和unicode是等价的,所以正则表达式中匹配中文可以用unicode码来代替
1、如果你想匹配特定的中文,比如 :你好,你可以直接用中文 你好来匹配
比如想匹配 hello你好 中的你好两个中文,可以写成
你好
也可以把你好先转换成unicode码
\u4f60\u597d
上面两种是等价的
2、但是你想匹配出一段文本中的所有中文字符,就只能用unicode码了,因为你无法穷尽所有的中文
[\u4e00-\u9fa5]+
如果报错,把\转义就可以了