正则表达式匹配中文

现在基本所有的编程语言都支持中文代码认是用unicode来处理字符串,所以中文和unicode是等价的,所以正则表达式中匹配中文可以用unicode码来代替

1、如果你想匹配特定的中文,比如 :你好,你可以直接用中文 你好来匹配

比如想匹配 hello你好 中的你好两个中文,可以写成

你好

也可以把你好先转换成unicode码

\u4f60\u597d

上面两种是等价的

2、但是你想匹配出一段文本中的所有中文字符,就只能用unicode码了,因为你无法穷尽所有的中文

[\u4e00-\u9fa5]+

如果报错,把\转义就可以了

相关文章

ip正则匹配
密码长度最少8位 大写字母,小写字母,数字,特殊符号必须四选三
年月日时分秒
B站弹幕屏蔽刷剩余寿命(发布时间)的
密码长度最少8位 大写字母,小写字母,数字,特殊符号必须四选三
zabbix键值匹配