问题描述
|
我正在使用此正则表达式exp
/[^\\p{L}\\s-]/
捕获奇怪的字符。
问题是正则表达式匹配以下单词:
Santarém (city name)
or
Constançia (city name)
所以我需要阻止符号\"#$#%/*&/!
,但不能阻止´`Ç或^〜-
谢谢
解决方法
我不知道城市名称的存储方式,但是标记可以存储为单独的unicode元素,在这种情况下,您需要在正则表达式中包含\\ p {M}(根据http://www.regular -expressions.info/unicode.html#prop)
, 这解决了我的问题
谢谢
[^A-Za-z0-9-áàçéâãôó]|(\\d+)