oracle 19c中regexp函数的怪异行为

问题描述

我不是regexp的专家,但是认情况下应该区分大小写。 我试图弄清楚为什么当第一个大写字母时正则表达式会给我前两个字符

select regexp_substr('JohnFoo','[a-z]{2}') from dual;

输出为'Jo'

如果我尝试过

select regexp_substr('JohnFoo','^[a-z]{2}') from dual;

输出是相同的,但是它应该在开头识别2个非大写字母,因此在这种情况下不匹配

然后我尝试了所有参数

select regexp_substr('JohnFoo','[a-z]{2}',1,'c') from dual;

再次输出为“哦”的“乔”内幕

我在做什么错?此行为与substr相同,请替换。在我看来,就像无视首都

解决方法

您应该首先在会话中检查NLS设置。 BINARY可以提供您期望的行为,您可能尚未指定该行为。

下面是一个小例子

ALTER SESSION SET NLS_COMP=BINARY;
ALTER SESSION SET NLS_SORT=BINARY;

select regexp_substr('JohnFoo','[a-z]{2}') from dual;

RE
--
oh

ALTER SESSION SET NLS_COMP=LINGUISTIC;
ALTER SESSION SET NLS_SORT=BINARY_CI;

select regexp_substr('JohnFoo','[a-z]{2}') from dual;

RE
--
Jo

要获取您的实际会话值,请使用查询

select * from NLS_SESSION_PARAMETERS 
where parameter in ('NLS_COMP','NLS_SORT');