问题描述
我有一个字符串,其格式为“数字-名称”,我正在使用REGEXP_SUBSTR将其分为两列,一列用于名称,一列用于数字。
SELECT
REGEXP_SUBSTR('123 - ABC','[^-]+',1,1) AS NUM,REGEXP_SUBSTR('123 - ABC',2) AS NAME
from dual;
但是,如果名称中包含连字符(例如,ABC-Corp),则该名称将不起作用,那么该名称仅显示为“ ABC”而不是“ ABC-Corp”。我如何获得正则表达式exp来忽略第一个连字符之前的所有内容,并在其之后包含所有内容?
解决方法
您想在' - '
第一次出现时拆分字符串。这是一个很简单的任务,可以通过字符串函数而不是正则表达式有效地执行:
select
substr(mycol,1,instr(mycol,' - ') - 1) num,substr(mycol,' - ') + 3) name
from mytable
with mytable as (
select '123 - ABC' mycol from dual
union all select '123 - ABC - Corp' from dual
)
select
mycol,' - ') + 3) name
from mytable
MYCOL | NUM | NAME :--------------- | :-- | :--------- 123 - ABC | 123 | ABC 123 - ABC - Corp | 123 | ABC - Corp,
NB : @GMB解决方案在您的简单案例中要好得多。为此使用正则表达式实在是太过分了。
tldr;
通常,在使用这种固定掩码的情况下,使用subexpr
参数而不是occurrence
更容易理解。因此,您可以指定完整的掩码:\d+\s*-\s*\S+
即数字,然后是0个或多个空格字符,然后是-,再是0个或多个空格字符和1个以上非空格字符。
然后,我们添加()以指定子表达式:由于我们只需要数字和结尾的非空白字符,因此将它们放入():
'(\d+)\s*-\s*(\S+)'
然后我们仅指定我们需要的子表达式1或2:
SELECT
REGEXP_SUBSTR(column_value,'(\d+)\s*-\s*(\S+)',null,1) AS NUM,REGEXP_SUBSTR(column_value,2) AS NAME
from table(sys.odcivarchar2list('123 - ABC','123 - ABC-Corp'));
结果:
NUM NAME
---------- ----------
123 ABC
123 ABC-Corp
https://docs.oracle.com/database/121/SQLRF/functions164.htm#SQLRF06303
https://docs.oracle.com/database/121/SQLRF/ap_posix003.htm#SQLRF55544