问题描述
我有一个过程PUSH_DATA,它采用以下格式的输入数据:
["value 1","value 2","value 3","value n"]
(所有详细信息都位于db fiddle链接的末尾)
然后将逗号分隔的值拆分为目标表的数据库列。
现在,问题是最终用户传递了输入字符串,他有时会在之间引入倍数双引号,而主要的拆分条件是基于双引号。
这里显示的是过程,最后传递了一个字符串示例来演示该问题。
因此,当过程按以下方式传递时:
BEGIN
PUSH_DATA(110,'["Project title afor BYU heads","The values are,\n "exactly" up to the requirement and analysis done by the team.
Also it is difficult to,\n prepare a scenario notwithstanding the fact it is difficult. This user story is going to be slightly complex however it is up to the team","Active","Disabled","25 tonnes of fuel","www.examplesites.com/html.asp&net;","Apprehension","","25","Stable"]');
END;
/
结果符合预期:
当字符串使用额外的引号传递时,如下所示:
BEGIN
PUSH_DATA(110,'[""Project title afor BYU heads"","Stable"]');
END;
/
由于引号引起的结果是意外的:
要求是忽略引号内的任何特殊字符,忽略该字符应显示而不对其求值,例如多余的双引号或/或\将被忽略并按原样传递字符串。 / strong>
因此,如果像"Hi There""s,No"
这样传递值
输出应为Hi there""s,No
。
因此,我需要对解决方案进行修改,以使
- 使用现有的正则表达式条件并添加条件以在双引号内包含双引号
- 或者,不要将参数作为varchar传递,而应使用数组或其他适合方案的解决方案。
细化所有细节:
解决方法
(select data_string from dual),rcte (id,data,lvl,result)
AS (
SELECT p_id,1,regexp_substr(data,'(".*?")(,|\])','n',1) result
FROM (select data_string data from input)
UNION ALL
SELECT id,lvl + 1,1)
FROM rcte
WHERE lvl <= regexp_count(data,'n')
)
-
从第一次选择查询中删除了
regex_replace
,而不是直接使用数据。 -
regexp_substr(data,1)
null
被'n'
替换,以便在正则表达式中使用点时匹配换行符。此正则表达式会进行惰性匹配,直到找到,or ]
字符为止。]
用于最后一个字符串。 -
regexp_count(data,'n')
更改了正则表达式,并用null
替换了'n'
以换行符匹配。
https://dbfiddle.uk/?rdbms=oracle_18&fiddle=5826bffbab9937d497245487faa04c60