Spark SQL 中的 RLIKE 如何处理 % char

问题描述

我有一个包含原始查询字符串列的表。我想找到匹配特定模式的所有查询字符串。某些模式以 % 字符开头。
我想知道 spark sql 中的 RLIKE 是否表现得像 sql 中的 LIKE 命令或计算 % 字符并只是尝试将它与列值中的那个字符相匹配?
如果认情况下它的行为类似于常规 sql LIKE 命令(关于 % 字符) - 有没有我可以更改的配置来改变这种行为?

解决方法

不,RLIKE 将模式解释为正则表达式,而不是经典的 SQL LIKE 方式。它会将 % 视为普通字符。

请注意,Spark SQL 中还有一个 LIKE 函数,其行为与经典 SQL LIKE 几乎相同。

例如

RLIKE

spark-sql> select 'ab%c' rlike 'a%';
false

spark-sql> select 'ab%c' rlike 'b%';
true

LIKE

spark-sql> select 'ab%c' like 'a%';
true