问题描述
我有一个包含原始查询字符串列的表。我想找到匹配特定模式的所有查询字符串。某些模式以 %
字符开头。
我想知道 spark sql 中的 RLIKE
是否表现得像 sql 中的 LIKE
命令或计算 %
字符并只是尝试将它与列值中的那个字符相匹配?
如果默认情况下它的行为类似于常规 sql LIKE
命令(关于 %
字符) - 有没有我可以更改的配置来改变这种行为?
解决方法
不,RLIKE
将模式解释为正则表达式,而不是经典的 SQL LIKE
方式。它会将 % 视为普通字符。
请注意,Spark SQL 中还有一个 LIKE
函数,其行为与经典 SQL LIKE
几乎相同。
例如
RLIKE
:
spark-sql> select 'ab%c' rlike 'a%';
false
spark-sql> select 'ab%c' rlike 'b%';
true
LIKE
:
spark-sql> select 'ab%c' like 'a%';
true