问题描述
我需要编写一个 sql Server 查询来允许用户搜索具有多个关键字的表。该表可能如下所示:
表 t
| ID | Product
+-----+-------------------------------------------
| 1 | Apple iphone 4 8GB AT&T
| 2 | Apple iPhone 5 16GB Verizon
| 3 | Apple iPhone 5S 32GB Unlocked
| 4 | Samsung galaxy 7 32GB Unlocked Smartphone
| 5 | Motorola Moto G6 32GB Unlocked Smartphone
| 6 | BlackBerry Z10 16GB Verizon Smartphone
当用户输入关键字“unlocked phone 32”时,它应该返回:
| ID | Product
+-----+-------------------------------------------
| 3 | Apple iPhone 5S 32GB Unlocked
| 4 | Samsung galaxy 7 32GB Unlocked Smartphone
| 5 | Motorola Moto G6 32GB Unlocked Smartphone
我可以写:
SELECT *
FROM t
WHERE Product LIKE '%@keyword1%'
AND '%@keyword2%'
AND '%@keyword3%'
其中每个关键字都可以是用户输入字符串中的一个词,但是我不知道用户可以输入多少个关键字,并且关键字可以是任意顺序,因此上述查询并不适用于所有情况。我正在考虑使用全文搜索,但全文搜索不允许前导通配符,搜索“电话”不会返回任何记录。
我能做什么?
解决方法
我采用的方法是拆分 search_string 并使用 like 运算符在连接条件上比较每个字符串。
最后,我用主字符串中的分隔符计数检查拆分字符串的匹配计数。如果它们匹配-> 那么它是最终输出的一部分。
请注意,您也可以控制此设置并分配百分比匹配。例如:3 个关键字中有 2 个匹配 -> a.cnt_of_matches/a.cnt_of_splits
例如:
create table dbo.test(id int,product nvarchar(100))
insert into dbo.test values(1,'Apple iphone 4 8GB AT&T')
insert into dbo.test values(2,'Apple iPhone 5 16GB Verizon')
insert into dbo.test values(3,'Apple iPhone 5S 32GB Unlocked')
insert into dbo.test values(4,'Samsung Galaxy 7 32GB Unlocked Smartphone')
insert into dbo.test values(5,'Motorola Moto G6 32GB Unlocked Smartphone')
insert into dbo.test values(6,'Blackberry Z10 16GB Verizon Smartphone')
with data
as (select value as col1,count(*) over() as cnt_of_splits
from string_split('unlocked phone 32',' ')
),matched_products
as (select *,count(*) over(partition by id) as cnt_of_matches
from data d
join dbo.test t
on t.product like concat('%',d.col1,'%')
)
select distinct product
from matched_products a
where a.cnt_of_matches=a.cnt_of_splits
Apple iPhone 5S 32GB Unlocked
Motorola Moto G6 32GB Unlocked Smartphone
Samsung Galaxy 7 32GB Unlocked Smartphone