T-SQL存储过程可返回谷歌风格的``建议''搜索结果

问题描述

我建议全文搜索(MS’或Lucene可以使用)下面的代码使用MSsql FTS作为其目前在我的应用程序中使用的代码

如果尚未安装FTS Search,请先安装。如果已检查该服务正在运行。在管理工作室中,运行它来设置目录并添加产品表;和颜色/名称/产品编号到目录。

USE [AdventureWorks]
GO
CREATE FULLTEXT CATALOG [ProductsTest]WITH ACCENT_SENSITIVITY = OFF
AUTHORIZATION [dbo]

GO

USE [AdventureWorks]
GO
CREATE FULLTEXT INDEX ON [Production].[Product] KEY INDEX [PK_Product_ProductID] ON ([ProductsTest]) WITH (CHANGE_TRACKING AUTO)
GO
USE [AdventureWorks]
GO
ALTER FULLTEXT INDEX ON [Production].[Product] ADD ([Color])
GO
USE [AdventureWorks]
GO
ALTER FULLTEXT INDEX ON [Production].[Product] ADD ([Name])
GO
USE [AdventureWorks]
GO
ALTER FULLTEXT INDEX ON [Production].[Product] ADD ([ProductNumber])
GO
USE [AdventureWorks]
GO
ALTER FULLTEXT INDEX ON [Production].[Product] ENABLE
GO

然后,您可以一次对所有列运行查询;例如银(颜色和名称均由其选择)

Select * from production.product where
contains(*, '"Silver*"')

查询中的会找到Silver ,因此您可以在用户输入内容时使用它来建立结果。要考虑的一件事是Google实时进行这项工作- 如果您要搜索大量数据,则可以在不中断用户输入的情况下取回数据。我认为一般来说,人们通过从他们要查找的第一个字母开始键入来使用这些搜索-我接受会有拼写错误- 您可以在他们按下可能要处理的每个空格后实施一个拼写检查器。或存储运行的搜索并查看拼写错误,然后更改代码以根据映射(或在使用自定义同义词库的FTS中)进行处理。

排名对于任何企业来说都是一个有趣的发展问题;您是在寻找Mountain Frame的第一个结果- 还是要按销售量或价格对它们进行加权?如果用户键入多个文本词,则可以使用FTS根据搜索字符串生成排名。

select aa.rank, bb.* 
From containstable(production.product, *, '"Mountain" and "Silver*"') aa
inner join production.product bb
on aa.[key] = bb.productid
order by rank desc

返回30行;根据用户输入的文本权重确定第一名记录。无论哪种情况,您都可能希望添加编码排名以调整结果以适合您的业务需求- 定价最高的小部件1可能不是这样。这就是为什么您要存储人们搜索/点击的内容,以便以后可以分析结果的原因。

.Net有一个非常不错的语言解析器,可以将输入的Google样式字符串查询转换为FTS’able语言,从而使使用您网站的布尔搜索更加熟悉。

您可能还想通过对用户输入的内容进行审核并最终去访问并使用成功图来更改最终建议,以使其真正与用户相关,从而增加一些人群功能

作为一个最终的建议,如果这是一个商业网站,您可能想看看Easyask,它是一个令人恐惧的出色自然语言处理程序

解决方法

好的,使用SQL Server2008。在我的网页上,我有一个带有jQuery-UI AutoComplete的文本框。

现在,我需要一个存储过程来搜索单个表(或多个连接的表)的所有列,以查找来自textbox / autocomplete
AJAX调用的搜索字符串,并返回“建议”搜索字符串。我正在使用AdventureWorks db进行测试(产品表)

因此,例如,产品表中包含产品名称和产品编号(其中包括其他列)的列,我想根据用户输入返回建议的搜索字符串,他们可以在其中输入产品名称和/或产品编号。

我在一个单一的列上工作,这很简单。有任何想法吗?