我正在研究sql server 2008 DB和asp.net mvc web电子商务应用程序.
我有不同的用户将他们的产品提供给数据库,我想比较具有相似名称的产品的价格.
我知道字符串匹配是特定于域的,但我仍然需要最好的通用解决方案.
对搜索结果进行分组的最有效方法是什么?
我应该使用Levenshtien distance算法递归地比较每个记录吗?
我应该在数据库中还是在代码中执行此操作?
有没有办法为此任务实时实施SSIS模糊分组?
有没有一种有效的方法来使用sql server 2008自由文本搜索?
编辑1:
那么网络图分析呢.如果我使用Levenshtien distance算法定义矩阵,我可以使用聚类算法(例如:clauset newman moore)和单独的组,它们之间没有语音路径.
我附上了尼克约翰逊(见评论)猫狗(例如红线是簇) – 并且通过使用clauset newman moore,我正在创建2个不同的簇并从狗中分离猫.
你怎么看?