PostgreSQL文本搜索性能

问题描述

我一直在研究具有以下格式的varchar字段(大约10到400个字符)的文本搜索(没有tsvector):

field,field_a,field_b,field_c,...,field_n

我计划运行的查询可能类似于:

select * from information_table where fields like '%field_x%'

由于字段中没有空格,我想知道如果我对500k +行进行搜索是否存在一些性能问题。 有什么见解吗? 关于varchar性能以及varchar索引的任何文档吗?

我不确定tsvector是否可以在没有空格的完整字符串上运行。您如何看待该解决方案?您是否看到其他有助于提高性能解决方案?

谢谢,我希望收到您的来信。 R

解决方法

通常,文本搜索解析器将逗号和空格视为相同,因此,如果要使用FTS,带有逗号的结构不会造成问题。 pg_trgm也将逗号和空格视为相同,因此,如果您想使用该方法,由于逗号也不会出现问题。

性能将取决于查询中的令牌在文本正文中的流行或稀有程度。很难基于一个示例行和一个示例查询来概括一下,这两者看起来都不是很现实。解决这个问题的最佳方法是在EXPLAIN (ANALYZE,BUFFERS)且启用track_io_timing的情况下,使用真实(或至少真实)数据运行一些真实查询。

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...