具有较少属性的 SQL 查询成本较低吗?

问题描述

我的问题很简单 - 属性越少的 sql 查询成本越低吗?

示例: 假设我们的 users 表有 10 列,例如 userIdnamephoneemail、...

SELECT name,phone FROM users WHERE userId='id'

比这个便宜

SELECT * FROM users WHERE userId='id'

从资源利用的角度来看是真的吗?

解决方法

这取决于。

限制投影中的列数当然有可能提高性能,但这取决于可用的索引。如果我们假设 userId 是主键或至少是一个索引列,您希望数据库的优化器通过使用具有 userId 的索引进行查找来确定要获取哪些行作为前导列。

如果 (user_id,phone) 上有索引,或者如果 phone 是索引中包含的列(如果您的数据库支持该概念),则数据库可以从它使用的索引中获取 phone找到要返回的行。通过这种方式,数据库永远不必访问实际表来获取 phone。包含数据库处理查询所需的所有信息而无需访问表的索引称为“覆盖索引”。粗略地说,搜索要返回的行的索引可能与访问表以获取投影的其他列的成本大致相同。如果您可以限制投影中的列数以使用覆盖索引,则可能会显着降低查询成本。更重要的是,如果访问表以获取每一列涉及执行多次读取,因为 Oracle 中的链接行或行外 LOB 列、PostgreSQL 中支持 TOAST 的数据类型等。

减少投影中的列数还将减少需要通过网络发送的数据量以及客户端处理该数据所需的内存量。当您有更大的字段时,这往往是最重要的。例如,如果 users 表中的一列恰好是用户记录的 LDAP 路径,那么长度很容易达到数百个字符,占网络带宽消耗的一半和内存使用的一半中间层。如果您正在构建一个需要为几百个用户提供服务的流量相对较低的内部业务线应用程序,那么这些事情可能并不重要。如果您正在构建需要为数百万用户提供服务的大容量 SaaS 应用程序,这可能非常关键。

,

从大局来看,两者都可以忽略不计。 如果数据按行存储,则没有太大区别,因为检索一行数据的成本并不高。也许如果其中一列特别大,那么避免检索它会有所帮助。

但是如果数据是按列存储的,那么第一个会更便宜,因为每个条目都存储在不同的位置。