PostgreSQL之SELECT...GROUP BY...HAVING

1.SELECT...GROUP BY的使用

Postgresql9.3官方文档:http://www.postgres.cn/docs/9.3/sql-select.html#SQL-GROUPBY

SELECT查询在通过了WHERE过滤器之后,生成输出表可以继续用GROUP BY 子句进行分组,然后用HAVING子句删除一些分组行。

SELECTselect_list
FROM...
[WHERE...]
GROUPBYgrouping_column_reference[,grouping_column_reference]...
HAVINGcondition

GROUP BY 子句 用于把那些在表中所列出的列上共享相同值的行聚集在一起。 这些列的列出顺序并没有什么关系。 效果是把每组共享相同值的行缩减为一个组行,它代表该组里的所有行。 这样就可以删除输出里的重复和/或计算应用于这些组的聚集。 比如:

highgo=#createtabletests1(idintprimarykey,namevarchar,numint);
highgo=#insertintotests1values(1,'yy',3),(2,'ws',2),(3,6);
highgo=#select*fromtests1;
id|name|num
----+------+-----
1|yy|3
2|ws|2
3|yy|6
(3行记录)
highgo=#selectnamefromtests1groupbyname;
name
------
ws
yy
(2行记录)

通常,如果一个表被分了组,那么没有在分组中引用的字段都不能引用,除了在聚集表达式中以外。 一个带聚集表达式的例子是:

highgo=#selectname,sum(num)fromtests1groupbyname;
name|sum
------+-----
ws|2
yy|9
(2行记录)

这里的 sum 是一个聚集函数,它在整个组上计算一个数值。 有关可用的聚集函数的更多信息可以在 Section 9.15 中找到。
注意: 没有聚集表达式的分组实际上计算了一个字段中独立数值的集合。 我们也可以用 disTINCT 子句实现。


2.常用的聚合函数

Postgresql9.3中文文档:http://www.postgres.cn/docs/9.3/functions-aggregate.html

函数 参数类型 返回类型 描述
avg(expression) smallint,int,bigint,real,double precision,numeric,or interval 对于任何整数类型输入,结果都是numeric类型。 对于任何浮点输入,结果都是double precision类型。 否则和输入数据类型相同。 所有输入值的均值(算术平均)
bit_and(expression) smallint,or bit 和参数数据类型相同 所有非 NULL 输入值的按位与(AND),如果全部输入值皆为 NULL ,那么结果也为 NULL 。
bit_or(expression) smallint,or bit 和参数数据类型相同 所有非 NULL 输入值的按位或(OR),如果全部输入值皆为 NULL ,那么结果也为 NULL 。
bool_and(expression) bool bool 如果所有输入值都是真,则为真,否则为假。
bool_or(expression) bool bool 如果至少有一个输入值为真,则为真,否则为假。
count(*) bigint 输入行数
count(expression) 任意 bigint 计算所有输入行中满足expression不为 NULL 的行数。
every(expression) bool bool 等效于bool_and
json_agg(record) record json 聚合记录作为JSON对象数组
max(expression) 任意数组、数值、字符串、日期/时间类型 和参数数据类型相同 有输入行中expression的最大值
min(expression) 任意数组、数值、字符串、日期/时间类型 和参数数据类型相同 所有输入行中expression的最小值
string_agg(expression,delimiter) (text,text) or (bytea,bytea) 和参数数据类型相同 输入值连接成为一个字符串,用分隔符分开
sum(expression) smallint,or interval 对于smallint或int输入,输出类型为bigint。 对于bigint输入,输出类型为numeric,对于浮点数输入, 输出类型为double precision。否则和输入数据类型相同。 所有输入行的expression总和。


3.HAVING子句的使用

如果一个表已经用GROUP BY子句分了组,然后你又只对其中的某些组感兴趣, 那么就可以用HAVING子句,它很象WHERE子句,用于删除一个分了组的表中的一些组。 语法是:

SELECTselect_listFROM...[WHERE...]GROUPBY...HAVINGboolean_expression

在 HAVING 子句中的表达式可以引用分组的表达式和未分组的表达式(后者必须涉及一个聚集函数)。

highgo=#selectname,sum(num)fromtests1groupbynamehavingsum(num)>5;
name|sum
------+-----
yy|9
(1行记录)


4.HAVING子句与WHERE子句的区别

HAVING去除了一些不满足条件的组行。它与WHERE 不同:WHERE在使用GROUP BY之前过滤出单独的行, 而HAVING过滤由GROUP BY创建的行。 在condition 里引用的每个字段都必须无歧义地引用一个分组的行,除非引用出现在一个聚合函数里。

HAVING的出现把查询变成一个分组的查询,即使没有GROUP BY 子句也这样。这一点和那些包含聚合函数但没有GROUP BY子句的查询里发生的事情是一样的。 所有选取的行都被认为会形成一个单一的组,而SELECT 列表和HAVING子句只能从聚合函数里面引用表的字段。 这样的查询在HAVING条件为真的时候将发出一个行,如果为非真,则返回零行。


参考博客http://lvmy.iteye.com/blog/793428

相关文章

项目需要,有个数据需要导入,拿到手一开始以为是mysql,结果...
本文小编为大家详细介绍“怎么查看PostgreSQL数据库中所有表...
错误现象问题原因这是在远程连接时pg_hba.conf文件没有配置正...
因本地资源有限,在公共测试环境搭建了PGsql环境,从数据库本...
wamp 环境 这个提示就是说你的版本低于10了。 先打印ph...
psycopg2.OperationalError: SSL SYSCALL error: EOF detect...