问题描述
|
SELECT DISTINCT field1,field2,field3,...... FROM table
我正在尝试完成以下sql语句,但我希望它返回所有列,这可能吗?就像是:
SELECT DISTINCT field1,* from table
解决方法
您正在寻找一个分组依据:
select *
from table
group by field1
有时可以用不同的on语句编写:
select distinct on field1 *
from table
但是,在大多数平台上,上述两种方法都不起作用,因为未指定其他列上的行为。 (如果您使用的是第一个,则第一个在MySQL中有效。)
您可以获取不同的字段,并坚持每次选择一个任意行。
在某些平台(例如PostgreSQL,Oracle,T-SQL)上,可以使用窗口函数直接完成此操作:
select *
from (
select *,row_number() over (partition by field1 order by field2) as row_number
from table
) as rows
where row_number = 1
在其他版本(MySQL,SQLite)上,您需要编写子查询,这些查询将使您将整个表与自身连接(示例),因此不建议这样做。
,从问题的表述中,我了解到您想为给定字段选择不同的值,并为每个此类值选择同一行中列出的所有其他列值。大多数DBMS都不允许使用DISTINCT
和GROUP BY
,因为结果是不确定的。
这样想:如果您的field1
出现多次,则将列出field2
的值(假设您在两行中具有相同的field1
值,但在这两行中有两个不同的field2
值)。
但是,您可以使用集合函数(对于要显示的每个字段明确表示),并使用GROUP BY
而不是DISTINCT
:
SELECT field1,MAX(field2),COUNT(field3),SUM(field4),.... FROM table GROUP BY field1
,如果我正确理解了您的问题,则与我刚遇到的问题类似。您希望能够将DISTINCT的可用性限制为指定的字段,而不是将其应用于所有数据。
如果您使用不带汇总功能的GROUP BY,则GROUP BY的哪个字段将是您的DISTINCT字段。
如果您进行查询:
SELECT * from table GROUP BY field1;
它将基于单个field1实例显示所有结果。
例如,如果您有一个包含名称,地址和城市的表。一个人记录了多个地址,但是您只需要一个人的地址,就可以查询如下:
SELECT * FROM persons GROUP BY name;
结果是该名称只有一个实例与地址一起出现,而另一个实例将从结果表中省略。注意:如果您的文件具有原子值,例如firstName,lastName,则希望将两者按组进行分组。
SELECT * FROM persons GROUP BY lastName,firstName;
因为如果两个人的姓氏相同,而您仅按lastName分组,则结果中将省略其中一个人。您需要考虑这些因素。希望这可以帮助。
,SELECT c2.field1,field2
FROM (SELECT DISTINCT
field1
FROM dbo.TABLE AS C
) AS c1
JOIN dbo.TABLE AS c2 ON c1.field1 = c2.field1
,这是一个非常好的问题。我已经在这里阅读了一些有用的答案,但是也许我可以添加更精确的解释。
只要不查询其他信息,使用GROUP BY语句减少查询结果的数量就很容易。假设您获得了下表“位置”。
--country-- --city--
France Lyon
Poland Krakow
France Paris
France Marseille
Italy Milano
现在查询
SELECT country FROM locations
GROUP BY country
将导致:
--country--
France
Poland
Italy
但是,以下查询
SELECT country,city FROM locations
GROUP BY country
...在MS SQL中引发错误,因为您的计算机如何知道您想在以下哪个法国城市“里昂”,“巴黎”或“马赛”中阅读哪个\“法国\”?
为了更正第二个查询,您必须添加此信息。一种实现方法是使用函数MAX()或MIN(),在所有候选项中选择最大值或最小值。 MAX()和MIN()不仅适用于数字值,而且还比较字符串值的字母顺序。
SELECT country,MAX(city) FROM locations
GROUP BY country
将导致:
--country-- --city--
France Paris
Poland Krakow
Italy Milano
要么:
SELECT country,MIN(city) FROM locations
GROUP BY country
将导致:
--country-- --city--
France Lyon
Poland Krakow
Italy Milano
只要您可以从字母(或数字)顺序的两端选择值,这些函数就是一个很好的解决方案。但是,如果不是这种情况怎么办?让我们假设您需要一个具有特定特征的值,例如以字母“ M”开头。现在事情变得复杂了。
到目前为止,我唯一能找到的解决方案是将整个查询放入一个子查询,并手动构造它之外的其他列:
SELECT
countrylist.*,(SELECT TOP 1 city
FROM locations
WHERE
country = countrylist.country
AND city like \'M%\'
)
FROM
(SELECT country FROM locations
GROUP BY country) countrylist
将导致:
--country-- --city--
France Marseille
Poland NULL
Italy Milano
,尝试
SELECT table.* FROM table
WHERE otherField = \'otherValue\'
GROUP BY table.fieldWantedToBeDistinct
limit x
,很好的问题@aryaxt-您可以说这是一个很好的问题,因为您是5年前问过的,而今天我偶然发现了它,试图找到答案!
我只是尝试编辑接受的答案以包括此答案,但是如果我的编辑没有在以下答案中出现:
如果您的表不是那么大,并且假设您的主键是一个自动递增的整数,则可以执行以下操作:
SELECT
table.*
FROM table
--be able to take out dupes later
LEFT JOIN (
SELECT field,MAX(id) as id
FROM table
GROUP BY field
) as noDupes on noDupes.id = table.id
WHERE
//this will result in only the last instance being seen
noDupes.id is not NULL
,您可以使用WITH
子句来实现。
例如:
WITH c AS (SELECT DISTINCT a,b,c FROM tableName)
SELECT * FROM tableName r,c WHERE c.rowid=r.rowid AND c.a=r.a AND c.b=r.b AND c.c=r.c
这也允许您仅选择在“ 30”子句查询中选择的行。
,对于SQL Server,您可以使用density_rank和其他窗口功能来获取所有行和列,这些列在指定列上具有重复的值。这是一个例子
with t as (
select col1 = \'a\',col2 = \'b\',col3 = \'c\',other = \'r1\' union all
select col1 = \'c\',col3 = \'a\',other = \'r2\' union all
select col1 = \'a\',other = \'r3\' union all
select col1 = \'a\',other = \'r4\' union all
select col1 = \'c\',other = \'r5\' union all
select col1 = \'a\',col2 = \'a\',other = \'r6\'
),tdr as (
select
*,total_dr_rows = count(*) over(partition by dr)
from (
select
*,dr = dense_rank() over(order by col1,col2,col3),dr_rn = row_number() over(partition by col1,col3 order by other)
from
t
) x
)
select * from tdr where total_dr_rows > 1
这将对col1,col2和col3的每个不同组合进行行计数。
,SELECT *
FROM tblname
GROUP BY duplicate_values
ORDER BY ex.VISITED_ON DESC
LIMIT 0,30
在ORDER BY
我刚刚在这里放了示例,您也可以在此添加ID字段
,select min(table.id),table.column1
from table
group by table.column1
,将GROUP BY添加到要检查重复项的字段
您的查询可能看起来像
SELECT field1,field2,field3,...... FROM table GROUP BY field1
将检查field1以排除重复的记录
或者你可以像这样查询
SELECT * FROM table GROUP BY field1
SELECT中排除了field1的重复记录
,只需在GROUP BY子句中包括所有字段即可。
,可以通过内部查询来完成
$query = \"SELECT *
FROM (SELECT field
FROM table
ORDER BY id DESC) as rows
GROUP BY field\";
,SELECT * from table where field in (SELECT distinct field from table)
,如果表中所有三列的值都是唯一的,则SELECT DISTINCT FIELD1,FIELD2,FIELD3 FROM TABLE1起作用。
例如,如果您的名字具有多个相同的值,但是所选列中的姓氏和其他信息不同,那么记录将包含在结果集中。
,我建议使用
SELECT * from table where field1 in
(
select distinct field1 from table
)
这样,如果您在多行中的field1中具有相同的值,则将返回所有记录。