一个表中的逗号分隔值可从另一表返回结果

问题描述

我有两个表和一个相当复杂的SQL查询,用于从这些表中提取数据-一切正常,直到遇到一个ID以上的列中的一个值为止-用逗号分隔。因此,为了简化我正在努力的领域,让我们假设以下内容

表1(T1)

ID         First Name     Last Name   Active  
--------------------------------------------
101        Fred           Bloggs      1  
102        John           Smith       0  
103        Elizabeth      Dawson      1  
104        Amy            Johnson     1

表2(T2)

ID         Postcode       HouseNo  
-----------------------------------
101        TS15 9AZ         42   
102        TQ1 4TF           3  
103,104   WA1 4AA           7  

因此,假设我想返回居住在哪个地址的住户的结果,我将表加入ID并编写一个非常简单的查询,例如

select 
    T1.FirstName + ' ' + T1.Lastname as fullname,T2.Postcode,T2.HouseNo
from 
    T1
join 
    t2 on t1.id = t2.id
where 
    t1.active = 1

查询在返回错误时遇到逗号分隔的值之前效果很好:

将varchar值'103,104'转换为数据类型int时转换失败

它应该返回的是

Fullname                         PostCode      HouseNo
-------------------------------------------------------
Fred Blogs                       TS15 9AZ        42
Elizabeth Dawson Amy Johnson     TQ1 4TF          3

关于如何进行这项工作的任何想法?

解决方法

首先,不要将多个值存储在单个列中;不要使用字符串来存储数字。您可以查看this famous SO post,以了解为什么不鼓励这样做的更多细节。

也就是说,一种用于搜索CSV列表中的值的简单(尽管效率低下)的解决方案是:

select t1.FirstName + ' ' + t1.Lastname as fullname,t2.Postcode,t2.HouseNo
from t1
join t2 on concat(',',t2.id,') like concat('%,t1.id,%')
where t1.active = 1

这假定您始终使用逗号+空格(',')作为列表元素之间的分隔符。

,

查询失败,因为表返回的数据在返回类型中似乎不一致,因为它同时具有整数值(103、104)和非整数值,如您在所需输出中提到的那些。 / p>

这里的解决方案是将它们全部转换为单一类型。我认为字符串结果类型可能是此处的最佳选择:

select
    T1.FirstName + ' ' + T1.Lastname as fullname,CONVERT(NVARCHAR(10),T2.Postcode),-- you can change the value 10 to anything else
    CONVERT(NVARCHAR(10),T2.HouseNo)
from 
    T1
join 
    t2 on t1.id = t2.id
where 
    t1.active = 1

希望这会有所帮助))


更新

@marc_s在这里是绝对正确的,请尝试避免在表列中使用逗号分隔的值。它们违反了SQL规范化规则(官方文档here)。

,

有时可能是我们继承的数据,您只需要一个报告修复程序即可。我不久前在互联网上发现了这个splitstring函数(对写它的人表示敬意),它将拆分逗号分隔的ID值(如果使用的数据库版本早于SQL Server 2016,而STRING_SPLIT不可用),您也许可以放到另一个桌子上并使用它?不过,我同意其他意见,将100%保留在字段中是一个好方法。

CREATE or alter FUNCTION [dbo].[SplitString]  
(  
   @Input NVARCHAR(MAX),@Character CHAR(1)  
)  
RETURNS @Output TABLE (  
   Item NVARCHAR(1000)  
)  
AS  
BEGIN  
    DECLARE @StartIndex INT,@EndIndex INT  
    SET @StartIndex = 1  

    IF SUBSTRING(@Input,LEN(@Input) - 1,LEN(@Input)) <> @Character  
    BEGIN  
        SET @Input = @Input + @Character  
    END  

    WHILE CHARINDEX(@Character,@Input) > 0  
    BEGIN  
        SET @EndIndex = CHARINDEX(@Character,@Input)  

        INSERT INTO @Output(Item)  
            SELECT SUBSTRING(@Input,@StartIndex,@EndIndex - 1)  
            SET @Input = SUBSTRING(@Input,@EndIndex + 1,LEN(@Input))  
    END  
RETURN  
END 

GO

--=======================================================
DROP TABLE IF EXISTS newTable;

SELECT * INTO newTable 
FROM
(
    SELECT '123,456' as id,'TS15 9AZ' AS postcode UNION
    SELECT '456,789' as id,'TQ1 4TF' AS postcode
) AS IDS
CROSS APPLY
DBO.[SPLITSTRING](ID,') AS SPLIT;

SELECT * FROM newTable;
--=======================================================
,

如上多次建议,最好将值分别存储在ID列中。也就是说,在SQL Server中,您可以这样操作:

select 
    T1.FirstName + ' ' + T1.Lastname as fullname,T2.Postcode,T2.HouseNo
from 
    T1
join 
(
    select t2.*,value as id_new
    from t2
    CROSS APPLY STRING_SPLIT(id,')
) t2 on t1.id = t2.id_new
where 
    t1.active = 1
,

您可以在下面尝试查询

SELECT T1.FirstName + ' ' + T1.LastName AS FullName,T2.PostCode,T2.HouseNo
FROM T1
JOIN (
    SELECT LTRIM(RTRIM(ID)),PostCode,HouseNo
    FROM T2
    CROSS APPLY STRING_SPLIT(ID,')
) T2 ON T2.ID = T1.ID
WHERE T1.active = 1