转换日期时如何处理异常

问题描述

我有一个 Sales 表和一个 Period 表。

销售表

+--------------+-------------+
| Country_Code | Period_Code |
+--------------+-------------+
| CH           | MAI_18      |
| CH           | JUN_18      |
| NO           | 2020-01-21  |
| NO           | 2020-01-21  |
+--------------+-------------+

周期表

+--------------+-------------+
| Country_Code | Period_Code |
+--------------+-------------+
| NO           | 200121      |
| NO           | 200122      |
+--------------+-------------+

加入这两个表时出现以下错误

enter image description here

下面是我使用的sql。根据我的理解,由于我在第 2 行中将国家/地区过滤器指定为 NO,因此它应该首先执行第 2 行,然后仅在 NO 国家/地区进行连接。但在内部,它也在考虑 CH 国家/地区,这也导致以下 sql 失败。

SELECT disTINCT SAL.COUNTRY_CODE,PER.PERIOD_CODE
FROM (SELECT * FROM MYSCHEMA.SALES WHERE COUNTRY_CODE in('NO')) SAL
JOIN MYSCHEMA.PERIOD PER 
    ON SAL.COUNTRY_CODE=PER.COUNTRY_CODE    
    AND TO_CHAR(TO_DATE(SAL.PERIOD_CODE,'YYYY-MM-DD'),'YYMMDD') = PER.PERIOD_CODE
ORDER BY 1

我也使用了 CTE,它的行为方式相同。可能有一些解决方案。如果有人可以帮助我让 sql 运行而没有任何错误,我将不胜感激。

解决方法

Snowflake 比 SQL 规范规定的更早地进行显式转换,因此文本/变体数据的转换会在您预期之前发生。我在 2016 年就向他们提出过这个问题,虽然他们有时会修复/改变一些行为,但它也可能会改变并因此开始崩溃。

如果列的内容并非全部有效,这就是您的情况,您应该使用 TRY_ 版本的命令,因此这里使用 TRY_TO_DATE 来避免错误。

因此您应该会发现此方法有效:

SELECT DISTINCT SAL.COUNTRY_CODE,PER.PERIOD_CODE
FROM (SELECT * FROM MYSCHEMA.SALES WHERE COUNTRY_CODE in('NO')) SAL
JOIN MYSCHEMA.PERIOD PER 
    ON SAL.COUNTRY_CODE=PER.COUNTRY_CODE    
    AND TO_CHAR(TRY_TO_DATE(SAL.PERIOD_CODE,'YYYY-MM-DD'),'YYMMDD') = PER.PERIOD_CODE
ORDER BY 1

我倾向于将日期转换移动到子选择(或 CTE,如果您使用其中之一)以使连接更简单,尽管 Snowflake 为您执行此操作,因此我会这样写:>

SELECT DISTINCT sal.country_code,per.period_code
FROM (
    SELECT country_code,TO_CHAR(TRY_TO_DATE(SAL.PERIOD_CODE,'YYMMDD') AS join_code
    FROM myschema.sales 
    WHERE country_code in ('NO')
) sal
JOIN myschema.period per 
    ON sal.country_code = per.country_code    
    AND sal.join_code = per.period_code
ORDER BY 1

但鉴于您的示例表,我认为它没有包含所有列,只是重现问题所需的,应该可以通过以下方式触发:

SELECT country_code,'YYMMDD') AS join_code
FROM myschema.sales 
WHERE country_code in ('NO')