问题描述
销售表
+--------------+-------------+
| Country_Code | Period_Code |
+--------------+-------------+
| CH | MAI_18 |
| CH | JUN_18 |
| NO | 2020-01-21 |
| NO | 2020-01-21 |
+--------------+-------------+
周期表
+--------------+-------------+
| Country_Code | Period_Code |
+--------------+-------------+
| NO | 200121 |
| NO | 200122 |
+--------------+-------------+
加入这两个表时出现以下错误。
下面是我使用的sql。根据我的理解,由于我在第 2 行中将国家/地区过滤器指定为 NO
,因此它应该首先执行第 2 行,然后仅在 NO
国家/地区进行连接。但在内部,它也在考虑 CH
国家/地区,这也导致以下 sql 失败。
SELECT disTINCT SAL.COUNTRY_CODE,PER.PERIOD_CODE
FROM (SELECT * FROM MYSCHEMA.SALES WHERE COUNTRY_CODE in('NO')) SAL
JOIN MYSCHEMA.PERIOD PER
ON SAL.COUNTRY_CODE=PER.COUNTRY_CODE
AND TO_CHAR(TO_DATE(SAL.PERIOD_CODE,'YYYY-MM-DD'),'YYMMDD') = PER.PERIOD_CODE
ORDER BY 1
我也使用了 CTE
,它的行为方式相同。可能有一些解决方案。如果有人可以帮助我让 sql 运行而没有任何错误,我将不胜感激。
解决方法
Snowflake 比 SQL 规范规定的更早地进行显式转换,因此文本/变体数据的转换会在您预期之前发生。我在 2016 年就向他们提出过这个问题,虽然他们有时会修复/改变一些行为,但它也可能会改变并因此开始崩溃。
如果列的内容并非全部有效,这就是您的情况,您应该使用 TRY_
版本的命令,因此这里使用 TRY_TO_DATE 来避免错误。
因此您应该会发现此方法有效:
SELECT DISTINCT SAL.COUNTRY_CODE,PER.PERIOD_CODE
FROM (SELECT * FROM MYSCHEMA.SALES WHERE COUNTRY_CODE in('NO')) SAL
JOIN MYSCHEMA.PERIOD PER
ON SAL.COUNTRY_CODE=PER.COUNTRY_CODE
AND TO_CHAR(TRY_TO_DATE(SAL.PERIOD_CODE,'YYYY-MM-DD'),'YYMMDD') = PER.PERIOD_CODE
ORDER BY 1
我倾向于将日期转换移动到子选择(或 CTE,如果您使用其中之一)以使连接更简单,尽管 Snowflake 为您执行此操作,因此我会这样写:>
SELECT DISTINCT sal.country_code,per.period_code
FROM (
SELECT country_code,TO_CHAR(TRY_TO_DATE(SAL.PERIOD_CODE,'YYMMDD') AS join_code
FROM myschema.sales
WHERE country_code in ('NO')
) sal
JOIN myschema.period per
ON sal.country_code = per.country_code
AND sal.join_code = per.period_code
ORDER BY 1
但鉴于您的示例表,我认为它没有包含所有列,只是重现问题所需的,应该可以通过以下方式触发:
SELECT country_code,'YYMMDD') AS join_code
FROM myschema.sales
WHERE country_code in ('NO')