问题描述
我将数据从 Postgres 迁移到 Redshift 并进行了数据验证检查,因此使用 MD5 获取完整行。 Postgres 和 Redshift 之间的视觉检查是可以的,但 Float8 数据类型的 MD5 值不同。
在 Postgres 中:
balance|md5(balance::VARCHAR)
-140.2|d59f47f21a88e8b73d4ca309d75cc64b
在红移中:
balance|md5(balance::VARCHAR)
-140.2|539dc58d834b1cf24252705b4f40b7f1
有人遇到过这个问题吗?关于为什么会有这种差异的任何想法?有没有其他方法可以在迁移后对跨数据库的所有行进行数据验证?
解决方法
Redshift MD5() 对字符串进行操作,因此这些浮点数需要转换为字符串。假设您在两个数据库中确实具有完全相同的值,可能的原因是来自这些隐式强制转换的字符串表示不同。您将需要使用 to_char() 函数控制如何将浮点数表示为字符串。