问题描述
甲骨文 12c:
sql> select UTL_RAW.CAST_TO_RAW('Tom') as hex_val,2 dbms_crypto.hash(src=>UTL_RAW.CAST_TO_RAW('Tom'),typ=>2) as hex_hash
3 from dual;
546F6D
D9FFACA46D5990EC39501BCDF22EE7A1
Postgresql 12.5:
sides=> select upper(encode('Tom','hex')),md5(upper(encode('Tom','hex')));
upper | md5
--------+----------------------------------
546F6D | f679fe36c1c908fa2547e6915026b0af
(1 row)
md5sum 带换行符:
-bash-4.2$ echo "546F6D" | md5sum
ef81d9f3f3e1305c92ce84efdecfd1bc -
md5sum 没有换行符:
-bash-4.2$ echo -n "546F6D" | md5sum
f679fe36c1c908fa2547e6915026b0af -
如您所见,Postgres 的 MD5() 函数与没有换行符的 md5sum(1) 函数匹配。这正是我所期望的。但是,Oracle 12c 也不匹配,也不匹配 md5 sum with 换行符?
Oracle 在做什么(或者我犯了 PEBKAC 错误)?
(最终目的是向客户端展示xml数据成功从Oracle迁移到Postgres。这就是弱散列可以接受的原因。)
编辑:
使用 RAWTOHEX() 返回与 CAST_TO_RAW() 相同的值。
sql> select UTL_RAW.CAST_TO_RAW('Tom') as hex_val
2,dbms_crypto.hash(src=>UTL_RAW.CAST_TO_RAW('Tom'),typ=>2) as hex_hash
3,dbms_crypto.hash(src=>RAWTOHEX('Tom'),typ=>2) as raw_hash
4 from dual;
HEX_VAL
--------------------------------------------------------------------------------
HEX_HASH
--------------------------------------------------------------------------------
RAW_HASH
--------------------------------------------------------------------------------
546F6D
D9FFACA46D5990EC39501BCDF22EE7A1
D9FFACA46D5990EC39501BCDF22EE7A1
sql> select UTL_RAW.CAST_TO_RAW('Tom') as hex_val
2,typ=>2) as raw_hash
4,standard_hash(rawtohex('Tom'),'MD5') as std_hash
5 from dual;
HEX_VAL
--------------------------------------------------------------------------------
HEX_HASH
--------------------------------------------------------------------------------
RAW_HASH
--------------------------------------------------------------------------------
STD_HASH
--------------------------------
546F6D
D9FFACA46D5990EC39501BCDF22EE7A1
D9FFACA46D5990EC39501BCDF22EE7A1
F679FE36C1C908FA2547E6915026B0AF
解决方法
您的 Oracle 命令正在对十六进制值进行散列,但您的 Postgres 和 bash 命令正在对十六进制的表示进行散列。要让 Oracle 散列十六进制值的字符串,请使用 RAWTOHEX
:
SQL> select standard_hash(rawtohex('Tom'),'MD5') from dual;
STANDARD_HASH(RAWTOHEX('TOM'),'M
--------------------------------
F679FE36C1C908FA2547E6915026B0AF
DBMS_CRYPTO
和 STANDARD_HASH
的工作方式相同,不同之处在于 DBMS_CRYPTO
只接受 RAW
数据类型。令人困惑的是,有时会有隐式转换和 SQL* Plus 可能以不同的方式显示不同的数据类型。但根据 UTL_RAW.CAST_TO_RAW documentation,“数据本身没有以任何方式修改,但其数据类型被重新转换为 RAW 数据类型”。
要比较两个数据库上的原始值,请将 Oracle 上的 select select dbms_crypto.hash(src=>utl_raw.cast_to_raw('Tom'),typ=>2) from dual;
与 Postgres 上的 select upper(md5('Tom'));
进行比较 - 它们都返回 D9FFACA46D5990EC39501BCDF22EE7A1。