Oracle m5 哈希返回与 Postgresql 和 bash md5sum(1)

问题描述

甲骨文 12c:

sql> select UTL_RAW.CAST_TO_RAW('Tom') as hex_val,2         dbms_crypto.hash(src=>UTL_RAW.CAST_TO_RAW('Tom'),typ=>2) as hex_hash
  3  from dual;
546F6D
D9FFACA46D5990EC39501BCDF22EE7A1

Postgresql 12.5:

sides=> select upper(encode('Tom','hex')),md5(upper(encode('Tom','hex')));
 upper  |               md5                
--------+----------------------------------
 546F6D | f679fe36c1c908fa2547e6915026b0af
(1 row)

md5sum 换行符:

-bash-4.2$ echo "546F6D" | md5sum   
ef81d9f3f3e1305c92ce84efdecfd1bc  -

md5sum 没有换行符:

-bash-4.2$ echo -n "546F6D" | md5sum
f679fe36c1c908fa2547e6915026b0af  -

如您所见,Postgres 的 MD5() 函数与没有换行符的 md5sum(1) 函数匹配。这正是我所期望的。但是,Oracle 12c 也不匹配,也不匹配 md5 sum with 换行符?

Oracle 在做什么(或者我犯了 PEBKAC 错误)?

(最终目的是向客户端展示xml数据成功从Oracle迁移到Postgres。这就是弱散列可以接受的原因。)

编辑:

使用 RAWTOHEX() 返回与 CAST_TO_RAW() 相同的值。

sql> select UTL_RAW.CAST_TO_RAW('Tom') as hex_val
  2,dbms_crypto.hash(src=>UTL_RAW.CAST_TO_RAW('Tom'),typ=>2) as hex_hash
  3,dbms_crypto.hash(src=>RAWTOHEX('Tom'),typ=>2) as raw_hash
  4  from dual;

HEX_VAL
--------------------------------------------------------------------------------
HEX_HASH
--------------------------------------------------------------------------------
RAW_HASH
--------------------------------------------------------------------------------
546F6D
D9FFACA46D5990EC39501BCDF22EE7A1
D9FFACA46D5990EC39501BCDF22EE7A1

sql> select UTL_RAW.CAST_TO_RAW('Tom') as hex_val
  2,typ=>2) as raw_hash
  4,standard_hash(rawtohex('Tom'),'MD5') as std_hash
  5  from dual;

HEX_VAL
--------------------------------------------------------------------------------
HEX_HASH
--------------------------------------------------------------------------------
RAW_HASH
--------------------------------------------------------------------------------
STD_HASH
--------------------------------
546F6D
D9FFACA46D5990EC39501BCDF22EE7A1
D9FFACA46D5990EC39501BCDF22EE7A1
F679FE36C1C908FA2547E6915026B0AF

解决方法

您的 Oracle 命令正在对十六进制进行散列,但您的 Postgres 和 bash 命令正在对十六进制的表示进行散列。要让 Oracle 散列十六进制值的字符串,请使用 RAWTOHEX:

SQL> select standard_hash(rawtohex('Tom'),'MD5') from dual;

STANDARD_HASH(RAWTOHEX('TOM'),'M
--------------------------------
F679FE36C1C908FA2547E6915026B0AF

DBMS_CRYPTOSTANDARD_HASH 的工作方式相同,不同之处在于 DBMS_CRYPTO 只接受 RAW 数据类型。令人困惑的是,有时会有隐式转换和 SQL* Plus 可能以不同的方式显示不同的数据类型。但根据 UTL_RAW.CAST_TO_RAW documentation,“数据本身没有以任何方式修改,但其数据类型被重新转换为 RAW 数据类型”。

要比较两个数据库上的原始值,请将 Oracle 上的 select select dbms_crypto.hash(src=>utl_raw.cast_to_raw('Tom'),typ=>2) from dual; 与 Postgres 上的 select upper(md5('Tom')); 进行比较 - 它们都返回 D9FFACA46D5990EC39501BCDF22EE7A1。