问题描述
我正在使用下面的 MysqL 查询来检查哪些记录与修剪后的值不同
SELECT id,BINARY(username) as binary_username,TRIM(username) as trim_username FROM table.
上面的查询返回二进制值和修剪后的值,如下所示。
mySQL查询结果:
上图中突出显示的值表明二进制值与修剪值不同。
我尝试了以下两件事:
-
计算二进制和修剪列的长度,但它是相同的
LENGTH(binary_username) != LENGTH(trim_username)
。 -
直接将它们等同于
binary_username != trim_username
。
但它们都返回空记录。
SELECT id,TRIM(username) as trim_username,HEX(username) as hex_username FROM table
提前致谢...
解决方法
为了避免存储、修剪等,尾随零,使用 VARBINARY
而不是 BINARY
。为什么,请告诉我,你在文本字符串中使用 BINARY 吗?
请执行 SELECT HEX(username) FROM ...
以便我们进一步诊断问题。那个截图是可疑的——我们不知道客户端做了什么来“修复”输出。
嗯,这些都不是用 UTF-8 编码的,也不是我认识的任何其他东西。 “坏”字符(02、04、0c 17)在几乎所有编码中都是“控制代码”。 (“Unicode”不是编码方式,所以不相关。)
您想要一个用于测试控制代码的 REGEXP 吗?
在 PHP 中,json_encode 有一个 JSON_UNESCAPED_UNICODE
选项。见https://www.php.net/manual/en/function.json-encode.php
但这会生成 \u1234
类型的文本。
在将二进制数据存入 MySQL 时,使用 PDO 或 mysqli 中的绑定或转义机制。