PostgreSQL PHP UTF8 =编码的无效字节序列

我正在将数据库从 mysql迁移到postgresql. mysql数据库的默认排序规则是UTF8,postgres也使用UTF8,而且我用pg_escape_string()对数据进行编码.不管什么原因,我正在遇到一些关于坏编码的时髦错误:

pg_query()[function.pg-query]:查询失败:错误:编码“UTF8”的字节序列无效:0xeb7374
提示:如果字节序列与服务器预期的编码不匹配,则该错误也会发生,由“客户端”控制

我一直在试图弄清楚这一点,并注意到php正在做一些奇怪的事情;如果字符串中只有ascii字符(例如“hello”),则编码为ASCII.如果字符串包含任何非ASCII字符,则表示编码为UTF8(例如“Hëllo”).

当我在已经是UTF8的字符串上使用utf8_encode()时,它会杀死特殊字符,并使它们全部搞砸,所以我可以做些什么来让它工作?

(确切的字符挂起它现在是“ ”,但不是只是搜索/替换,我想找到一个更好的解决方案,这样的问题不会再发生)

MySQL数据库中的数据很可能不是UTF8.这是一个很常见的情况.至少MySQL至少不会对数据进行任何正确的验证,因此只要您的客户声称是UTF8,它就可以接受任何您以UTF8的方式投掷的东西.他们现在可能已经修复了(或者我不知道他们是否也认为是一个问题),但您可能已经在数据库中编码了错误的数据.当然,PostgreSQL在加载时执行完整的验证,因此可能会失败.

您可能希望通过像可以设置为忽略未知字符的iconv这样的数据来提供数据,或将其转换为“最佳猜测”.

相关文章

项目需要,有个数据需要导入,拿到手一开始以为是mysql,结果...
本文小编为大家详细介绍“怎么查看PostgreSQL数据库中所有表...
错误现象问题原因这是在远程连接时pg_hba.conf文件没有配置正...
因本地资源有限,在公共测试环境搭建了PGsql环境,从数据库本...
wamp 环境 这个提示就是说你的版本低于10了。 先打印ph...
psycopg2.OperationalError: SSL SYSCALL error: EOF detect...