如何从 Hadoop 数据库中将非 ACSII 字符读入 jupyterhub

问题描述

我想读取包含 ACSII 字符以外的字符的数据（来自 Hadoop 数据库）。我正在尝试使用 .py 文件读取数据。我用过

#!/usr/bin/env python
# -*- coding: utf-8 -*-

指定编码。

我使用以下查询来提取数据。

def hiveconnection(host_name,port,user,database):
    conn = hive.Connection(host=host_name,port=port,username=user,database=database,auth='KERBEROS',kerberos_service_name='impala')
    cur = conn.cursor()
    cur.execute(" select * from db_name.table_name ")
    result = cur.fetchall()
    return result
output = hiveconnection(host_name,database)
denialt2= pd.DataFrame(output)

我收到了错误消息。错误消息：“‘utf-8’编解码器无法解码位置 13 中的字节 0x96：无效起始字节”。在调查错误消息时，我知道它是由于 ASCII 字符以外的特殊字符而引发错误消息。从一列中粘贴下面的特殊字符。

附上完整的回溯（错误信息）。

请帮我解决这个问题。提前致谢:).

解决方法

暂无找到可以解决该程序问题的有效方法，小编努力寻找整理中！

如果你已经找到好的解决方法，欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@）

impala non-ascii-characters pyhive python