如何从 Hadoop 数据库中将非 ACSII 字符读入 jupyterhub

问题描述

我想读取包含 ACSII 字符以外的字符的数据(来自 Hadoop 数据库)。我正在尝试使用 .py 文件读取数据。我用过

#!/usr/bin/env python
# -*- coding: utf-8 -*-

指定编码。

我使用以下查询提取数据。

def hiveconnection(host_name,port,user,database):
    conn = hive.Connection(host=host_name,port=port,username=user,database=database,auth='KERBEROS',kerberos_service_name='impala')
    cur = conn.cursor()
    cur.execute(" select * from db_name.table_name ")
    result = cur.fetchall()
    return result
output = hiveconnection(host_name,database)
denialt2= pd.DataFrame(output) 

我收到了错误消息。错误消息:“‘utf-8’编解码器无法解码位置 13 中的字节 0x96:无效起始字节”。在调查错误消息时,我知道它是由于 ASCII 字符以外的特殊字符而引发错误消息。从一列中粘贴下面的特殊字符。

enter image description here

附上完整的回溯(错误信息)。

enter image description here

请帮我解决这个问题。提前致谢:).

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)