在python中解析n-quad RDF文件

问题描述

我有以下代码从python中的n-quad RDF文件30kmoviedata.nq.gz中读取行:

import gzip,os,csv
gzfile = gzip.open('30kmoviedata.nq.gz',mode='rt')
print(gzfile)
for line in csv.reader(gzfile,delimiter=' ',quotechar='"'):
    print(line)

打印n-quad文件的前几行,直到程序报告错误

['_:76635','</film/performance/actor>','</en/roddy_mcdowall>','.']
['_:76636','</en/rainbeaux_smith>','.']
['_:76637','</en/wendy_hiller>','.']

---------------------------------------------------------------------------
UnicodeDecodeError                        Traceback (most recent call last)
<ipython-input-6-7cb4b58aef94> in <module>
      1 gzfile= gzip.open('30kmoviedata.nq.gz',mode='rt')
      2 print(gzfile)
----> 3 for line in csv.reader(gzfile,quotechar='"'):
      4     print(line)

c:\users\aquarium\appdata\local\programs\python\python37\lib\encodings\cp1252.py in decode(self,input,final)
     21 class IncrementalDecoder(codecs.IncrementalDecoder):
     22     def decode(self,final=False):
---> 23         return codecs.charmap_decode(input,self.errors,decoding_table)[0]
     24 
     25 class StreamWriter(Codec,codecs.StreamWriter):

UnicodeDecodeError: 'charmap' codec can't decode byte 0x9d in position 1505: character maps to <undefined>

我正在使用python 3,我需要有关如何解决此问题的帮助。谢谢。

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...