问题描述
我在同一目录中有两个文件
1)http://nlp.lsi.upc.edu/awn/AWNDatabaseManagement.py.gz
2)阿拉伯语WordNet(http://nlp.lsi.upc.edu/awn/get_bd.php)upc_db.xml的xml数据库
当我尝试运行.py文件给我图像中的错误时 我正在尝试检查.py文件是否正常工作,以便可以将其作为WordNet导入阿拉伯语单词
您能帮我解决吗?!!!我被卡住了!
谢谢
解决方法
要读取任何二进制文件/数据库,请在打开文件/数据库时使用 encoding="uft-8"
。
UTF-8 能够使用一到四个单字节代码单元对 Unicode 中的所有 1,112,064 个有效字符代码点进行编码。
所以,简单就是最好的。
要读取上述二进制文件
第369行:
使用>>> ent = open(ent,'rb')
代替
ent = open(ent)