无法在阿拉伯语 jupyter 笔记本中读取用于情绪分析的阿拉伯语 CSV 文件

问题描述

我到处搜索这个特定错误解决方案,并尝试了所有方法,但都没有奏效

这是我的代码

X_train,Y_train = read_csv('Data/train_emoji_ar.csv')

这是我不断收到的错误

Error                                     Traceback (most recent call last)
<ipython-input-2-3f5fe77b4b07> in <module>
----> 1 X_train,Y_train = read_csv('Data/train_emoji_ar.csv')

~\emo_utils.py in read_csv(filename)
     38         csvReader = csv.reader(csvDataFile)
     39 
---> 40         for row in csvReader:
     41             phrase.append(row[0])
     42             emoji.append(row[1])

Error: line contains NULL byte

当我打开保存在 jupyter 笔记本中的 CSV 文件时,我看到了这个错误

enter image description here

但是,当它是英语时,它可以正常工作,并且与阿拉伯语时不同。

我的 emo_utils.py 中读取 csv 的 Python 代码部分:

def read_csv(filename):
    phrase = []
    emoji = []

    with open (filename) as csvDataFile:
        csvReader = csv.reader(csvDataFile)

        for row in csvReader:
            phrase.append(row[0])
            emoji.append(row[1])

    X = np.asanyarray(phrase)
    Y = np.asanyarray(emoji,dtype=int)

    return X,Y

所以请帮助我为什么我总是遇到这个问题:

我尝试使用 UTF 编码 新队 和许多

没有工作

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)