ValueError: 行 440902 上的向量无效 |使用 gensim.models.keyedvectors.word2vec() 函数加载 wiki.ar.vec 时

问题描述

我正在尝试使用 gensim 中的 word2vec 函数加载 wiki.ar.vec 阿拉伯语词嵌入文件

下面是用于加载嵌入文件代码

import gensim.models.keyedvectors as word2vec 
print( "Word Embedding is loading")
embedding = word2vec.KeyedVectors.load_word2vec_format('/home/user/Documents/wiki.ar.vec',binary=False)
print( "Word Embedding is loaded")

面对以下屏幕截图中描述的错误

enter image description here

或任何其他方式加载 wiki.ar.vec 嵌入文件

任何建议和答案都非常受欢迎。

解决方法

此错误表明文件格式不正确,位于指定的行/向量处。

文件从哪里来?您确定它是正确格式的二进制格式文件吗?

您是否尝试过重新下载文件以确保它没有被损坏或截断?