Spacy的依存解析器

问题描述

我正在尝试使用Spacy的依赖性分析器来提取方面以进行基于方面的情感分析。 我点击了以下链接https://remicnrd.github.io/Aspect-based-sentiment-analysis/

当我在数据上尝试以下代码时,我收到一条错误消息。

import spacy
nlp = spacy.load('en')

dataset.review = dataset.review.str.lower()

aspect_terms = []
for review in nlp.pipe(dataset.review):
    chunks = [(chunk.root.text) for chunk in review.noun_chunks if chunk.root.pos_ == 'NOUN']
    aspect_terms.append(' '.join(chunks))
dataset['aspect_terms'] = aspect_terms
dataset.head(10)

错误消息是:

TypeError:类型为'nonetype'的对象没有len()

错误在这一行:

for review in nlp.pipe(dataset.review):

有人可以帮助我在这里了解问题以及如何解决此问题。谢谢。

解决方法

这是因为我有一些空行用于列审阅。 在删除带有NaN值的空行/行用于列审阅后,我重新运行了代码,它工作得很好:)