报纸示例中的作者提取不起作用

问题描述

我正在尝试使用 news3k 从包含演讲的网页中提取演讲者姓名,但没有运气。根据包的文档,Wavenumbers = DFF.columns #in fact this is a little more complicated but that's the spirit Spectre = DFF.values.tolist() #btw DFF is my pandas.dataframe containing spectrum with features = wavenumber SS = StandardScaler(copy=True) DFF = SS.fit_transform(DFF) #at this point I use SS for preprocessing before PCA #I'm then trying to inverse SS and get back the 1rst spectrum of the dataset D = SS.inverse_transform(DFF[0]) #However at this point DFF[0] and D are almost-exactly the same I'm sure because : plt.plot(Wavenumbers,D) plt.plot(Wavenumbers,DFF[0]) #the curves are the sames,and : for i,j in enumerate(D) : if j==DFF[0][i] : pass else : print("{}".format(j-DFF[0][i] )) #return nothing bigger than 10e-16 似乎总是返回一个空列表。

使用文档 here 中的示例。

article.authors

返回

In:

from newspaper import Article

url = 'http://fox13Now.com/2013/12/30/new-year-new-laws-obamacare-pot-guns-and-drones/'
article = Article(url)
article.download()
article.parse()
article.authors

而不是预期

Out: []

它也不适用于许多其他示例。

解决方法

在github 485上参考这个issue,newspaper3k在python3中好像坏了,如果你降级到python2,问题中提到了一个解决方法。

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...