问题描述
我正在尝试使用 langdetect 删除文本中所有非英语的语言。
def det(x):
try:
language = detect(x)
except:
language = 'Other'
return language
df['langue'] = df['Tweet'].apply(det)
filtered_for_english = df.loc[df['langue'] == 'en']
上面的代码是我试过的。它会检测每条推文中使用的语言,但不会从我的数据框中删除非英语推文。
结果数据框:
0 es
1 es
2 es
3 en
4 en
..
14272 en
14273 en
14274 en
14275 it
14276 en
Name: langue,Length: 14277,dtype: object
如何修复此代码?
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)