NLP 构建语料库

问题描述

大家下午好!

我在从给定的 Pandas df 构建语料库时遇到问题。 我的数据集看起来像这样 10 entries,其中前 2 列是这些词的类型和频率分布。

谁能帮我创建一个语料库,通过能够“合并”这两列,这样就会有一个包含所有这些单词的列表。

我尝试制作 2 个列表:

words_in_list = list (words['Word'])
frequency_list = list (words['FREQcount'])

然后这个:

my_lst = []

for word in range(len(words_in_list)):
    my_lst.append(frequency_list[word] * words_in_list[word])
print(my_lst)

但是ram买不起那么多,代码也行不通。

谁能建议我更好的方法解决这个问题? 非常感谢您的帮助。

祝你有美好的一天:)

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...