问题描述
我想使用 Flair Tagger 来训练大型数据集 (10GB),但出现 MemoryError。我怎么解决这个问题?我认为将数据集分成更小的部分可能会有所帮助,我确实这样做了,但我不确定如何将其读取到 Flair,因为它希望我按如下方式定义文件:
corpus: Corpus = ColumnCorpus(data_folder,columns,train_file='train.txt',test_file='test.txt',dev_file='dev.txt')
先谢谢你!
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)