问题描述
data = TextDataLoaders.from_folder(path,bs=32,seed=42,valid_pct=0.3,is_lm=False,tok_tfm=kmer_tokenizer_v0)
data.show_batch()
然后我得到输出
0 xxunk positive
1 xxunk positive
2 xxunk negative
...
在路径中我有正文件夹和负文件夹(大约 1000 个样本),其中每个 .txt 文件包含一个带有字母 A-Z 的字符串。
为什么我得到未知数?如何查看字符串,以便确定我确实拥有正确的数据?
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)