天赋分类模型训练中的数据是如何解析的?

问题描述

所以我准备了一个数据集来训练一个天赋分类模型。它以正确的方式格式化(label)。然而,当我去训练我的模型时,我相信它会混淆数据。这可能是因为其他分隔符,因为我的数据集充满了空格、分号、单引号和双引号以及逗号。

this is an example of one of my datasets

当我运行火车模型程序并打印语料库信息时,它给了我以下信息: corpus printed corpus information

当模型尝试训练时,每个 epoch 都有相同的问题: [W ParallelNative.cpp:206] 警告:在使用本机并行后端(函数 set_num_threads)时,在并行工作开始后或在 set_num_threads 调用后无法设置内部操作线程数

每个时期都没有改进或发展: 2021-07-26 10:26:51,694 DEV:损失 6.476138114929199 - 得分 0.0

2021-07-26 10:26:51,812 BAD EPOCHS(无改善):0

最终结果如下: results

如果有人能指出我如何使这个模型训练工作的正确方向,我将不胜感激。

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)