迁移学习分类器以标记其他尚未标记的数据集

问题描述

我有责任根据严重程度标记一组 Github 问题。这是我所做的步骤。

  1. 我构建了一个从 bug 数据集获得的分类模型,其中包含来自 bugzilla、eclipse 和 mozilla 的 bug 的集合,这些 bug 已使用 SVM/NB/KNN 根据其严重程度进行标记

  2. 我已经对包含来自 github 的一组问题的数据集进行了文本处理(但尚未标记严重性)

是否可以使用 Python 从已创建用于标记标记 github 数据集的分类模型中进行迁移学习?

解决方法

这将取决于您的分类模型的架构。如果您有一个转换器模型,您可以查看将学习实践从一个数据集迁移到另一个数据集的代码:https://github.com/lemay-ai/lazyTextPredict