问题描述
我无法弄清楚这是哪种机器学习:
训练集:由带有对象短语的对象标签的句子组成 示例:
"This is a black chair. It is next to a large bed."
短语 'This','black chair','it'
使用标签 "chair"
进行注释,短语 'large bed'
使用标签 'bed'
进行注释。可以分配 18 个可用标签。
对于未注释的句子,我想预测句子中每个短语的标签。
例如:
There is a study table in the corner of the room,behind it is a small chair.
我希望模型为代表上述句子中的对象的每个短语预测一个标签(可用 18 个标签)。
预期输出:
'study table','it' -----> label 'table'
'small chair' -----------> label 'chair'
因此,对于每个句子,可能有多个输出标签。标签与句子无关,而是与句子中的短语相关联。
这是分类问题、回归问题还是不同类型的问题?
解决方法
与其他回应相反,我认为这是一个共指解析的任务。看来您需要将“黑色椅子”与“它”联系起来。 命名实体识别的任务,是在文本中找到实体、人名、日期、公司名称。请参阅 named entity 和 named entity recognition。
共指解析的任务是找出哪个短语与未确定的子集相关联。我绝不是语言或共指解析专家。 因此我不知道用什么方法来处理这个任务。
,对我或 NER 来说,这是一个命名实体识别问题。阅读一些关于 NER 和 NLP(自然语言处理)的文章。 已经训练了一些模型可以帮助您。或者你可以尝试训练你自己的 NER 模型