在 torchtext 中使用文本和非文本特征

问题描述

我有一个由文本和其他数字特征组成的数据集,我想要我的多输入神经网络。 数据集示例:

index 标签 text feature1 feature2 feature3 feature4
1 1 这是文字:) 0.2 0.4 0.5 0.7

是否有一种正确的方法来构建一个将整个列子集作为张量的 torchtext 字段:

text_field = Field(sequential=True,use_vocab=True,init_token='<SOS>',eos_token='<EOS>',fix_length=1000)
label_field = Field(sequential=False,use_vocab=False)
Meta_features_field = Field(sequential=False,use_vocab=False)

也许以某种方式传递列列表:

features_columns_list = [feature1,feature2,feature3,feature4]
dataset = Dataset(examples='path/to/dataset',fields={'label': label_field,'text': text_field,features_columns_list : Meta_features_field })

如果无法做到这一点,很高兴听到其他关于处理多模态数据集的建议。 提前致谢:)

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)