在 torchtext 中使用文本和非文本特征

问题描述

我有一个由文本和其他数字特征组成的数据集，我想要我的多输入神经网络。数据集示例：

index	标签	text	feature1	feature2	feature3	feature4
1	1	这是文字:)	0.2	0.4	0.5	0.7

是否有一种正确的方法来构建一个将整个列子集作为张量的 torchtext 字段：

text_field = Field(sequential=True,use_vocab=True,init_token='<SOS>',eos_token='<EOS>',fix_length=1000)
label_field = Field(sequential=False,use_vocab=False)
Meta_features_field = Field(sequential=False,use_vocab=False)

也许以某种方式传递列列表：

features_columns_list = [feature1,feature2,feature3,feature4]
dataset = Dataset(examples='path/to/dataset',fields={'label': label_field,'text': text_field,features_columns_list : Meta_features_field })

如果无法做到这一点，很高兴听到其他关于处理多模态数据集的建议。提前致谢:)

解决方法

暂无找到可以解决该程序问题的有效方法，小编努力寻找整理中！

如果你已经找到好的解决方法，欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@）