问题描述
我有一个由文本和其他数字特征组成的数据集,我想要我的多输入神经网络。 数据集示例:
是否有一种正确的方法来构建一个将整个列子集作为张量的 torchtext 字段:
text_field = Field(sequential=True,use_vocab=True,init_token='<SOS>',eos_token='<EOS>',fix_length=1000)
label_field = Field(sequential=False,use_vocab=False)
Meta_features_field = Field(sequential=False,use_vocab=False)
也许以某种方式传递列列表:
features_columns_list = [feature1,feature2,feature3,feature4]
dataset = Dataset(examples='path/to/dataset',fields={'label': label_field,'text': text_field,features_columns_list : Meta_features_field })
如果无法做到这一点,很高兴听到其他关于处理多模态数据集的建议。 提前致谢:)
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)