Tensorflow:将LSTM转换为日期时间格式达到100%

问题描述

我创建了一个双向seq2seq端编码器/解码器网络,该网络旨在将不同的日期类型格式化为德语日期时间格式,例如: day_write_out,day.month.year

例如,我有字符串 1992年12月27日,并且我希望模型能够预测 1992年12月27日星期日

训练后,模型的有效精度达到 98%。进一步的调查表明,该模型几乎总是预测日期本身正确,但是 却不能提取正确的日期。因此,它预测的不是 1992年12月27日星期天,而是预测了 1992年12月27日星期三。 只有5%的日子可以正确预测。

我认为问题在于我使用的LSTM,即使它是双向的,但是由于日期是被预测的第一个元素,因此该模型没有大量信息来预测正确的日期,因为在时间步长上0该模型尚未看到任何日期值。这是正确的吗?

所以我的问题是,为什么该模型无法预测正确的日期?能够一次读取整个序列的Transformer体系结构是否可以解决此问题?

谢谢

解决方法

我认为问题在于我使用的LSTM,即使它是双向的,但是由于日期是被预测的第一个元素,因此该模型没有大量信息来预测正确的日期,因为在时间步长上0该模型尚未看到任何日期值。

尝试生成1992年12月27日-星期三,看看是否有任何作用。

老实说,我认为任何模型都无法使用该数据正确预测

相关问答

依赖报错 idea导入项目后依赖报错,解决方案:https://blog....
错误1:代码生成器依赖和mybatis依赖冲突 启动项目时报错如下...
错误1:gradle项目控制台输出为乱码 # 解决方案:https://bl...
错误还原:在查询的过程中,传入的workType为0时,该条件不起...
报错如下,gcc版本太低 ^ server.c:5346:31: 错误:‘struct...