seq2seq 设计目标/特性 介绍
seq2seq 是 Google 开源的一款用于 TensorFlow
的通用编码器&解码器框架(encoder-decoder framework),可用于机器翻译、文本摘要、会话建模、图像描述等。
设计目标/特性
-
通用性 :Google 最初为机器翻译开发了这个框架,但是后来用于各种其他任务,包括摘要、会话建模和图像描述。只要你的问题可以以一种格式编码输入数据,并解码为另一种格式,你应该能够使用或扩展这个框架。
-
再现性 :使用 YAML 文件配置训练流程和模型。这也允许其他人运行和你完全相同的模型配置。
-
文档 :所有代码都使用标准的 Python docstrings 记录,有书面指南帮助开始执行常见任务。
-
良好的性能 :为了使代码足够简洁,没有试图榨干所有性能,但是实现速度已足以涵盖几乎所有的生产和研究用例。tf-seq2seq 还支持分布式训练,从而折中计算能力和训练时间。