THUMT 神经机器翻译工具包

程序名称:THUMT

授权协议: BSD

操作系统: 跨平台

开发语言: Python

THUMT 介绍

THUMT 是由清华大学自然语言处理组开发的数据驱动机器翻译系统。

机器翻译是一种自然语言处理任务,其目的是使用计算机自动翻译自然语言。近几年来,端到端的神经机器翻译发展迅速,已经成为机器翻译系统的新主流。

THUMT 是用于神经机器翻译的开源工具包,构建于 Theano 之上,具有以下特点:

  • 基于 Attention 的翻译模型 。 THUMT 应用了标准的 attention 编码器-解码器框架。

  • 最低风险训练 。除了标准最大似然估计(MLE)之外,THUMT 还支持最小风险训练(MRT),其目的是找到一组模型参数,以最小化使用训练数据评估指标(如 bleu)计算的预期损失。

  • 使用单一语言语料库 :THUMT 为 NMT 提供了半监督训练(sst)能力,能够利用丰富的单语语料库资源来改善源-目标和目标-源 NMT 模型的学习。

  • 可视化 。为了更好地了解 NMT 的内部工作,THUMT 提供了一个可视化工具来演示每个中间状态与其相关语境之间的相关性。

THUMT 官网

http://thumt.thunlp.org/

相关编程语言

欧盟第7框架计划(FP7)的LarKC项目的目标是开发大规模...
Salad 是一种有效且灵活的实现著名的异常检测方法回...
multilanguage 是一个多语开发工具包,用于缓存多语...
go-cortex 是一个服务,通过倾听你的句子,并视图理...
DKPro Core 是基于 Apache UIMA 框架之上的自然语言...
NLTK 会被自然地看作是具有栈结构的一系列层,这些层...