使用预训练的 ELMo 生成词嵌入 E

问题描述

我正在尝试了解 ELMo 的设计方式及其工作原理,但我有几个问题:

  1. ELMo 架构(如下图所示)是用于训练模型,还是用于使用预训练模型生成依赖于上下文的嵌入?还是两者都一样?

    ELMo architecture

Source

  1. 在将输入传递给 Bi-LSTM 层之前,它会通过卷积神经网络 (CNN) 将单词转换为原始单词向量(基于字符)。 CNN如何做到这一点?有什么有用的参考资料吗?

谢谢。

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)