问题描述
首先,我在我的项目中使用名为 small 的预训练 elmo 模型。第一个预训练模型有 1360 万个参数,其输出大小为 256。然后它显示我使用了 10803M GPU 内存。 其次,我在我的项目中使用名为 Original 的预训练 elmo 模型。第二个预训练模型有 96.6M 参数,其输出大小为 1024。然后它显示我使用了 9649M GPU 内存。 第三,除了两个不同的预训练模型的路径外,没有任何变化。 我认为小模型应该计算得更快并使用更少的 GPU 内存。然而,事实并非如此。 所以我的问题是为什么小模型会花费更多的 GPU 内存?
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)