为什么不鼓励根据 Tensorflow 文档在最后一层使用 softmax 作为激活函数?

问题描述

我在关注 Tensorlflow's Quickstart guide 时注意到他们不鼓励使用 softmax 函数作为最后一层的激活函数。解释如下:

虽然这可以使模型输出更直接可解释,但不建议使用这种方法,因为在使用 softmax 输出时不可能为所有模型提供精确且数值稳定的损失计算。

任何人都可以扩展这个解释吗?我能在该主题上找到的所有内容都建议在最后一层使用 softmax 函数,这与 Tensorflow 的文档相反。最近是否发生了一些事情,导致本指南现在过时和不正确?

感谢您的任何见解。

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)