如何减少TPU空闲时间?

问题描述

我的培训代码https://github.com/ksjae/KoGPT2-train)使TPU的空闲时间达到了99.7%。减少空闲时间的一般方法是什么? 我(或一般用户)如何将其减少到合理的数量

如何找到长时间闲置的罪魁祸首?

*数据可在gs:// kogpt2 / model

获得

Most of time is taken by prefetch,but it is very low as seen below.

Step time shows 99%+ idle

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)