概述

等待…

实战

dataset优化

GPU使用率优化

deepspeed多卡训练

其他问题

Nan识别与处理

调优经验

尽量复用已有的tensor 不要重复new出tensor