3 minute read
在完成基础训练后,实现一个最简单的文本生成脚本。
12 minute read
将 toy 数据集替换为更真实的文本数据,完善训练链路。
6 minute read
加入验证集评估和日志记录,用 loss 与 PPL 监控训练效果。
7 minute read
为训练脚本引入 argparse 命令行参数,向工业级实现迈进。
4 minute read
为训练过程加入 checkpoint 容错机制,支持从中间状态恢复。