Wine & Chord - 页面 20

最新文章

从零实现 LLM Training：013. Eval and Logging

6 分钟阅读

加入验证集评估和日志记录，用 loss 与 PPL 监控训练效果。

从零实现 LLM Training：012. Argparse

7 分钟阅读

为训练脚本引入 argparse 命令行参数，向工业级实现迈进。

从零实现 LLM Training：011. Checkpoints

4 分钟阅读

为训练过程加入 checkpoint 容错机制，支持从中间状态恢复。

从零实现 LLM Training：010. Mixed Precision

2 分钟阅读

在完成张量并行后，引入混合精度训练以提高算力利用率。

从零实现 LLM Training：009. True Tensor Parallel for Attention

2 分钟阅读

通过按 head 维度切分 QKV，让 Attention 形成真正的张量并行。