Wine & Chord - Page 17

Recent posts

从零实现 LLM Training：022. FineWebNPYDataset

5 minute read

引入 FineWebNPYDataset 数据集 class。

从零实现 LLM Training：021. WandB

2 minute read

使用 WandB 记录训练过程，方便后续分析。

从零实现 LLM Training：020. PyTorch Profiler and NVTX

8 minute read

使用 PyTorch profiler 与 NVTX 捕捉 trace，深入分析训练性能瓶颈。

从零实现 LLM Training：019. Activation Checkpoint

8 minute read

通过 activation checkpointing 以重计算换显存，优化大模型训练。

从零实现 LLM Training：018. LR Cosine Scheduler

7 minute read

为学习率引入 cosine scheduler，并将调度状态写入 checkpoint。