2025-05-13 Stanford CS336 Language Modeling from Scratch: 大規模言語モデル訓練のための並列化戦略2 - 集合通信からマルチGPU分散学習まで

2025-05-13 Stanford CS336 Language Modeling from Scratch: 大規模言語モデル訓練のための並列化戦略2 - 集合通信からマルチGPU分散学習まで