2025-05-13 2025-05-07 Stanford CS336 Language Modeling from Scratch: 大規模言語モデル訓練のための並列化戦略2 - 集合通信からマルチGPU分散学習まで

2025-05-13 2025-05-07 Stanford CS336 Language Modeling from Scratch: 大規模言語モデル訓練のための並列化戦略2 - 集合通信からマルチGPU分散学習まで