Triton Grouped Matrix Multiplication (Almost CUDA Performance!) A MyTorch Sidequest4просмотра3 месяца назад
2) The Autogradless Transformer Training a GPT2 Model With Nothing but Numpy!2просмотра3 месяца назад
1) The Autogradless Transformer Training a GPT2 Model With Nothing but Numpy!3просмотра3 месяца назад