Blogs | AB Portfolio Website

Aditya Bang's Portfolio Website

My Resume

Blogs

GraphCUDA: Fusing Sparse-Dense and Dense-Dense Matrix Multiplication (Part 1)

Optimizing a fused sparse-dense and dense-dense matrix multiplication kernel in Triton.

Continuing the fused SpMM-GEMM optimization series with lower-level CUDA implementation details.

Continuing the fused SpMM-GEMM optimization series with CuTe and newer GPU architectures.