Kushagra Rastogi

Kushagra Rastogi's contributions

Explore the mechanics of gradient synchronization in PyTorch distributed training, focusing on MPI primitives like All-Reduce and core techniques like pipeline parallelism, tensor parallelism, and sharded data parallelism.

Kushagra Rastogi

Kushagra Rastogi's contributions

MPI-powered gradient synchronization in PyTorch distributed training

Platforms

Build

Quicklinks

Communicate

RED HAT DEVELOPER

Red Hat legal and privacy links

Red Hat legal and privacy links