Addie Stevens

Addie Stevens's contributions

LLM Compressor bridges the gap between model training and efficient deployment via quantization and sparsity, enabling cost-effective, low-latency inference.

Explore how vLLM's new multimodal AI inference capabilities enhance performance, scalability, and flexibility across diverse hardware platforms.

Report a website issue

Your name

Your e-mail address

Subject

Message

Type of request/issue

Problem Page URL

Territory/Country

Red Hat Account Number

Red Hat Developer Sandbox

Programming languages & frameworks

System design & architecture

Developer experience

Automated data processing

Platform engineering

Secure development & architectures

E-books

Cheat sheets

Documentation

Addie Stevens

Addie Stevens's contributions

LLM Compressor: Optimize LLMs for low-latency deployments

vLLM V1: Accelerating multimodal inference for large language models

Platforms

Build

Quicklinks

Communicate

RED HAT DEVELOPER

Red Hat legal and privacy links

Red Hat legal and privacy links

Report a website issue