Helen Zhao

Helen Zhao's contributions

Speculators standardizes speculative decoding for large language models, with a unified Hugging Face format, vLLM integration, and more.

LLM Compressor 0.7.0 release recap

Dipika Sikka +3

August 25, 2025

LLM Compressor 0.7.0 brings Hadamard transforms for better accuracy, mixed-precision FP4/FP8, and calibration-free block quantization for efficient compression.

Report a website issue

Red Hat Developer Sandbox

Programming languages & frameworks

System design & architecture

Developer experience

Automated data processing

Platform engineering

Secure development & architectures

E-books

Cheat sheets

Documentation

Helen Zhao

Helen Zhao's contributions

Speculators: Standardized, production-ready speculative decoding

LLM Compressor 0.7.0 release recap

Platforms

Build

Quicklinks

Communicate

RED HAT DEVELOPER

Red Hat legal and privacy links

Red Hat legal and privacy links

Report a website issue