title
Release Artifacts

Dynamo Release Artifacts

This document provides a comprehensive inventory of all Dynamo release artifacts including container images, Python wheels, Helm charts, and Rust crates.

See also: Support Matrix for hardware and platform compatibility | Feature Matrix for backend feature support

Release history in this document begins at v0.6.0.

Current Release: Dynamo v0.8.1

GitHub Release: v0.8.1
Docs: v0.8.1
NGC Collection: ai-dynamo

Patch Release: v0.8.1.post1 (Jan 23, 2026)

v0.8.1.post1 is a patch release for PyPI wheels and TRT-LLM container only (no GitHub release). All other artifacts remain at v0.8.1.

Artifact	Version	Change	Link
`ai-dynamo`	`0.8.1.post1`	Updated TRT-LLM to `v1.2.0rc6.post2`	PyPI
`ai-dynamo-runtime`	`0.8.1.post1`	Updated TRT-LLM to `v1.2.0rc6.post2`	PyPI
`tensorrtllm-runtime`	`0.8.1.post1`	TRT-LLM `v1.2.0rc6.post2`	NGC

Container Images

Image:Tag	Description	Backend	CUDA	Arch	NGC	Notes
`vllm-runtime:0.8.1`	Runtime container for vLLM backend	vLLM `v0.12.0`	`v12.9`	AMD64/ARM64	link
`vllm-runtime:0.8.1-cuda13`	Runtime container for vLLM backend (CUDA 13)	vLLM `v0.12.0`	`v13.0`	AMD64/ARM64*	—	Fails to launch
`sglang-runtime:0.8.1`	Runtime container for SGLang backend	SGLang `v0.5.6.post2`	`v12.9`	AMD64/ARM64	link
`sglang-runtime:0.8.1-cuda13`	Runtime container for SGLang backend (CUDA 13)	SGLang `v0.5.6.post2`	`v13.0`	AMD64/ARM64*	link	Experimental
`tensorrtllm-runtime:0.8.1`	Runtime container for TensorRT-LLM backend	TRT-LLM `v1.2.0rc6.post1`	`v13.0`	AMD64/ARM64	link
`dynamo-frontend:0.8.1`	API gateway with Endpoint Prediction Protocol (EPP)	—	—	AMD64/ARM64	link
`kubernetes-operator:0.8.1`	Kubernetes operator for Dynamo deployments	—	—	AMD64/ARM64	link

* Multimodal inference on CUDA 13 images: works on AMD64 for all backends; works on ARM64 only for TensorRT-LLM (vllm-runtime:*-cuda13 and sglang-runtime:*-cuda13 do not support multimodality on ARM64).

Python Wheels

We recommend using the TensorRT-LLM NGC container instead of the ai-dynamo[trtllm] wheel. See the NGC container collection for supported images.

Package	Description	Python	Platform	PyPI
`ai-dynamo==0.8.1`	Main package with backend integrations (vLLM, SGLang, TRT-LLM)	`3.10`–`3.12`	Linux (glibc `v2.28+`)	link
`ai-dynamo-runtime==0.8.1`	Core Python bindings for Dynamo runtime	`3.10`–`3.12`	Linux (glibc `v2.28+`)	link
`kvbm==0.8.1`	KV Block Manager for disaggregated KV cache	`3.12`	Linux (glibc `v2.28+`)	link

Helm Charts

Chart	Description	NGC
`dynamo-crds-0.8.1`	Custom Resource Definitions for Dynamo Kubernetes resources	link
`dynamo-platform-0.8.1`	Platform services (etcd, NATS) for Dynamo cluster	link
`dynamo-graph-0.8.1`	Deployment graph controller for Dynamo workloads	link

Rust Crates

Crate	Description	MSRV (Rust)	crates.io
`dynamo-runtime@0.8.1`	Core distributed runtime library	`v1.82`	link
`dynamo-llm@0.8.1`	LLM inference engine	`v1.82`	link
`dynamo-async-openai@0.8.1`	Async OpenAI-compatible API client	`v1.82`	link
`dynamo-parsers@0.8.1`	Protocol parsers (SSE, JSON streaming)	`v1.82`	link
`dynamo-memory@0.8.1`	Memory management utilities	`v1.82`	link
`dynamo-config@0.8.1`	Configuration management	`v1.82`	link

Quick Install Commands

Container Images (NGC)

For detailed run instructions, see the Container README or backend-specific guides: vLLM | SGLang | TensorRT-LLM

# Runtime containers
docker pull nvcr.io/nvidia/ai-dynamo/vllm-runtime:0.8.1
docker pull nvcr.io/nvidia/ai-dynamo/sglang-runtime:0.8.1
docker pull nvcr.io/nvidia/ai-dynamo/tensorrtllm-runtime:0.8.1.post1

# CUDA 13 variants (experimental)
# vLLM CUDA 13 image fails to launch (known issue)
# docker pull nvcr.io/nvidia/ai-dynamo/vllm-runtime:0.8.1-cuda13
docker pull nvcr.io/nvidia/ai-dynamo/sglang-runtime:0.8.1-cuda13

# Infrastructure containers
docker pull nvcr.io/nvidia/ai-dynamo/dynamo-frontend:0.8.1
docker pull nvcr.io/nvidia/ai-dynamo/kubernetes-operator:0.8.1

Python Wheels (PyPI)

For detailed installation instructions, see the Local Quick Start in the README.

# Install Dynamo with a specific backend (Recommended)
uv pip install "ai-dynamo[vllm]==0.8.1.post1"
uv pip install "ai-dynamo[sglang]==0.8.1.post1"
# TensorRT-LLM requires the NVIDIA PyPI index and pip
pip install --pre --extra-index-url https://pypi.nvidia.com "ai-dynamo[trtllm]==0.8.1.post1"

# Install Dynamo core only
uv pip install ai-dynamo==0.8.1.post1

# Install standalone KVBM (Python 3.12 only)
uv pip install kvbm==0.8.1

Helm Charts (NGC)

For Kubernetes deployment instructions, see the Kubernetes Installation Guide.

helm install dynamo-crds oci://helm.ngc.nvidia.com/nvidia/ai-dynamo/charts/dynamo-crds --version 0.8.1
helm install dynamo-platform oci://helm.ngc.nvidia.com/nvidia/ai-dynamo/charts/dynamo-platform --version 0.8.1
helm install dynamo-graph oci://helm.ngc.nvidia.com/nvidia/ai-dynamo/charts/dynamo-graph --version 0.8.1

Rust Crates (crates.io)

For API documentation, see each crate on docs.rs. To build Dynamo from source, see Building from Source.

cargo add dynamo-runtime@0.8.1
cargo add dynamo-llm@0.8.1
cargo add dynamo-async-openai@0.8.1
cargo add dynamo-parsers@0.8.1
cargo add dynamo-memory@0.8.1
cargo add dynamo-config@0.8.1

CUDA and Driver Requirements

For detailed CUDA toolkit versions and minimum driver requirements for each container image, see the Support Matrix.

Known Issues

For a complete list of known issues, refer to the release notes for each patch:

Known Artifact Issues

Version	Artifact	Issue	Status
v0.8.1	`vllm-runtime:0.8.1-cuda13`	Container fails to launch.	Known issue
v0.8.1	`sglang-runtime:0.8.1-cuda13`, `vllm-runtime:0.8.1-cuda13`	Multimodality not expected to work on ARM64. Works on AMD64.	Known limitation
v0.8.0	`sglang-runtime:0.8.0-cuda13`	CuDNN installation issue caused PyTorch `v2.9.1` compatibility problems with `nn.Conv3d`, resulting in performance degradation and excessive memory usage in multimodal workloads.	Fixed in v0.8.1 (#5461)

Release History

v0.8.1.post1 Patch: Updated TRT-LLM to v1.2.0rc6.post2 (PyPI wheels and TRT-LLM container only)
Standalone Frontend Container: dynamo-frontend added in v0.8.0
CUDA 13 Runtimes: Experimental CUDA 13 runtime for vLLM and SGLang in v0.8.0
New Rust Crates: dynamo-memory and dynamo-config added in v0.8.0

GitHub Releases

Version	Release Date	GitHub	Docs
`v0.8.1`	Jan 23, 2026	Release	Docs
`v0.8.0`	Jan 15, 2026	Release	Docs
`v0.7.1`	Dec 15, 2025	Release	GitHub
`v0.7.0`	Nov 26, 2025	Release	GitHub
`v0.6.1`	Nov 6, 2025	Release	GitHub
`v0.6.0`	Oct 28, 2025	Release	GitHub

Container Images

NGC Collection: ai-dynamo

To access a specific version, append ?version=TAG to the container URL: https://catalog.ngc.nvidia.com/orgs/nvidia/teams/ai-dynamo/containers/{container}?version={tag}

vllm-runtime

Image:Tag	vLLM	Arch	CUDA	Notes
`vllm-runtime:0.8.1`	`v0.12.0`	AMD64/ARM64	`v12.9`
`vllm-runtime:0.8.0`	`v0.12.0`	AMD64/ARM64	`v12.9`
`vllm-runtime:0.8.0-cuda13`	`v0.12.0`	AMD64/ARM64	`v13.0`	Experimental
`vllm-runtime:0.7.0.post2`	`v0.11.2`	AMD64/ARM64	`v12.8`	Patch
`vllm-runtime:0.7.1`	`v0.11.0`	AMD64/ARM64	`v12.8`
`vllm-runtime:0.7.0.post1`	`v0.11.0`	AMD64/ARM64	`v12.8`	Patch
`vllm-runtime:0.7.0`	`v0.11.0`	AMD64/ARM64	`v12.8`
`vllm-runtime:0.6.1.post1`	`v0.11.0`	AMD64/ARM64	`v12.8`	Patch
`vllm-runtime:0.6.1`	`v0.11.0`	AMD64/ARM64	`v12.8`
`vllm-runtime:0.6.0`	`v0.11.0`	AMD64	`v12.8`

sglang-runtime

Image:Tag	SGLang	Arch	CUDA	Notes
`sglang-runtime:0.8.1`	`v0.5.6.post2`	AMD64/ARM64	`v12.9`
`sglang-runtime:0.8.1-cuda13`	`v0.5.6.post2`	AMD64/ARM64	`v13.0`	Experimental
`sglang-runtime:0.8.0`	`v0.5.6.post2`	AMD64/ARM64	`v12.9`
`sglang-runtime:0.8.0-cuda13`	`v0.5.6.post2`	AMD64/ARM64	`v13.0`	Experimental
`sglang-runtime:0.7.1`	`v0.5.4.post3`	AMD64/ARM64	`v12.9`
`sglang-runtime:0.7.0.post1`	`v0.5.4.post3`	AMD64/ARM64	`v12.9`	Patch
`sglang-runtime:0.7.0`	`v0.5.4.post3`	AMD64/ARM64	`v12.9`
`sglang-runtime:0.6.1.post1`	`v0.5.3.post2`	AMD64/ARM64	`v12.9`	Patch
`sglang-runtime:0.6.1`	`v0.5.3.post2`	AMD64/ARM64	`v12.9`
`sglang-runtime:0.6.0`	`v0.5.3.post2`	AMD64	`v12.8`

tensorrtllm-runtime

Image:Tag	TRT-LLM	Arch	CUDA	Notes
`tensorrtllm-runtime:0.8.1.post1`	`v1.2.0rc6.post2`	AMD64/ARM64	`v13.0`	Patch
`tensorrtllm-runtime:0.8.1`	`v1.2.0rc6.post1`	AMD64/ARM64	`v13.0`
`tensorrtllm-runtime:0.8.0`	`v1.2.0rc6.post1`	AMD64/ARM64	`v13.0`
`tensorrtllm-runtime:0.7.0.post2`	`v1.2.0rc2`	AMD64/ARM64	`v13.0`	Patch
`tensorrtllm-runtime:0.7.1`	`v1.2.0rc3`	AMD64/ARM64	`v13.0`
`tensorrtllm-runtime:0.7.0.post1`	`v1.2.0rc3`	AMD64/ARM64	`v13.0`	Patch
`tensorrtllm-runtime:0.7.0`	`v1.2.0rc2`	AMD64/ARM64	`v13.0`
`tensorrtllm-runtime:0.6.1-cuda13`	`v1.2.0rc1`	AMD64/ARM64	`v13.0`	Experimental
`tensorrtllm-runtime:0.6.1.post1`	`v1.1.0rc5`	AMD64/ARM64	`v12.9`	Patch
`tensorrtllm-runtime:0.6.1`	`v1.1.0rc5`	AMD64/ARM64	`v12.9`
`tensorrtllm-runtime:0.6.0`	`v1.1.0rc5`	AMD64/ARM64	`v12.9`

dynamo-frontend

Image:Tag	Arch	Notes
`dynamo-frontend:0.8.1`	AMD64/ARM64
`dynamo-frontend:0.8.0`	AMD64/ARM64	Initial

kubernetes-operator

Image:Tag	Arch	Notes
`kubernetes-operator:0.8.1`	AMD64/ARM64
`kubernetes-operator:0.8.0`	AMD64/ARM64
`kubernetes-operator:0.7.1`	AMD64/ARM64
`kubernetes-operator:0.7.0.post1`	AMD64/ARM64	Patch
`kubernetes-operator:0.7.0`	AMD64/ARM64
`kubernetes-operator:0.6.1`	AMD64/ARM64
`kubernetes-operator:0.6.0`	AMD64/ARM64

Python Wheels

PyPI: ai-dynamo | ai-dynamo-runtime | kvbm

To access a specific version: https://pypi.org/project/{package}/{version}/

ai-dynamo (wheel)

Package	Python	Platform	Notes
`ai-dynamo==0.8.1.post1`	`3.10`–`3.12`	Linux (glibc `v2.28+`)	TRT-LLM `v1.2.0rc6.post2`
`ai-dynamo==0.8.1`	`3.10`–`3.12`	Linux (glibc `v2.28+`)
`ai-dynamo==0.8.0`	`3.10`–`3.12`	Linux (glibc `v2.28+`)
`ai-dynamo==0.7.1`	`3.10`–`3.12`	Linux (glibc `v2.28+`)
`ai-dynamo==0.7.0`	`3.10`–`3.12`	Linux (glibc `v2.28+`)
`ai-dynamo==0.6.1`	`3.10`–`3.12`	Linux (glibc `v2.28+`)
`ai-dynamo==0.6.0`	`3.10`–`3.12`	Linux (glibc `v2.28+`)

ai-dynamo-runtime (wheel)

Package	Python	Platform	Notes
`ai-dynamo-runtime==0.8.1.post1`	`3.10`–`3.12`	Linux (glibc `v2.28+`)	TRT-LLM `v1.2.0rc6.post2`
`ai-dynamo-runtime==0.8.1`	`3.10`–`3.12`	Linux (glibc `v2.28+`)
`ai-dynamo-runtime==0.8.0`	`3.10`–`3.12`	Linux (glibc `v2.28+`)
`ai-dynamo-runtime==0.7.1`	`3.10`–`3.12`	Linux (glibc `v2.28+`)
`ai-dynamo-runtime==0.7.0`	`3.10`–`3.12`	Linux (glibc `v2.28+`)
`ai-dynamo-runtime==0.6.1`	`3.10`–`3.12`	Linux (glibc `v2.28+`)
`ai-dynamo-runtime==0.6.0`	`3.10`–`3.12`	Linux (glibc `v2.28+`)

kvbm (wheel)

Package	Python	Platform	Notes
`kvbm==0.8.1`	`3.12`	Linux (glibc `v2.28+`)
`kvbm==0.8.0`	`3.12`	Linux (glibc `v2.28+`)
`kvbm==0.7.1`	`3.12`	Linux (glibc `v2.28+`)
`kvbm==0.7.0`	`3.12`	Linux (glibc `v2.28+`)	Initial

Helm Charts

NGC Helm Registry: ai-dynamo

Direct download: https://helm.ngc.nvidia.com/nvidia/ai-dynamo/charts/{chart}-{version}.tgz

dynamo-crds (Helm chart)

Chart	Notes
`dynamo-crds-0.8.1`
`dynamo-crds-0.8.0`
`dynamo-crds-0.7.1`
`dynamo-crds-0.7.0`
`dynamo-crds-0.6.1`
`dynamo-crds-0.6.0`

dynamo-platform (Helm chart)

Chart	Notes
`dynamo-platform-0.8.1`
`dynamo-platform-0.8.0`
`dynamo-platform-0.7.1`
`dynamo-platform-0.7.0`
`dynamo-platform-0.6.1`
`dynamo-platform-0.6.0`

dynamo-graph (Helm chart)

Chart	Notes
`dynamo-graph-0.8.1`
`dynamo-graph-0.8.0`
`dynamo-graph-0.7.1`
`dynamo-graph-0.7.0`
`dynamo-graph-0.6.1`
`dynamo-graph-0.6.0`

Rust Crates

crates.io: dynamo-runtime | dynamo-llm | dynamo-async-openai | dynamo-parsers | dynamo-memory | dynamo-config

To access a specific version: https://crates.io/crates/{crate}/{version}

dynamo-runtime (crate)

Crate	MSRV (Rust)	Notes
`dynamo-runtime@0.8.1`	`v1.82`
`dynamo-runtime@0.8.0`	`v1.82`
`dynamo-runtime@0.7.1`	`v1.82`
`dynamo-runtime@0.7.0`	`v1.82`
`dynamo-runtime@0.6.1`	`v1.82`
`dynamo-runtime@0.6.0`	`v1.82`

dynamo-llm (crate)

Crate	MSRV (Rust)	Notes
`dynamo-llm@0.8.1`	`v1.82`
`dynamo-llm@0.8.0`	`v1.82`
`dynamo-llm@0.7.1`	`v1.82`
`dynamo-llm@0.7.0`	`v1.82`
`dynamo-llm@0.6.1`	`v1.82`
`dynamo-llm@0.6.0`	`v1.82`

dynamo-async-openai (crate)

Crate	MSRV (Rust)	Notes
`dynamo-async-openai@0.8.1`	`v1.82`
`dynamo-async-openai@0.8.0`	`v1.82`
`dynamo-async-openai@0.7.1`	`v1.82`
`dynamo-async-openai@0.7.0`	`v1.82`
`dynamo-async-openai@0.6.1`	`v1.82`
`dynamo-async-openai@0.6.0`	`v1.82`

dynamo-parsers (crate)

Crate	MSRV (Rust)	Notes
`dynamo-parsers@0.8.1`	`v1.82`
`dynamo-parsers@0.8.0`	`v1.82`
`dynamo-parsers@0.7.1`	`v1.82`
`dynamo-parsers@0.7.0`	`v1.82`
`dynamo-parsers@0.6.1`	`v1.82`
`dynamo-parsers@0.6.0`	`v1.82`

dynamo-memory (crate)

Crate	MSRV (Rust)	Notes
`dynamo-memory@0.8.1`	`v1.82`
`dynamo-memory@0.8.0`	`v1.82`	Initial

dynamo-config (crate)

Crate	MSRV (Rust)	Notes
`dynamo-config@0.8.1`	`v1.82`
`dynamo-config@0.8.0`	`v1.82`	Initial

FilesExpand file tree

release-artifacts.md

Latest commit

History

release-artifacts.md

File metadata and controls

Dynamo Release Artifacts

Current Release: Dynamo v0.8.1

Patch Release: v0.8.1.post1 (Jan 23, 2026)

Container Images

Python Wheels

Helm Charts

Rust Crates

Quick Install Commands

Container Images (NGC)

Python Wheels (PyPI)

Helm Charts (NGC)

Rust Crates (crates.io)

CUDA and Driver Requirements

Known Issues

Known Artifact Issues

Release History

GitHub Releases

Container Images

vllm-runtime

sglang-runtime

tensorrtllm-runtime

dynamo-frontend

kubernetes-operator

Python Wheels

ai-dynamo (wheel)

ai-dynamo-runtime (wheel)

kvbm (wheel)

Helm Charts

dynamo-crds (Helm chart)

dynamo-platform (Helm chart)

dynamo-graph (Helm chart)

Rust Crates

dynamo-runtime (crate)

dynamo-llm (crate)

dynamo-async-openai (crate)

dynamo-parsers (crate)

dynamo-memory (crate)

dynamo-config (crate)