pydantic · DouweM · Jan 21, 2026 · Dec 26, 2025 · Dec 26, 2025 · Dec 26, 2025
diff --git a/docs/embeddings.md b/docs/embeddings.md
@@ -241,6 +241,61 @@ embedder = Embedder(
 )
 ```
 
+### VoyageAI
+
+[`VoyageAIEmbeddingModel`][pydantic_ai.embeddings.voyageai.VoyageAIEmbeddingModel] provides access to VoyageAI's embedding models, which are optimized for retrieval with specialized models for code, finance, and legal domains.
+
+#### Install
+
+To use VoyageAI embedding models, you need to install `pydantic-ai-slim` with the `voyageai` optional group:
+
+```bash
+pip/uv-add "pydantic-ai-slim[voyageai]"
+```
+
+#### Configuration
+
+To use `VoyageAIEmbeddingModel`, go to [dash.voyageai.com](https://dash.voyageai.com/) to generate an API key. Once you have the API key, you can set it as an environment variable:
+
+```bash
+export VOYAGE_API_KEY='your-api-key'
+```
+
+You can then use the model:
+
+```python {title="voyageai_embeddings.py"}
+from pydantic_ai import Embedder
+
+embedder = Embedder('voyageai:voyage-3.5')
+
+
+async def main():
+    result = await embedder.embed_query('Hello world')
+    print(len(result.embeddings[0]))
+    #> 1024
+```
+
+_(This example is complete, it can be run "as is" — you'll need to add `asyncio.run(main())` to run `main`)_
+
+See the [VoyageAI Embeddings documentation](https://docs.voyageai.com/docs/embeddings) for available models.
+
+#### VoyageAI-Specific Settings
+
+VoyageAI models support additional settings via [`VoyageAIEmbeddingSettings`][pydantic_ai.embeddings.voyageai.VoyageAIEmbeddingSettings]:
+
+```python {title="voyageai_settings.py"}
+from pydantic_ai import Embedder
+from pydantic_ai.embeddings.voyageai import VoyageAIEmbeddingSettings
+
+embedder = Embedder(
+    'voyageai:voyage-3.5',
+    settings=VoyageAIEmbeddingSettings(
+        dimensions=512,  # Reduce output dimensions
+        voyageai_truncation=True,  # Truncate input if it exceeds context length
+    ),
+)
+```
+
 ### Sentence Transformers (Local)
 
 [`SentenceTransformerEmbeddingModel`][pydantic_ai.embeddings.sentence_transformers.SentenceTransformerEmbeddingModel] runs embeddings locally using the [sentence-transformers](https://www.sbert.net/) library. This is ideal for:

diff --git a/pydantic_ai_slim/pydantic_ai/embeddings/__init__.py b/pydantic_ai_slim/pydantic_ai/embeddings/__init__.py
@@ -44,6 +44,13 @@
         'cohere:embed-english-light-v3.0',
         'cohere:embed-multilingual-v3.0',
         'cohere:embed-multilingual-light-v3.0',
+        'voyageai:voyage-3-large',
+        'voyageai:voyage-3.5',
+        'voyageai:voyage-3.5-lite',
+        'voyageai:voyage-code-3',
+        'voyageai:voyage-finance-2',
+        'voyageai:voyage-law-2',
+        'voyageai:voyage-code-2',
     ],
 )
 """Known model names that can be used with the `model` parameter of [`Embedder`][pydantic_ai.embeddings.Embedder].
@@ -70,14 +77,21 @@ def infer_embedding_model(
     except ValueError as e:
         raise ValueError('You must provide a provider prefix when specifying an embedding model name') from e
 
-    provider = provider_factory(provider_name)
-
     model_kind = provider_name
     if model_kind.startswith('gateway/'):
         from ..providers.gateway import normalize_gateway_provider
 
         model_kind = normalize_gateway_provider(model_kind)
 
+    # Handle models that don't need a provider first
+    if model_kind == 'sentence-transformers':
+        from .sentence_transformers import SentenceTransformerEmbeddingModel
+
+        return SentenceTransformerEmbeddingModel(model_name)
+
+    # For provider-based models, infer the provider
+    provider = provider_factory(provider_name)
+
     if model_kind in (
         'openai',
         # For now, we assume that every chat and completions-compatible provider also
@@ -92,10 +106,10 @@ def infer_embedding_model(
         from .cohere import CohereEmbeddingModel
 
         return CohereEmbeddingModel(model_name, provider=provider)
-    elif model_kind == 'sentence-transformers':
-        from .sentence_transformers import SentenceTransformerEmbeddingModel
+    elif model_kind == 'voyageai':
+        from .voyageai import VoyageAIEmbeddingModel
 
-        return SentenceTransformerEmbeddingModel(model_name)
+        return VoyageAIEmbeddingModel(model_name, provider=provider)
     else:
         raise UserError(f'Unknown embeddings model: {model}')  # pragma: no cover
 

diff --git a/pydantic_ai_slim/pydantic_ai/embeddings/voyageai.py b/pydantic_ai_slim/pydantic_ai/embeddings/voyageai.py
@@ -0,0 +1,169 @@
+from __future__ import annotations
+
+from collections.abc import Sequence
+from dataclasses import dataclass, field
+from typing import Literal, cast
+
+from pydantic_ai.exceptions import ModelAPIError
+from pydantic_ai.providers import Provider, infer_provider
+from pydantic_ai.usage import RequestUsage
+
+from .base import EmbeddingModel, EmbedInputType
+from .result import EmbeddingResult
+from .settings import EmbeddingSettings
+
+try:
+    from voyageai.client_async import AsyncClient
+    from voyageai.error import VoyageError
+except ImportError as _import_error:
+    raise ImportError(
+        'Please install `voyageai` to use the VoyageAI embeddings model, '
+        'you can use the `voyageai` optional group — `pip install "pydantic-ai-slim[voyageai]"`'
+    ) from _import_error
+
+LatestVoyageAIEmbeddingModelNames = Literal[
+    'voyage-3-large',
+    'voyage-3.5',
+    'voyage-3.5-lite',
+    'voyage-code-3',
+    'voyage-finance-2',
+    'voyage-law-2',
+    'voyage-code-2',
+]
+"""Latest VoyageAI embedding models.
+
+See [VoyageAI Embeddings](https://docs.voyageai.com/docs/embeddings)
+for available models and their capabilities.
+"""
+
+VoyageAIEmbeddingModelName = str | LatestVoyageAIEmbeddingModelNames
+"""Possible VoyageAI embedding model names."""
+
+
+class VoyageAIEmbeddingSettings(EmbeddingSettings, total=False):
+    """Settings used for a VoyageAI embedding model request.
+
+    All fields from [`EmbeddingSettings`][pydantic_ai.embeddings.EmbeddingSettings] are supported,
+    plus VoyageAI-specific settings prefixed with `voyageai_`.
+    """
+
+    # ALL FIELDS MUST BE `voyageai_` PREFIXED SO YOU CAN MERGE THEM WITH OTHER MODELS.
+
+    voyageai_truncation: bool
+    """Whether to truncate inputs that exceed the model's context length.
+
+    Defaults to False. If True, inputs that are too long will be truncated.
+    """
+
+
+_MAX_INPUT_TOKENS: dict[VoyageAIEmbeddingModelName, int] = {
+    'voyage-3-large': 32000,
+    'voyage-3.5': 32000,
+    'voyage-3.5-lite': 32000,
+    'voyage-code-3': 32000,
+    'voyage-finance-2': 32000,
+    'voyage-law-2': 16000,
+    'voyage-code-2': 16000,
+}
+
+
+@dataclass(init=False)
+class VoyageAIEmbeddingModel(EmbeddingModel):
+    """VoyageAI embedding model implementation.
+
+    VoyageAI provides state-of-the-art embedding models optimized for
+    retrieval, with specialized models for code, finance, and legal domains.
+
+    Example:
+    ```python
+    from pydantic_ai.embeddings.voyageai import VoyageAIEmbeddingModel
+
+    model = VoyageAIEmbeddingModel('voyage-3.5')
+    ```
+    """
+
+    _model_name: VoyageAIEmbeddingModelName = field(repr=False)
+    _provider: Provider[AsyncClient] = field(repr=False)
+
+    def __init__(
+        self,
+        model_name: VoyageAIEmbeddingModelName,
+        *,
+        provider: Literal['voyageai'] | Provider[AsyncClient] = 'voyageai',
+        settings: EmbeddingSettings | None = None,
+    ):
+        """Initialize a VoyageAI embedding model.
+
+        Args:
+            model_name: The name of the VoyageAI model to use.
+                See [VoyageAI models](https://docs.voyageai.com/docs/embeddings)
+                for available options.
+            provider: The provider to use for authentication and API access. Can be:
+
+                - `'voyageai'` (default): Uses the standard VoyageAI API
+                - A [`VoyageAIProvider`][pydantic_ai.providers.voyageai.VoyageAIProvider] instance
+                  for custom configuration
+            settings: Model-specific [`EmbeddingSettings`][pydantic_ai.embeddings.EmbeddingSettings]
+                to use as defaults for this model.
+        """
+        self._model_name = model_name
+
+        if isinstance(provider, str):
+            provider = infer_provider(provider)
+        self._provider = provider
+
+        super().__init__(settings=settings)
+
+    @property
+    def base_url(self) -> str:
+        """The base URL for the provider API."""
+        return self._provider.base_url
+
+    @property
+    def model_name(self) -> VoyageAIEmbeddingModelName:
+        """The embedding model name."""
+        return self._model_name
+
+    @property
+    def system(self) -> str:
+        """The embedding model provider."""
+        return self._provider.name
+
+    async def embed(
+        self,
+        inputs: str | Sequence[str],
+        *,
+        input_type: EmbedInputType,
+        settings: EmbeddingSettings | None = None,
+    ) -> EmbeddingResult:
+        inputs, settings = self.prepare_embed(inputs, settings)
+        settings = cast(VoyageAIEmbeddingSettings, settings)
+
+        voyageai_input_type = 'document' if input_type == 'document' else 'query'
+
+        try:
+            response = await self._provider.client.embed(
+                texts=list(inputs),
+                model=self.model_name,
+                input_type=voyageai_input_type,
+                truncation=settings.get('voyageai_truncation', False),
+                output_dimension=settings.get('dimensions'),
+            )
+        except VoyageError as e:
+            raise ModelAPIError(model_name=self.model_name, message=str(e)) from e
+
+        return EmbeddingResult(
+            embeddings=response.embeddings,
+            inputs=inputs,
+            input_type=input_type,
+            usage=_map_usage(response.total_tokens),
+            model_name=self.model_name,
+            provider_name=self.system,
+        )
+
+    async def max_input_tokens(self) -> int | None:
+        return _MAX_INPUT_TOKENS.get(self.model_name)
+
+
+def _map_usage(total_tokens: int) -> RequestUsage:
+    return RequestUsage(input_tokens=total_tokens)
diff --git a/pydantic_ai_slim/pydantic_ai/providers/__init__.py b/pydantic_ai_slim/pydantic_ai/providers/__init__.py
@@ -157,6 +157,10 @@ def infer_provider_class(provider: str) -> type[Provider[Any]]:  # noqa: C901
         from .sentence_transformers import SentenceTransformersProvider
 
         return SentenceTransformersProvider
+    elif provider == 'voyageai':
+        from .voyageai import VoyageAIProvider
+
+        return VoyageAIProvider
     else:  # pragma: no cover
         raise ValueError(f'Unknown provider: {provider}')
 

diff --git a/pydantic_ai_slim/pydantic_ai/providers/voyageai.py b/pydantic_ai_slim/pydantic_ai/providers/voyageai.py
@@ -0,0 +1,74 @@
+from __future__ import annotations as _annotations
+
+import os
+
+from pydantic_ai.exceptions import UserError
+from pydantic_ai.providers import Provider
+
+try:
+    from voyageai.client_async import AsyncClient
+except ImportError as _import_error:  # pragma: no cover
+    raise ImportError(
+        'Please install the `voyageai` package to use the VoyageAI provider, '
+        'you can use the `voyageai` optional group — `pip install "pydantic-ai-slim[voyageai]"`'
+    ) from _import_error
+
+
+class VoyageAIProvider(Provider[AsyncClient]):
+    """Provider for VoyageAI API."""
+
+    @property
+    def name(self) -> str:
+        return 'voyageai'
+
+    @property
+    def base_url(self) -> str:
+        return self._client._params.get('base_url') or 'https://api.voyageai.com/v1'  # type: ignore
+
+    @property
+    def client(self) -> AsyncClient:
+        return self._client
+
+    def __init__(
+        self,
+        *,
+        api_key: str | None = None,
+        voyageai_client: AsyncClient | None = None,
+        base_url: str | None = None,
+        max_retries: int = 0,
+        timeout: float | None = None,
+    ) -> None:
+        """Create a new VoyageAI provider.
+
+        Args:
+            api_key: The API key to use for authentication, if not provided, the `VOYAGE_API_KEY` environment variable
+                will be used if available.
+            voyageai_client: An existing
+                [AsyncClient](https://github.com/voyage-ai/voyageai-python)
+                client to use. If provided, `api_key`, `base_url`, `max_retries`, and `timeout` must be `None`/default.
+            base_url: The base URL for the VoyageAI API. Defaults to `https://api.voyageai.com/v1`.
+            max_retries: Maximum number of retries for failed requests.
+            timeout: Request timeout in seconds.
+        """
+        if voyageai_client is not None:
+            assert api_key is None, 'Cannot provide both `voyageai_client` and `api_key`'
+            assert base_url is None, 'Cannot provide both `voyageai_client` and `base_url`'
+            assert max_retries == 0, 'Cannot provide both `voyageai_client` and `max_retries`'
+            assert timeout is None, 'Cannot provide both `voyageai_client` and `timeout`'
+            self._client = voyageai_client
+        else:
+            api_key = api_key or os.getenv('VOYAGE_API_KEY')
+            if not api_key:
+                raise UserError(
+                    'Set the `VOYAGE_API_KEY` environment variable or pass it via `VoyageAIProvider(api_key=...)` '
+                    'to use the VoyageAI provider.'
+                )
+
+            # Only pass base_url if explicitly set; otherwise use VoyageAI's default
+            base_url = base_url or os.getenv('VOYAGE_BASE_URL')
+            self._client = AsyncClient(
+                api_key=api_key,
+                max_retries=max_retries,
+                timeout=timeout,
+                base_url=base_url,
+            )
diff --git a/pydantic_ai_slim/pyproject.toml b/pydantic_ai_slim/pyproject.toml
@@ -78,6 +78,7 @@ mistral = ["mistralai>=1.9.11"]
 bedrock = ["boto3>=1.42.14"]
 huggingface = ["huggingface-hub[inference]>=0.33.5,<1.0.0"]
 sentence-transformers = ["sentence-transformers>=5.2.0"]
+voyageai = ["voyageai>=0.3.2"]
 outlines-transformers = [
     "outlines[transformers]>=1.0.0,<1.3.0; (sys_platform != 'darwin' or platform_machine != 'x86_64')",
     "transformers>=4.0.0",

diff --git a/pyproject.toml b/pyproject.toml
@@ -60,6 +60,7 @@ outlines-mlxlm = ["pydantic-ai-slim[outlines-mlxlm]=={{ version }}; platform_sys
 outlines-sglang = ["pydantic-ai-slim[outlines-sglang]=={{ version }}"]
 outlines-vllm-offline = ["pydantic-ai-slim[outlines-vllm-offline]=={{ version }}"]
 sentence-transformers = ["pydantic-ai-slim[sentence-transformers]=={{ version }}"]
+voyageai = ["pydantic-ai-slim[voyageai]=={{ version }}"]
 
 [project.urls]
 Homepage = "https://ai.pydantic.dev"
@@ -222,6 +223,7 @@ executionEnvironments = [
 exclude = [
     "examples/pydantic_ai_examples/weather_agent_gradio.py",
     "pydantic_ai_slim/pydantic_ai/ext/aci.py",               # aci-sdk is too niche to be added as an (optional) dependency
+    "pydantic_ai_slim/pydantic_ai/embeddings/voyageai.py",   # voyageai package has no type stubs
 ]
 
 [tool.mypy]