crmne · marckohlbrugge · Aug 12, 2025
diff --git a/docs/batch_requests.md b/docs/batch_requests.md
@@ -0,0 +1,90 @@
+# Batch Request Feature
+
+The batch request feature allows you to generate API request payloads without actually making API calls. This is useful for:
+
+1. **Batch Processing**: Generate multiple request payloads and send them to provider batch endpoints
+2. **Testing**: Verify request payload structure without making API calls
+3. **Debugging**: Inspect the exact payload that would be sent to the provider
+
+## Basic Usage
+
+```ruby
+# Enable batch request mode
+chat = RubyLLM.chat.for_batch_request
+chat.add_message(role: :user, content: "What's 2 + 2?")
+
+# Returns the request payload instead of making an API call
+payload = chat.complete
+# => {:custom_id=>"...", :method=>"POST", :url=>"/v1/chat/completions", :body=>{...}}
+```
+
+## Generating Multiple Batch Requests
+
+```ruby
+requests = []
+
+3.times do |i|
+  chat = RubyLLM.chat.for_batch_request
+  chat.add_message(role: :user, content: "Question #{i + 1}")
+
+  requests << chat.complete
+end
+
+# Now you have an array of request payloads
+# You can format them as JSONL and send to provider batch endpoints
+```
+
+## Provider Support
+
+Currently, only OpenAI supports batch requests. Other providers will raise `NotImplementedError`:
+
+```ruby
+# OpenAI (supported)
+chat = RubyLLM.chat(provider: :openai).for_batch_request
+chat.add_message(role: :user, content: "Hello")
+payload = chat.complete
+# => {
+#      :custom_id=>"request-abc123",
+#      :method=>"POST",
+#      :url=>"/v1/chat/completions",
+#      :body=>{:model=>"gpt-4", :messages=>[...]}
+#    }
+
+# Other providers (not supported)
+chat = RubyLLM.chat(provider: :anthropic).for_batch_request
+chat.add_message(role: :user, content: "Hello")
+chat.complete  # Raises NotImplementedError
+```
+
+## Usage with Other Methods
+
+The `for_batch_request` method chains with other configuration methods:
+
+```ruby
+chat = RubyLLM.chat
+  .with_model('gpt-4')
+  .with_temperature(0.7)
+  .with_tool(MyTool)
+  .for_batch_request
+
+chat.ask("Process this")
+payload = chat.complete  # Returns batch request payload
+```
+
+## Notes
+
+- Streaming is not supported when in batch request mode
+- The batch request payload includes all configured parameters (tools, schema, temperature, etc.)
+- No messages are added to the chat history when generating batch request payloads
+- Providers must explicitly implement `render_payload_for_batch_request` to support this feature
+
+## Future Enhancements
+
+The remaining steps for full batch processing support (to be implemented by users):
+
+2. Combine multiple request payloads (typically in JSONL format)
+3. Submit to provider's batch endpoint
+4. Poll for batch completion status
+5. Process batch results
+
+These steps are provider-specific and can be implemented based on your needs.
diff --git a/lib/ruby_llm/chat.rb b/lib/ruby_llm/chat.rb
@@ -28,6 +28,7 @@ def initialize(model: nil, provider: nil, assume_model_exists: false, context: n
       @params = {}
       @headers = {}
       @schema = nil
+      @batch_request = false
       @on = {
         new_message: nil,
         end_message: nil,
@@ -111,6 +112,11 @@ def with_schema(schema, force: false)
       self
     end
 
+    def for_batch_request
+      @batch_request = true
+      self
+    end
+
     def on_new_message(&block)
       @on[:new_message] = block
       self
@@ -136,6 +142,20 @@ def each(&)
     end
 
     def complete(&) # rubocop:disable Metrics/PerceivedComplexity
+      # If batch_request mode is enabled, render and return the payload
+      if @batch_request
+        raise ArgumentError, 'Streaming is not supported for batch requests' if block_given?
+
+        return @provider.render_payload_for_batch_request(
+          messages,
+          tools: @tools,
+          temperature: @temperature,
+          model: @model.id,
+          params: @params,
+          schema: @schema
+        )
+      end
+
       response = @provider.complete(
         messages,
         tools: @tools,

diff --git a/lib/ruby_llm/provider.rb b/lib/ruby_llm/provider.rb
@@ -62,6 +62,11 @@ def complete(messages, tools:, temperature:, model:, params: {}, headers: {}, sc
       end
     end
 
+    def render_payload_for_batch_request(_messages, tools:, temperature:, model:, params: {}, schema: nil) # rubocop:disable Metrics/ParameterLists
+      raise NotImplementedError, "#{self.class.name} does not support batch requests. " \
+                                 'Provider must implement render_payload_for_batch_request to enable batch request generation.'
+    end
+
     def list_models
       response = @connection.get models_url
       parse_list_models_response response, slug, capabilities

diff --git a/lib/ruby_llm/providers/deepseek.rb b/lib/ruby_llm/providers/deepseek.rb
@@ -16,6 +16,12 @@ def headers
         }
       end
 
+      # DeepSeek doesn't support batch requests yet
+      def render_payload_for_batch_request(_messages, tools:, temperature:, model:, params: {}, schema: nil) # rubocop:disable Metrics/ParameterLists
+        raise NotImplementedError, 'DeepSeek does not support batch requests. ' \
+                                   'Batch request generation is not available for this provider.'
+      end
+
       class << self
         def capabilities
           DeepSeek::Capabilities

diff --git a/lib/ruby_llm/providers/gpustack.rb b/lib/ruby_llm/providers/gpustack.rb
@@ -19,6 +19,12 @@ def headers
         }
       end
 
+      # GPUStack doesn't support batch requests yet
+      def render_payload_for_batch_request(_messages, tools:, temperature:, model:, params: {}, schema: nil) # rubocop:disable Metrics/ParameterLists
+        raise NotImplementedError, 'GPUStack does not support batch requests. ' \
+                                   'Batch request generation is not available for this provider.'
+      end
+
       class << self
         def local?
           true

diff --git a/lib/ruby_llm/providers/mistral.rb b/lib/ruby_llm/providers/mistral.rb
@@ -18,6 +18,12 @@ def headers
         }
       end
 
+      # Mistral doesn't support batch requests yet
+      def render_payload_for_batch_request(_messages, tools:, temperature:, model:, params: {}, schema: nil) # rubocop:disable Metrics/ParameterLists
+        raise NotImplementedError, 'Mistral does not support batch requests. ' \
+                                   'Batch request generation is not available for this provider.'
+      end
+
       class << self
         def capabilities
           Mistral::Capabilities

diff --git a/lib/ruby_llm/providers/ollama.rb b/lib/ruby_llm/providers/ollama.rb
@@ -15,6 +15,12 @@ def headers
         {}
       end
 
+      # Ollama doesn't support batch requests yet
+      def render_payload_for_batch_request(_messages, tools:, temperature:, model:, params: {}, schema: nil) # rubocop:disable Metrics/ParameterLists
+        raise NotImplementedError, 'Ollama does not support batch requests. ' \
+                                   'Batch request generation is not available for this provider.'
+      end
+
       class << self
         def configuration_requirements
           %i[ollama_api_base]

diff --git a/lib/ruby_llm/providers/openai.rb b/lib/ruby_llm/providers/openai.rb
@@ -30,6 +30,32 @@ def maybe_normalize_temperature(temperature, model_id)
         OpenAI::Capabilities.normalize_temperature(temperature, model_id)
       end
 
+      # Override to format payload according to OpenAI's batch request API
+      # https://platform.openai.com/docs/guides/batch
+      def render_payload_for_batch_request(messages, tools:, temperature:, model:, params: {}, schema: nil) # rubocop:disable Metrics/ParameterLists
+        normalized_temperature = maybe_normalize_temperature(temperature, model)
+
+        payload = Utils.deep_merge(
+          params,
+          render_payload(
+            messages,
+            tools: tools,
+            temperature: normalized_temperature,
+            model: model,
+            stream: false,
+            schema: schema
+          )
+        )
+
+        # Format according to OpenAI's batch request API
+        {
+          custom_id: "request-#{SecureRandom.uuid}",
+          method: 'POST',
+          url: '/v1/chat/completions',
+          body: payload
+        }
+      end
+
       class << self
         def capabilities
           OpenAI::Capabilities

diff --git a/lib/ruby_llm/providers/openrouter.rb b/lib/ruby_llm/providers/openrouter.rb
@@ -16,6 +16,12 @@ def headers
         }
       end
 
+      # OpenRouter doesn't support batch requests yet
+      def render_payload_for_batch_request(_messages, tools:, temperature:, model:, params: {}, schema: nil) # rubocop:disable Metrics/ParameterLists
+        raise NotImplementedError, 'OpenRouter does not support batch requests. ' \
+                                   'Batch request generation is not available for this provider.'
+      end
+
       class << self
         def configuration_requirements
           %i[openrouter_api_key]

diff --git a/lib/ruby_llm/providers/perplexity.rb b/lib/ruby_llm/providers/perplexity.rb
@@ -18,6 +18,12 @@ def headers
         }
       end
 
+      # Perplexity doesn't support batch requests yet
+      def render_payload_for_batch_request(_messages, tools:, temperature:, model:, params: {}, schema: nil) # rubocop:disable Metrics/ParameterLists
+        raise NotImplementedError, 'Perplexity does not support batch requests. ' \
+                                   'Batch request generation is not available for this provider.'
+      end
+
       class << self
         def capabilities
           Perplexity::Capabilities

diff --git a/...h_request_workflow_example_can_switch_between_batch_request_and_normal_response_modes.yml b/...h_request_workflow_example_can_switch_between_batch_request_and_normal_response_modes.yml