Fix tool use error and cleanup the pipe processing

Neonsy · Neonsy · commit b7d3c5c2383b · 2026-02-12T19:33:34.000+01:00
diff --git a/.changeset/zenmux-native-tools-reliability.md b/.changeset/zenmux-native-tools-reliability.md
@@ -0,0 +1,5 @@
+---
+"kilo-code": patch
+---
+
+Fixed ZenMux tool-calling reliability to avoid repeated "tool not used" loops and preserve transformed request messages.
diff --git a/packages/types/src/providers/zenmux.ts b/packages/types/src/providers/zenmux.ts
@@ -9,6 +9,10 @@ export const zenmuxDefaultModelInfo: ModelInfo = {
 	contextWindow: 200_000,
 	supportsImages: true,
 	supportsPromptCache: true,
+	// kilocode_change start
+	supportsNativeTools: true,
+	defaultToolProtocol: "native",
+	// kilocode_change end
 	inputPrice: 15.0,
 	outputPrice: 75.0,
 	cacheWritesPrice: 18.75,
diff --git a/src/api/providers/__tests__/zenmux-native-tools.spec.ts b/src/api/providers/__tests__/zenmux-native-tools.spec.ts
@@ -0,0 +1,175 @@
+// kilocode_change - new file
+import OpenAI from "openai"
+
+import type { ApiHandlerCreateMessageMetadata } from "../../index"
+import type { ApiHandlerOptions } from "../../../shared/api"
+import { ZenMuxHandler } from "../zenmux"
+
+vi.mock("../fetchers/modelCache", () => ({
+	getModels: vi.fn().mockResolvedValue({}),
+}))
+
+function createMockStream() {
+	return {
+		async *[Symbol.asyncIterator]() {
+			yield {
+				choices: [{ delta: { content: "ok" }, finish_reason: "stop" }],
+				usage: { prompt_tokens: 1, completion_tokens: 1, cost: 0 },
+			}
+		},
+	}
+}
+
+async function consume(generator: AsyncGenerator<unknown>) {
+	for await (const _chunk of generator) {
+		// Consume all chunks
+	}
+}
+
+describe("ZenMuxHandler native tools and message pipeline", () => {
+	const baseOptions: ApiHandlerOptions = {
+		zenmuxApiKey: "test-key",
+		zenmuxModelId: "z-ai/glm-5",
+		zenmuxBaseUrl: "https://test.zenmux.ai/api/v1",
+	}
+
+	it("merges native tool defaults when model cache entry lacks native metadata", () => {
+		const handler = new ZenMuxHandler(baseOptions)
+		;(handler as unknown as { models: Record<string, unknown> }).models = {
+			"z-ai/glm-5": {
+				maxTokens: 8192,
+				contextWindow: 128000,
+				supportsImages: false,
+				supportsPromptCache: false,
+				inputPrice: 0,
+				outputPrice: 0,
+				description: "GLM 5",
+			},
+		}
+
+		const model = handler.getModel()
+		expect(model.info.supportsNativeTools).toBe(true)
+		expect(model.info.defaultToolProtocol).toBe("native")
+	})
+
+	it("passes tools and tool choice to stream creation when task protocol is native", async () => {
+		const handler = new ZenMuxHandler(baseOptions)
+
+		vi.spyOn(handler, "fetchModel").mockResolvedValue({
+			id: "z-ai/glm-5",
+			info: {
+				maxTokens: 8192,
+				contextWindow: 128000,
+				supportsNativeTools: true,
+				supportsImages: false,
+				supportsPromptCache: false,
+				inputPrice: 0,
+				outputPrice: 0,
+				description: "GLM 5",
+			},
+		} as any)
+
+		const streamSpy = vi.spyOn(handler, "createZenMuxStream").mockResolvedValue(createMockStream() as any)
+
+		const tools: OpenAI.Chat.ChatCompletionTool[] = [
+			{
+				type: "function",
+				function: {
+					name: "attempt_completion",
+					description: "Complete the task",
+					parameters: { type: "object", properties: {} },
+				},
+			},
+		]
+		const metadata: ApiHandlerCreateMessageMetadata = {
+			taskId: "task-native",
+			toolProtocol: "native",
+			tools,
+			tool_choice: "auto",
+			parallelToolCalls: true,
+		}
+
+		await consume(handler.createMessage("system", [{ role: "user", content: "hi" }], metadata))
+
+		expect(streamSpy).toHaveBeenCalledTimes(1)
+		expect(streamSpy.mock.calls[0][6]).toEqual(tools)
+		expect(streamSpy.mock.calls[0][7]).toBe("auto")
+		expect(streamSpy.mock.calls[0][8]).toBe(true)
+	})
+
+	it("omits tools when task protocol is xml even if tools are provided", async () => {
+		const handler = new ZenMuxHandler(baseOptions)
+
+		vi.spyOn(handler, "fetchModel").mockResolvedValue({
+			id: "z-ai/glm-5",
+			info: {
+				maxTokens: 8192,
+				contextWindow: 128000,
+				supportsNativeTools: true,
+				supportsImages: false,
+				supportsPromptCache: false,
+				inputPrice: 0,
+				outputPrice: 0,
+				description: "GLM 5",
+			},
+		} as any)
+
+		const streamSpy = vi.spyOn(handler, "createZenMuxStream").mockResolvedValue(createMockStream() as any)
+
+		const tools: OpenAI.Chat.ChatCompletionTool[] = [
+			{
+				type: "function",
+				function: {
+					name: "ask_followup_question",
+					description: "Ask a follow-up question",
+					parameters: { type: "object", properties: {} },
+				},
+			},
+		]
+
+		await consume(
+			handler.createMessage("system", [{ role: "user", content: "hi" }], {
+				taskId: "task-xml",
+				toolProtocol: "xml",
+				tools,
+				tool_choice: "auto",
+				parallelToolCalls: true,
+			}),
+		)
+
+		expect(streamSpy).toHaveBeenCalledTimes(1)
+		expect(streamSpy.mock.calls[0][6]).toBeUndefined()
+		expect(streamSpy.mock.calls[0][7]).toBeUndefined()
+		expect(streamSpy.mock.calls[0][8]).toBe(false)
+	})
+
+	it("passes transformed DeepSeek R1 messages into stream creation", async () => {
+		const handler = new ZenMuxHandler({
+			...baseOptions,
+			zenmuxModelId: "deepseek/deepseek-r1",
+		})
+
+		vi.spyOn(handler, "fetchModel").mockResolvedValue({
+			id: "deepseek/deepseek-r1",
+			info: {
+				maxTokens: 8192,
+				contextWindow: 128000,
+				supportsNativeTools: true,
+				supportsImages: false,
+				supportsPromptCache: false,
+				inputPrice: 0,
+				outputPrice: 0,
+				description: "DeepSeek R1",
+			},
+		} as any)
+
+		const streamSpy = vi.spyOn(handler, "createZenMuxStream").mockResolvedValue(createMockStream() as any)
+
+		await consume(handler.createMessage("system prompt", [{ role: "user", content: "hi" }], { taskId: "task-r1" }))
+
+		expect(streamSpy).toHaveBeenCalledTimes(1)
+		const sentMessages = streamSpy.mock.calls[0][1] as OpenAI.Chat.ChatCompletionMessageParam[]
+		expect(sentMessages.some((message: any) => message.role === "system")).toBe(false)
+		expect((sentMessages[0] as any).role).toBe("user")
+	})
+})
diff --git a/src/api/providers/fetchers/__tests__/zenmux.spec.ts b/src/api/providers/fetchers/__tests__/zenmux.spec.ts
@@ -34,6 +34,8 @@ describe("getZenmuxModels", () => {
 			contextWindow: 200000,
 			supportsImages: true,
 			supportsPromptCache: false,
+			supportsNativeTools: true,
+			defaultToolProtocol: "native",
 			inputPrice: 0,
 			outputPrice: 0,
 			description: "anthropic model",
@@ -62,5 +64,7 @@ describe("getZenmuxModels", () => {
 
 		expect(models["openai/gpt-5"].contextWindow).toBe(zenmuxDefaultModelInfo.contextWindow)
 		expect(models["openai/gpt-5"].displayName).toBe("openai/gpt-5")
+		expect(models["openai/gpt-5"].supportsNativeTools).toBe(true)
+		expect(models["openai/gpt-5"].defaultToolProtocol).toBe("native")
 	})
 })
diff --git a/src/api/providers/fetchers/zenmux.ts b/src/api/providers/fetchers/zenmux.ts
@@ -58,6 +58,10 @@ export async function getZenmuxModels(
 				contextWindow,
 				supportsImages: input_modalities?.includes("image") ?? false,
 				supportsPromptCache: false,
+				// kilocode_change start
+				supportsNativeTools: true,
+				defaultToolProtocol: "native",
+				// kilocode_change end
 				inputPrice: 0,
 				outputPrice: 0,
 				description: `${owned_by || "ZenMux"} model`,
diff --git a/src/api/providers/zenmux.ts b/src/api/providers/zenmux.ts
@@ -2,7 +2,7 @@
 import OpenAI from "openai"
 import type Anthropic from "@anthropic-ai/sdk"
 import type { ModelInfo } from "@roo-code/types"
-import { zenmuxDefaultModelId, zenmuxDefaultModelInfo } from "@roo-code/types"
+import { NATIVE_TOOL_DEFAULTS, TOOL_PROTOCOL, zenmuxDefaultModelId, zenmuxDefaultModelInfo } from "@roo-code/types"
 import { ApiProviderError } from "@roo-code/types"
 import { TelemetryService } from "@roo-code/telemetry"
 
@@ -24,7 +24,6 @@ import { ChatCompletionTool } from "openai/resources"
 import { convertToOpenAiMessages } from "../transform/openai-format"
 import { convertToR1Format } from "../transform/r1-format"
 import { resolveToolProtocol } from "../../utils/resolveToolProtocol"
-import { TOOL_PROTOCOL } from "@roo-code/types"
 import { ApiStreamChunk } from "../transform/stream"
 import { NativeToolCallParser } from "../../core/assistant-message/NativeToolCallParser"
 import { KiloCodeChunkSchema } from "./kilocode/chunk-schema"
@@ -117,21 +116,16 @@ export class ZenMuxHandler extends BaseProvider implements SingleCompletionHandl
 	}
 	async createZenMuxStream(
 		client: OpenAI,
-		systemPrompt: string,
-		messages: Anthropic.Messages.MessageParam[],
+		openAiMessages: OpenAI.Chat.ChatCompletionMessageParam[],
 		model: { id: string; info: ModelInfo },
 		_reasoningEffort?: string,
 		thinkingBudgetTokens?: number,
 		zenMuxProviderSorting?: string,
 		tools?: Array<ChatCompletionTool>,
+		toolChoice?: OpenAI.Chat.ChatCompletionCreateParams["tool_choice"],
+		parallelToolCalls: boolean = false,
 		_geminiThinkingLevel?: string,
 	) {
-		// Convert Anthropic messages to OpenAI format
-		const openAiMessages: OpenAI.Chat.ChatCompletionMessageParam[] = [
-			{ role: "system", content: systemPrompt },
-			...convertToOpenAiMessages(messages),
-		]
-
 		// Build reasoning config if thinking budget is set
 		let reasoning: { max_tokens: number } | undefined
 		if (thinkingBudgetTokens && thinkingBudgetTokens > 0) {
@@ -155,16 +149,20 @@ export class ZenMuxHandler extends BaseProvider implements SingleCompletionHandl
 						},
 					}
 				: {}),
-			...this.getOpenAIToolParams(tools),
+			...this.getOpenAIToolParams(tools, toolChoice, parallelToolCalls),
 		})
 
 		return stream
 	}
-	getOpenAIToolParams(tools?: ChatCompletionTool[], enableParallelToolCalls: boolean = false) {
+	getOpenAIToolParams(
+		tools?: ChatCompletionTool[],
+		toolChoice?: OpenAI.Chat.ChatCompletionCreateParams["tool_choice"],
+		enableParallelToolCalls: boolean = false,
+	) {
 		return tools?.length
 			? {
 					tools,
-					tool_choice: tools ? "auto" : undefined,
+					tool_choice: toolChoice ?? "auto",
 					parallel_tool_calls: enableParallelToolCalls ? true : false,
 				}
 			: {
@@ -219,7 +217,9 @@ export class ZenMuxHandler extends BaseProvider implements SingleCompletionHandl
 		}
 
 		// Process reasoning_details when switching models to Gemini for native tool call compatibility
-		const toolProtocol = resolveToolProtocol(this.options, model.info)
+		// kilocode_change start
+		const toolProtocol = resolveToolProtocol(this.options, model.info, metadata?.toolProtocol)
+		// kilocode_change end
 		const isNativeProtocol = toolProtocol === TOOL_PROTOCOL.NATIVE
 		const isGemini = modelId.startsWith("google/gemini")
 
@@ -264,17 +264,24 @@ export class ZenMuxHandler extends BaseProvider implements SingleCompletionHandl
 			}
 		}
 
+		// kilocode_change start
+		const tools = isNativeProtocol ? metadata?.tools : undefined
+		const toolChoice = isNativeProtocol ? metadata?.tool_choice : undefined
+		const parallelToolCalls = isNativeProtocol ? (metadata?.parallelToolCalls ?? false) : false
+		// kilocode_change end
+
 		let stream
 		try {
 			stream = await this.createZenMuxStream(
 				this.client,
-				systemPrompt,
-				messages,
+				openAiMessages,
 				model,
 				this.options.reasoningEffort,
 				this.options.modelMaxThinkingTokens,
 				this.options.zenmuxProviderSort,
-				metadata?.tools,
+				tools,
+				toolChoice,
+				parallelToolCalls,
 			)
 		} catch (error) {
 			const errorMessage = error instanceof Error ? error.message : String(error)
@@ -447,7 +454,9 @@ export class ZenMuxHandler extends BaseProvider implements SingleCompletionHandl
 
 	override getModel() {
 		const id = this.options.zenmuxModelId ?? zenmuxDefaultModelId
-		let info = this.models[id] ?? zenmuxDefaultModelInfo
+		// kilocode_change start
+		let info = { ...NATIVE_TOOL_DEFAULTS, ...(this.models[id] ?? zenmuxDefaultModelInfo) }
+		// kilocode_change end
 
 		const isDeepSeekR1 = id.startsWith("deepseek/deepseek-r1") || id === "perplexity/sonar-reasoning"
 

-Original file line number
+Diff line change
@@ @@ -0,0 +1,5 @@ @@
 +---
 +"kilo-code": patch
 +---
++
 +Fixed ZenMux tool-calling reliability to avoid repeated "tool not used" loops and preserve transformed request messages.