fix/openai: non-streaming LLM response (#64473)

olafurpg · web-flow · commit 68e0fb070c4d · 2024-08-19T12:53:55.000+02:00
Fixes CODY-3194 Previously, using `/chat/completions` with OpenAI models always returned an empty completion because we were reading a non-existent `"text"` property instead of the nested `"message": { "content": ...}` property. This PR fixes the bug and adds a test case to demonstrate how we parse a real-world OpenAI response.  ## Test plan See new test cases. I'm failing to get a locally running setup to manually test this e2e, see https://sourcegraph.slack.com/archives/C04MYFW01NV/p1723664513193939  ## Changelog * Fix bug where requests to `/.api/completions/stream` for OpenAI models returned an empty completion when using `stream: false`.
diff --git a/internal/completions/client/openai/openai.go b/internal/completions/client/openai/openai.go
@@ -74,7 +74,7 @@ func (c *openAIChatCompletionStreamClient) Complete(
 		logger.Warn("Failed to count tokens with the token manager %w ", log.Error(err))
 	}
 	return &types.CompletionResponse{
-		Completion: response.Choices[0].Text,
+		Completion: response.Choices[0].Message.Content,
 		StopReason: response.Choices[0].FinishReason,
 	}, nil
 }
@@ -138,7 +138,7 @@ func (c *openAIChatCompletionStreamClient) Stream(
 
 		if len(event.Choices) > 0 {
 			if request.Feature == types.CompletionsFeatureCode {
-				content += event.Choices[0].Text
+				content += event.Choices[0].Message.Content
 			} else {
 				content += event.Choices[0].Delta.Content
 			}
diff --git a/internal/completions/client/openai/openai_test.go b/internal/completions/client/openai/openai_test.go
@@ -25,32 +25,35 @@ func (c *mockDoer) Do(r *http.Request) (*http.Response, error) {
 	return c.do(r)
 }
 
-func TestErrStatusNotOK(t *testing.T) {
-	tokenManager := tokenusage.NewManager()
-	mockClient := NewClient(&mockDoer{
+var compRequest = types.CompletionRequest{
+	Feature: types.CompletionsFeatureChat,
+	Version: types.CompletionsVersionLegacy,
+	ModelConfigInfo: types.ModelConfigInfo{
+		Provider: modelconfigSDK.Provider{
+			ID: modelconfigSDK.ProviderID("xxx-provider-id-xxx"),
+		},
+		Model: modelconfigSDK.Model{
+			ModelRef: modelconfigSDK.ModelRef("provider::apiversion::test-model"),
+		},
+	},
+	Parameters: types.CompletionRequestParameters{
+		RequestedModel: "xxx-requested-model-xxx",
+	},
+}
+
+func NewMockClient(statusCode int, response string) types.CompletionsClient {
+	return NewClient(&mockDoer{
 		func(r *http.Request) (*http.Response, error) {
 			return &http.Response{
-				StatusCode: http.StatusTooManyRequests,
-				Body:       io.NopCloser(bytes.NewReader([]byte("oh no, please slow down!"))),
+				StatusCode: statusCode,
+				Body:       io.NopCloser(bytes.NewReader([]byte(response))),
 			}, nil
 		},
-	}, "", "", *tokenManager)
+	}, "", "", *tokenusage.NewManager())
+}
 
-	compRequest := types.CompletionRequest{
-		Feature: types.CompletionsFeatureChat,
-		Version: types.CompletionsVersionLegacy,
-		ModelConfigInfo: types.ModelConfigInfo{
-			Provider: modelconfigSDK.Provider{
-				ID: modelconfigSDK.ProviderID("xxx-provider-id-xxx"),
-			},
-			Model: modelconfigSDK.Model{
-				ModelRef: modelconfigSDK.ModelRef("provider::apiversion::test-model"),
-			},
-		},
-		Parameters: types.CompletionRequestParameters{
-			RequestedModel: "xxx-requested-model-xxx",
-		},
-	}
+func TestErrStatusNotOK(t *testing.T) {
+	mockClient := NewMockClient(http.StatusTooManyRequests, "oh no, please slow down!")
 
 	t.Run("Complete", func(t *testing.T) {
 		logger := log.Scoped("completions")
@@ -74,3 +77,36 @@ func TestErrStatusNotOK(t *testing.T) {
 		assert.True(t, ok)
 	})
 }
+
+func TestNonStreamingResponseParsing(t *testing.T) {
+	mockClient := NewMockClient(http.StatusOK, `{
+  "id": "chatcmpl-9wEJ9hnLdPcCLrfdZLrRPGOz48Pmo",
+  "object": "chat.completion",
+  "created": 1723665051,
+  "model": "gpt-4o-mini-2024-07-18",
+  "choices": [
+    {
+      "index": 0,
+      "message": {
+        "role": "assistant",
+        "content": "yes",
+        "refusal": null
+      },
+      "logprobs": null,
+      "finish_reason": "stop"
+    }
+  ],
+  "usage": {
+    "prompt_tokens": 15,
+    "completion_tokens": 1,
+    "total_tokens": 16
+  },
+  "system_fingerprint": "fp_48196bc67a"
+}`)
+	logger := log.Scoped("completions")
+	resp, err := mockClient.Complete(context.Background(), logger, compRequest)
+	require.NoError(t, err)
+	assert.NotNil(t, resp)
+	autogold.Expect(&types.CompletionResponse{Completion: "yes", StopReason: "stop"}).Equal(t, resp)
+
+}
diff --git a/internal/completions/client/openai/types.go b/internal/completions/client/openai/types.go
@@ -50,10 +50,14 @@ type openaiChoiceDelta struct {
 	Content string `json:"content"`
 }
 
+type openaiMessage struct {
+	Content string `json:"content"`
+}
+
 type openaiChoice struct {
 	Delta        openaiChoiceDelta `json:"delta"`
+	Message      openaiMessage     `json:"message"`
 	Role         string            `json:"role"`
-	Text         string            `json:"text"`
 	FinishReason string            `json:"finish_reason"`
 }
 

Original file line number	Diff line number	Diff line change
`@@ -74,7 +74,7 @@ func (c *openAIChatCompletionStreamClient) Complete(`
`74`	`74`	`logger.Warn("Failed to count tokens with the token manager %w ", log.Error(err))`
`75`	`75`	`}`
`76`	`76`	`return &types.CompletionResponse{`
`77`		`- Completion: response.Choices[0].Text,`
	`77`	`+ Completion: response.Choices[0].Message.Content,`
`78`	`78`	`StopReason: response.Choices[0].FinishReason,`
`79`	`79`	`}, nil`
`80`	`80`	`}`
`@@ -138,7 +138,7 @@ func (c *openAIChatCompletionStreamClient) Stream(`
`138`	`138`
`139`	`139`	`if len(event.Choices) > 0 {`
`140`	`140`	`if request.Feature == types.CompletionsFeatureCode {`
`141`		`- content += event.Choices[0].Text`
	`141`	`+ content += event.Choices[0].Message.Content`
`142`	`142`	`} else {`
`143`	`143`	`content += event.Choices[0].Delta.Content`
`144`	`144`	`}`
Original file line number	Diff line number	Diff line change
`@@ -50,10 +50,14 @@ type openaiChoiceDelta struct {`
`50`	`50`	Content string `json:"content"`
`51`	`51`	`}`
`52`	`52`
	`53`	`+type openaiMessage struct {`
	`54`	+ Content string `json:"content"`
	`55`	`+}`
	`56`	`+`
`53`	`57`	`type openaiChoice struct {`
`54`	`58`	Delta openaiChoiceDelta `json:"delta"`
	`59`	+ Message openaiMessage `json:"message"`
`55`	`60`	Role string `json:"role"`
`56`		- Text string `json:"text"`
`57`	`61`	FinishReason string `json:"finish_reason"`
`58`	`62`	`}`
`59`	`63`