added testcases

AkhileshNegi · AkhileshNegi · commit 3f5c0b146ddb · 2026-03-28T10:53:41.000+05:30
diff --git a/backend/app/tests/crud/evaluations/test_processing.py b/backend/app/tests/crud/evaluations/test_processing.py
@@ -6,6 +6,7 @@
 from sqlmodel import Session, select
 
 from app.crud.evaluations.processing import (
+    _extract_batch_error_message,
     check_and_process_evaluation,
     parse_evaluation_output,
     process_completed_embedding_batch,
@@ -653,11 +654,12 @@ async def test_check_and_process_evaluation_completed(
             db, project_id=test_dataset.project_id, use_kaapi_schema=True
         )
 
-        # Create batch job
+        # Create batch job with output file (successful completion)
         batch_job = BatchJob(
             provider="openai",
             provider_batch_id="batch_abc",
             provider_status="completed",
+            provider_output_file_id="output-file-123",
             job_type=BatchJobType.EVALUATION,
             total_items=2,
             status="submitted",
@@ -688,6 +690,12 @@ async def test_check_and_process_evaluation_completed(
         db.refresh(eval_run)
 
         mock_get_batch.return_value = batch_job
+        mock_poll.return_value = {
+            "provider_status": "completed",
+            "provider_output_file_id": "output-file-123",
+            "error_file_id": None,
+            "request_counts": {"total": 2, "completed": 2, "failed": 0},
+        }
         mock_process.return_value = eval_run
 
         mock_openai = MagicMock()
@@ -756,6 +764,111 @@ async def test_check_and_process_evaluation_failed(
         db.refresh(eval_run)
 
         mock_get_batch.return_value = batch_job
+        mock_poll.return_value = {
+            "provider_status": "failed",
+            "provider_output_file_id": None,
+            "error_file_id": None,
+            "error_message": "Provider error",
+            "request_counts": {"total": 2, "completed": 0, "failed": 2},
+        }
+
+        mock_openai = MagicMock()
+        mock_langfuse = MagicMock()
+
+        result = await check_and_process_evaluation(
+            eval_run=eval_run,
+            session=db,
+            openai_client=mock_openai,
+            langfuse=mock_langfuse,
+        )
+
+        assert result["action"] == "failed"
+        assert result["current_status"] == "failed"
+        db.refresh(eval_run)
+        assert eval_run.status == "failed"
+
+    @pytest.mark.asyncio
+    @patch("app.crud.evaluations.processing.get_batch_job")
+    @patch("app.crud.evaluations.processing.poll_batch_status")
+    @patch("app.crud.evaluations.processing.OpenAIBatchProvider")
+    async def test_check_and_process_evaluation_completed_all_requests_failed(
+        self,
+        mock_provider_cls,
+        mock_poll,
+        mock_get_batch,
+        db: Session,
+        test_dataset,
+    ):
+        """Test batch completed but all requests failed — both batch_job and eval_run get error_message."""
+        config = create_test_config(
+            db, project_id=test_dataset.project_id, use_kaapi_schema=True
+        )
+
+        # Create batch job: completed status but NO provider_output_file_id
+        batch_job = BatchJob(
+            provider="openai",
+            provider_batch_id="batch_all_fail",
+            provider_status="completed",
+            job_type=BatchJobType.EVALUATION,
+            total_items=9,
+            status="submitted",
+            organization_id=test_dataset.organization_id,
+            project_id=test_dataset.project_id,
+            inserted_at=now(),
+            updated_at=now(),
+        )
+        db.add(batch_job)
+        db.commit()
+        db.refresh(batch_job)
+
+        eval_run = create_evaluation_run(
+            session=db,
+            run_name="test_run_all_fail",
+            dataset_name=test_dataset.name,
+            dataset_id=test_dataset.id,
+            config_id=config.id,
+            config_version=1,
+            organization_id=test_dataset.organization_id,
+            project_id=test_dataset.project_id,
+        )
+        eval_run.batch_job_id = batch_job.id
+        eval_run.status = "processing"
+        db.add(eval_run)
+        db.commit()
+        db.refresh(eval_run)
+
+        mock_get_batch.return_value = batch_job
+        mock_poll.return_value = {
+            "provider_status": "completed",
+            "provider_output_file_id": None,
+            "error_file_id": "error-file-abc",
+            "request_counts": {"total": 9, "completed": 0, "failed": 9},
+        }
+
+        # Mock the provider instance returned by OpenAIBatchProvider(client=...)
+        # to return realistic error file content
+        error_lines = "\n".join(
+            [
+                json.dumps(
+                    {
+                        "id": f"batch_req_{i}",
+                        "custom_id": f"id-{i}",
+                        "response": {
+                            "status_code": 400,
+                            "body": {
+                                "error": {
+                                    "message": "Unsupported parameter: 'temperature' is not supported with this model.",
+                                }
+                            },
+                        },
+                        "error": None,
+                    }
+                )
+                for i in range(9)
+            ]
+        )
+        mock_provider_instance = mock_provider_cls.return_value
+        mock_provider_instance.download_file.return_value = error_lines
 
         mock_openai = MagicMock()
         mock_langfuse = MagicMock()
@@ -769,8 +882,123 @@ async def test_check_and_process_evaluation_failed(
 
         assert result["action"] == "failed"
         assert result["current_status"] == "failed"
+        assert "temperature" in result["error"]
+        assert "(9/9 requests)" in result["error"]
+
+        # Verify eval_run updated with error
         db.refresh(eval_run)
         assert eval_run.status == "failed"
+        assert "temperature" in eval_run.error_message
+
+        # Verify batch_job updated with error
+        db.refresh(batch_job)
+        assert "temperature" in batch_job.error_message
+        assert "(9/9 requests)" in batch_job.error_message
+
+
+class TestExtractBatchErrorMessage:
+    """Test extracting error messages from OpenAI error files."""
+
+    def test_single_unique_error(self) -> None:
+        """Test error file where all requests have the same error."""
+        error_lines = []
+        for i in range(5):
+            error_lines.append(
+                json.dumps(
+                    {
+                        "id": f"batch_req_{i}",
+                        "custom_id": f"id-{i}",
+                        "response": {
+                            "status_code": 400,
+                            "body": {
+                                "error": {
+                                    "message": "Unsupported parameter: 'temperature' is not supported with this model.",
+                                    "type": "invalid_request_error",
+                                }
+                            },
+                        },
+                        "error": None,
+                    }
+                )
+            )
+        error_content = "\n".join(error_lines)
+
+        mock_provider = MagicMock()
+        mock_provider.download_file.return_value = error_content
+
+        mock_session = MagicMock()
+        mock_batch_job = MagicMock()
+        mock_batch_job.id = 1
+
+        result = _extract_batch_error_message(
+            provider=mock_provider,
+            error_file_id="error-file-123",
+            batch_job=mock_batch_job,
+            session=mock_session,
+        )
+
+        assert "Unsupported parameter" in result
+        assert "(5/5 requests)" in result
+        mock_provider.download_file.assert_called_once_with("error-file-123")
+
+    def test_multiple_unique_errors_picks_most_common(self) -> None:
+        """Test error file with mixed errors; picks the most frequent one."""
+        error_lines = []
+        # 3 requests with temperature error
+        for i in range(3):
+            error_lines.append(
+                json.dumps(
+                    {
+                        "id": f"batch_req_{i}",
+                        "custom_id": f"id-{i}",
+                        "response": {
+                            "status_code": 400,
+                            "body": {
+                                "error": {
+                                    "message": "Unsupported parameter: 'temperature'",
+                                }
+                            },
+                        },
+                        "error": None,
+                    }
+                )
+            )
+        # 1 request with rate limit error
+        error_lines.append(
+            json.dumps(
+                {
+                    "id": "batch_req_3",
+                    "custom_id": "id-3",
+                    "response": {
+                        "status_code": 429,
+                        "body": {
+                            "error": {
+                                "message": "Rate limit exceeded",
+                            }
+                        },
+                    },
+                    "error": None,
+                }
+            )
+        )
+        error_content = "\n".join(error_lines)
+
+        mock_provider = MagicMock()
+        mock_provider.download_file.return_value = error_content
+
+        mock_session = MagicMock()
+        mock_batch_job = MagicMock()
+        mock_batch_job.id = 1
+
+        result = _extract_batch_error_message(
+            provider=mock_provider,
+            error_file_id="error-file-123",
+            batch_job=mock_batch_job,
+            session=mock_session,
+        )
+
+        assert "Unsupported parameter: 'temperature'" in result
+        assert "(3/4 requests)" in result
 
 
 class TestPollAllPendingEvaluations: