resilient-tech · Abdeali099 · Mar 16, 2026 · Mar 16, 2026 · Mar 16, 2026 · Mar 17, 2026
diff --git a/transaction_parser/modules.txt b/transaction_parser/modules.txt
@@ -1 +1,2 @@
-Transaction Parser
+Transaction Parser
+Parser Benchmark
diff --git a/transaction_parser/parser_benchmark/__init__.py b/transaction_parser/parser_benchmark/__init__.py
diff --git a/transaction_parser/parser_benchmark/doctype/__init__.py b/transaction_parser/parser_benchmark/doctype/__init__.py
diff --git a/transaction_parser/parser_benchmark/doctype/parser_benchmark_dataset/__init__.py b/transaction_parser/parser_benchmark/doctype/parser_benchmark_dataset/__init__.py
diff --git a/...tion_parser/parser_benchmark/doctype/parser_benchmark_dataset/parser_benchmark_dataset.js b/...tion_parser/parser_benchmark/doctype/parser_benchmark_dataset/parser_benchmark_dataset.js
@@ -0,0 +1,41 @@
+// Copyright (c) 2026, Resilient Tech and contributors
+// For license information, please see license.txt
+
+frappe.ui.form.on("Parser Benchmark Dataset", {
+	refresh(frm) {
+		if (!frm.is_new()) {
+			frm.add_custom_button(__("Run Benchmark"), () => run_benchmark(frm), __("Actions"));
+		}
+
+		set_pdf_processor_options(frm);
+	},
+});
+
+function run_benchmark(frm) {
+	frappe.call({
+		method: "transaction_parser.parser_benchmark.doctype.parser_benchmark_dataset.parser_benchmark_dataset.run_benchmark",
+		args: { dataset_name: frm.doc.name },
+		freeze: true,
+		freeze_message: __("Queuing benchmark..."),
+		callback(r) {
+			if (r.message) {
+				frappe.msgprint({
+					message: __("Benchmark queued. Redirecting to log..."),
+					alert: true,
+				});
+				frappe.set_route("Form", "Parser Benchmark Log", r.message);
+			}
+		},
+	});
+}
+
+function set_pdf_processor_options(frm) {
+	frappe.call({
+		method: "transaction_parser.transaction_parser.doctype.transaction_parser_settings.transaction_parser_settings.get_pdf_processors",
+		callback(r) {
+			if (r.message) {
+				frm.set_df_property("pdf_processor", "options", r.message);
+			}
+		},
+	});
+}
diff --git a/...on_parser/parser_benchmark/doctype/parser_benchmark_dataset/parser_benchmark_dataset.json b/...on_parser/parser_benchmark/doctype/parser_benchmark_dataset/parser_benchmark_dataset.json
@@ -0,0 +1,133 @@
+{
+ "actions": [],
+ "autoname": "format:PBD-{#####}",
+ "creation": "2026-03-16 00:00:00.000000",
+ "doctype": "DocType",
+ "engine": "InnoDB",
+ "field_order": [
+  "title",
+  "column_break_title",
+  "enabled",
+  "section_break_file",
+  "file",
+  "column_break_file",
+  "transaction_type",
+  "country",
+  "processing_section",
+  "ai_model",
+  "pdf_processor",
+  "column_break_processing",
+  "company",
+  "page_limit"
+ ],
+ "fields": [
+  {
+   "fieldname": "title",
+   "fieldtype": "Data",
+   "label": "Title",
+   "reqd": 1
+  },
+  {
+   "fieldname": "column_break_title",
+   "fieldtype": "Column Break"
+  },
+  {
+   "default": "1",
+   "fieldname": "enabled",
+   "fieldtype": "Check",
+   "label": "Enabled"
+  },
+  {
+   "fieldname": "section_break_file",
+   "fieldtype": "Section Break"
+  },
+  {
+   "fieldname": "file",
+   "fieldtype": "Attach",
+   "label": "File",
+   "reqd": 1
+  },
+  {
+   "fieldname": "column_break_file",
+   "fieldtype": "Column Break"
+  },
+  {
+   "fieldname": "transaction_type",
+   "fieldtype": "Select",
+   "in_list_view": 1,
+   "label": "Transaction Type",
+   "options": "Sales Order\nExpense",
+   "reqd": 1
+  },
+  {
+   "default": "Other",
+   "fieldname": "country",
+   "fieldtype": "Select",
+   "label": "Country",
+   "options": "India\nOther",
+   "reqd": 1
+  },
+  {
+   "fieldname": "processing_section",
+   "fieldtype": "Section Break",
+   "label": "Processing Configuration"
+  },
+  {
+   "fieldname": "ai_model",
+   "fieldtype": "Select",
+   "in_list_view": 1,
+   "label": "AI Model",
+   "options": "DeepSeek Chat\nDeepSeek Reasoner\nOpenAI gpt-4o\nOpenAI gpt-4o-mini\nOpenAI gpt-5\nOpenAI gpt-5-mini\nGoogle Gemini Pro\nGoogle Gemini Flash",
+   "reqd": 1
+  },
+  {
+   "fieldname": "pdf_processor",
+   "fieldtype": "Select",
+   "label": "PDF Processor",
+   "options": "OCRMyPDF\nDocling"
+  },
+  {
+   "fieldname": "column_break_processing",
+   "fieldtype": "Column Break"
+  },
+  {
+   "fieldname": "company",
+   "fieldtype": "Link",
+   "label": "Company",
+   "options": "Company",
+   "reqd": 1
+  },
+  {
+   "fieldname": "page_limit",
+   "fieldtype": "Int",
+   "label": "Page Limit"
+  }
+ ],
+ "index_web_pages_for_search": 1,
+ "links": [],
+ "modified": "2026-03-16 00:00:00.000000",
+ "modified_by": "Administrator",
+ "module": "Parser Benchmark",
+ "name": "Parser Benchmark Dataset",
+ "naming_rule": "Expression",
+ "owner": "Administrator",
+ "permissions": [
+  {
+   "create": 1,
+   "delete": 1,
+   "email": 1,
+   "export": 1,
+   "print": 1,
+   "read": 1,
+   "report": 1,
+   "role": "System Manager",
+   "share": 1,
+   "write": 1
+  }
+ ],
+ "sort_field": "modified",
+ "sort_order": "DESC",
+ "states": [],
+ "title_field": "title",
+ "show_title_field_in_link": 1
+}
diff --git a/...tion_parser/parser_benchmark/doctype/parser_benchmark_dataset/parser_benchmark_dataset.py b/...tion_parser/parser_benchmark/doctype/parser_benchmark_dataset/parser_benchmark_dataset.py
@@ -0,0 +1,59 @@
+# Copyright (c) 2026, Resilient Tech and contributors
+# For license information, please see license.txt
+
+import frappe
+from frappe.model.document import Document
+
+
+class ParserBenchmarkDataset(Document):
+    # begin: auto-generated types
+    # This code is auto-generated. Do not modify anything in this block.
+
+    from typing import TYPE_CHECKING
+
+    if TYPE_CHECKING:
+        from frappe.types import DF
+
+        ai_model: DF.Select
+        company: DF.Link
+        country: DF.Select
+        enabled: DF.Check
+        file: DF.Attach
+        page_limit: DF.Int
+        pdf_processor: DF.Select | None
+        title: DF.Data
+        transaction_type: DF.Select
+    # end: auto-generated types
+
+    pass
+
+
+@frappe.whitelist()
+def run_benchmark(dataset_name: str):
+    """Create a Benchmark Log and enqueue the benchmark run."""
+    frappe.has_permission("Parser Benchmark Dataset", "write", throw=True)
+
+    log = frappe.get_doc(
+        {
+            "doctype": "Parser Benchmark Log",
+            "dataset": dataset_name,
+            "status": "Queued",
+        }
+    ).insert(ignore_permissions=True)
+
+    frappe.db.commit()
+
+    frappe.enqueue(
+        _run_benchmark,
+        log_name=log.name,
+        queue="long",
+        now=frappe.conf.developer_mode,
+    )
+
+    return log.name
+
+
+def _run_benchmark(log_name: str):
+    from transaction_parser.parser_benchmark.runner import BenchmarkRunner
+
+    BenchmarkRunner(log_name).run()
diff --git a/transaction_parser/parser_benchmark/doctype/parser_benchmark_log/__init__.py b/transaction_parser/parser_benchmark/doctype/parser_benchmark_log/__init__.py
diff --git a/transaction_parser/parser_benchmark/doctype/parser_benchmark_log/parser_benchmark_log.js b/transaction_parser/parser_benchmark/doctype/parser_benchmark_log/parser_benchmark_log.js
@@ -0,0 +1,8 @@
+// Copyright (c) 2026, Resilient Tech and contributors
+// For license information, please see license.txt
+
+// frappe.ui.form.on("Parser Benchmark Log", {
+// 	refresh(frm) {
+
+// 	},
+// });