wavlab-speech · ftshijt · May 6, 2026 · Jun 16, 2025 · Jun 19, 2025 · Jun 19, 2025
diff --git a/test/test_pipeline/test_asr_match.py b/test/test_pipeline/test_asr_match.py
@@ -4,25 +4,21 @@
 
 import yaml
 
-from versa.scorer_shared import (
-    find_files,
-    list_scoring,
-    load_score_modules,
-    load_summary,
-)
+from versa.scorer_shared import VersaScorer, compute_summary
+from versa.utils_shared import find_files
+from versa.definition import MetricRegistry
+from versa.utterance_metrics.asr_matching import register_asr_match_metric
 
-TEST_INFO = {
-    "asr_match_error_rate": 0.0,
-}
+TEST_INFO = {"asr_match_error_rate": 0.0}
 
 
 def info_update():
-
     # find files
     if os.path.isdir("test/test_samples/test2"):
         gen_files = find_files("test/test_samples/test2")
 
     # find reference file
+    gt_files = None
     if os.path.isdir("test/test_samples/test1"):
         gt_files = find_files("test/test_samples/test1")
 
@@ -31,25 +27,33 @@ def info_update():
     with open("egs/separate_metrics/asr_match.yaml", "r", encoding="utf-8") as f:
         score_config = yaml.full_load(f)
 
-    score_modules = load_score_modules(
+    # Create registry and register ASR-Match metric
+    registry = MetricRegistry()
+    register_asr_match_metric(registry)
+
+    # Initialize VersaScorer with the populated registry
+    scorer = VersaScorer(registry)
+
+    # Load metrics using the new API
+    metric_suite = scorer.load_metrics(
         score_config,
         use_gt=(True if gt_files is not None else False),
         use_gpu=False,
     )
 
     assert len(score_config) > 0, "no scoring function is provided"
 
-    score_info = list_scoring(
-        gen_files, score_modules, gt_files, output_file=None, io="soundfile"
+    # Score utterances using the new API
+    score_info = scorer.score_utterances(
+        gen_files, metric_suite, gt_files, output_file=None, io="soundfile"
     )
-    summary = load_summary(score_info)
-    print("Summary: {}".format(load_summary(score_info)), flush=True)
+
+    summary = compute_summary(score_info)
+    print("Summary: {}".format(summary), flush=True)
 
     for key in summary:
         if math.isinf(TEST_INFO[key]) and math.isinf(summary[key]):
-            # for sir"
             continue
-        # the plc mos is undeterministic
         if abs(TEST_INFO[key] - summary[key]) > 1e-4 and key != "plcmos":
             raise ValueError(
                 "Value issue in the test case, might be some issue in scorer {}".format(

diff --git a/test/test_pipeline/test_srmr.py b/test/test_pipeline/test_srmr.py
@@ -4,16 +4,12 @@
 
 import yaml
 
-from versa.scorer_shared import (
-    find_files,
-    list_scoring,
-    load_score_modules,
-    load_summary,
-)
+from versa.scorer_shared import VersaScorer, compute_summary
+from versa.utils_shared import find_files
+from versa.definition import MetricRegistry
+from versa.utterance_metrics.srmr import register_srmr_metric
 
-TEST_INFO = {
-    "srmr": 0.6123816687905584,
-}
+TEST_INFO = {"srmr": 0.6123816687905584}
 
 
 def info_update():
@@ -23,6 +19,7 @@ def info_update():
         gen_files = find_files("test/test_samples/test2")
 
     # find reference file
+    gt_files = None
     if os.path.isdir("test/test_samples/test1"):
         gt_files = find_files("test/test_samples/test1")
 
@@ -31,26 +28,33 @@ def info_update():
     with open("egs/separate_metrics/srmr.yaml", "r", encoding="utf-8") as f:
         score_config = yaml.full_load(f)
 
-    score_modules = load_score_modules(
+    # Create registry and register SRMR metric
+    registry = MetricRegistry()
+    register_srmr_metric(registry)
+
+    # Initialize VersaScorer with the populated registry
+    scorer = VersaScorer(registry)
+
+    # Load metrics using the new API
+    metric_suite = scorer.load_metrics(
         score_config,
         use_gt=(True if gt_files is not None else False),
         use_gpu=False,
     )
 
     assert len(score_config) > 0, "no scoring function is provided"
 
-    score_info = list_scoring(
-        gen_files, score_modules, gt_files, output_file=None, io="soundfile"
+    # Score utterances using the new API
+    score_info = scorer.score_utterances(
+        gen_files, metric_suite, gt_files, 
+        output_file=None, io="soundfile"
     )
-    summary = load_summary(score_info)
-    print("Summary: {}".format(load_summary(score_info)), flush=True)
+
+    summary = compute_summary(score_info)
+    print("Summary: {}".format(summary), flush=True)
 
     for key in summary:
-        if math.isinf(TEST_INFO[key]) and math.isinf(summary[key]):
-            # for sir"
-            continue
-        # the plc mos is undeterministic
-        if abs(TEST_INFO[key] - summary[key]) > 1e-4 and key != "plcmos":
+        if abs(TEST_INFO[key] - summary[key]) > 1e-4:
             raise ValueError(
                 "Value issue in the test case, might be some issue in scorer {}".format(
                     key

diff --git a/versa/__init__.py b/versa/__init__.py
@@ -50,7 +50,7 @@
     whisper_levenshtein_metric,
     whisper_wer_setup,
 )
-from versa.utterance_metrics.asr_matching import asr_match_metric, asr_match_setup
+from versa.utterance_metrics.asr_matching import ASRMatchMetric, register_asr_match_metric
 from versa.utterance_metrics.audiobox_aesthetics_score import (
     audiobox_aesthetics_score,
     audiobox_aesthetics_setup,
@@ -102,4 +102,4 @@
     speaking_rate_model_setup,
 )
 from versa.utterance_metrics.squim import squim_metric, squim_metric_no_ref
-from versa.utterance_metrics.srmr import srmr_metric
+from versa.utterance_metrics.srmr import SRMRMetric, register_srmr_metric
diff --git a/versa/bin/scorer.py b/versa/bin/scorer.py
@@ -13,11 +13,8 @@
 
 from versa.scorer_shared import (
     audio_loader_setup,
-    corpus_scoring,
-    list_scoring,
-    load_corpus_modules,
-    load_score_modules,
-    load_summary,
+    VersaScorer,
+    compute_summary,
 )
 
 
@@ -141,47 +138,57 @@ def main():
     with open(args.score_config, "r", encoding="utf-8") as f:
         score_config = yaml.full_load(f)
 
-    score_modules = load_score_modules(
+    # Initialize VersaScorer
+    scorer = VersaScorer()
+
+    # Load utterance-level metrics
+    utterance_metrics = scorer.load_metrics(
         score_config,
         use_gt=(True if gt_files is not None else False),
         use_gt_text=(True if text_info is not None else False),
         use_gpu=args.use_gpu,
     )
 
-    if len(score_modules) > 0:
-        score_info = list_scoring(
+    # Perform utterance-level scoring
+    if len(utterance_metrics.metrics) > 0:
+        score_info = scorer.score_utterances(
             gen_files,
-            score_modules,
+            utterance_metrics,
             gt_files,
             text_info,
             output_file=args.output_file,
             io=args.io,
         )
-        logging.info("Summary: {}".format(load_summary(score_info)))
+        logging.info("Summary: {}".format(compute_summary(score_info)))
     else:
         logging.info("No utterance-level scoring function is provided.")
 
-    corpus_score_modules = load_corpus_modules(
+    # Load corpus-level metrics (distributional metrics)
+    corpus_metrics = scorer.load_metrics(
         score_config,
+        use_gt=(True if gt_files is not None else False),
+        use_gt_text=(True if text_info is not None else False),
         use_gpu=args.use_gpu,
-        cache_folder=args.cache_folder,
-        io=args.io,
     )
-    assert (
-        len(corpus_score_modules) > 0 or len(score_modules) > 0
-    ), "no scoring function is provided"
-    if len(corpus_score_modules) > 0:
-        corpus_score_info = corpus_scoring(
-            args.pred,
-            corpus_score_modules,
-            args.gt,
+
+    # Filter for corpus-level metrics and perform corpus scoring  
+    from versa.definition import MetricCategory
+    corpus_suite = corpus_metrics.filter_by_category(MetricCategory.DISTRIBUTIONAL)
+    if len(corpus_suite.metrics) > 0:
+        corpus_score_info = scorer.score_corpus(
+            gen_files,
+            corpus_suite,
+            gt_files,
             text_info,
-            output_file=args.output_file + ".corpus",
+            output_file=args.output_file + ".corpus" if args.output_file else None,
         )
         logging.info("Corpus Summary: {}".format(corpus_score_info))
     else:
         logging.info("No corpus-level scoring function is provided.")
-        return
+
+    # Ensure at least one scoring function is provided
+    if len(utterance_metrics.metrics) == 0 and len(corpus_suite.metrics) == 0:
+        raise ValueError("No scoring function is provided")
 
 
 if __name__ == "__main__":