NOAA-GFDL · kiihne-noaa · Feb 18, 2026 · Feb 25, 2026 · Feb 25, 2026 · Feb 26, 2026
diff --git a/src/epmt/epmt_query.py b/src/epmt/epmt_query.py
@@ -1107,7 +1107,6 @@ def get_refmodels(name=None, tag={}, fltr=None, limit=0, order=None, before=None
     # we assume the user wants the output in the form of a list of dicts
     return out_list
 
-
 # This function computes a dict such as:
 # for univariate classifiers:
 #
@@ -1158,7 +1157,6 @@ def _refmodel_scores(col, methods, features):
     return ret
 #
 
-
 @db_session
 def create_refmodel(jobs, name=None, tag={}, op_tags=[],
                     methods=[],
@@ -1274,6 +1272,8 @@ def create_refmodel(jobs, name=None, tag={}, op_tags=[],
 
     if isinstance(tag, str):
         tag = tag_from_string(tag)
+    elif tag is None:
+        tag = {}
 
     methods = methods or uvod_classifiers()
 
@@ -1361,6 +1361,8 @@ def create_refmodel(jobs, name=None, tag={}, op_tags=[],
         info_dict['pca'] = {'inp_features': orig_features, 'out_features': pca_features}
 
     # now save the ref model
+    save_refmodel(ReferenceModel, jobs=jobs, computed=computed, info_dict = info_dict, enabled=enabled, name=name, tags=tag, op_tags=op_tags, fmt=fmt)
+'''
     r = orm_create(ReferenceModel, jobs=jobs, name=name, tags=tag, op_tags=op_tags,
                    computed=computed, info_dict = info_dict, enabled=enabled)
     orm_commit()
@@ -1370,9 +1372,18 @@ def create_refmodel(jobs, name=None, tag={}, op_tags=[],
         return r.id
     r_dict = orm_to_dict(r, with_collections=True)
     return pd.Series(r_dict) if fmt == 'pandas' else r_dict
-
+'''
 # returns the number of models deleted.
-
+#jobs, computed, info_dict, and enabled can all be retrieved from the ReferenceModel object
+def save_refmodel(ReferenceModel, jobs, computed, info_dict, enabled, name=None, tags={}, op_tags=[], fmt='dict'):
+    r = orm_create(ReferenceModel, jobs=jobs, computed=computed, info_dict = info_dict, enabled=enabled, name=name, tags=tags, op_tags=op_tags)
+    orm_commit()
+    if fmt == 'orm':
+        return r
+    elif fmt == 'terse':
+        return r.id
+    r_dict = orm_to_dict(r, with_collections=True)
+    return pd.Series(r_dict) if fmt == 'pandas' else r_dict
 
 @db_session
 def delete_refmodels(*ref_ids):

diff --git a/test_save_refmodel.py b/test_save_refmodel.py
@@ -0,0 +1,23 @@
+import numpy as np
+import epmt
+from epmt import epmt_query
+# epmt_outliers contains the EPMT Outlier Detection API
+from epmt import epmt_outliers as eod
+# epmt_stat contains statistical functions
+from epmt import epmt_stat as es
+from epmt import epmt_query as eq
+from epmt.orm import *
+import pandas
+from pandas import DataFrame
+
+feature_list = [ 'duration', 'rchar', 'syscr', 'syscw', 'wchar', 'cstime', 'cutime', 'majflt', 'cpu_time', 'minflt', 'rssmax', 'cmajflt','cminflt', 'inblock', 'outblock', 'usertime', 'num_procs', 'starttime', 'vol_ctxsw', 'read_bytes', 'systemtime', 'time_oncpu', 'timeslices', 'invol_ctxsw', 'write_bytes', 'time_waiting', 'cancelled_write_bytes']
+random_jobs =  eq.get_jobs(limit = 100, fmt = 'dict', trigger_post_process=False)
+
+try:
+    r = eq.get_refmodels("bronx_test_model")
+    eq.delete_refmodels(r[0]['id'])
+finally:
+    print("ready for new bronx model")
+r = eq.create_refmodel(random_jobs, methods=es.mvod_classifiers(), features = feature_list, name = "bronx_test_model")
+
+eq.save_refmodel(ReferenceModel, r['jobs'], r['computed'], r['info_dict'], r['enabled'], name='test_name', tag={}, op_tags=[])
-
-feature_list = [ 'duration', 'rchar', 'syscr', 'syscw', 'wchar', 'cstime', 'cutime', 'majflt', 'cpu_time', 'minflt', 'rssmax', 'cmajflt','cminflt', 'inblock', 'outblock', 'usertime', 'num_procs', 'starttime', 'vol_ctxsw', 'read_bytes', 'systemtime', 'time_oncpu', 'timeslices', 'invol_ctxsw', 'write_bytes', 'time_waiting', 'cancelled_write_bytes']
-random_jobs =  eq.get_jobs(limit = 100, fmt = 'dict', trigger_post_process=False)
-
-try:
-    r = eq.get_refmodels("bronx_test_model")
-    eq.delete_refmodels(r[0]['id'])
-finally:
-    print("ready for new bronx model")
-r = eq.create_refmodel(random_jobs, methods=es.mvod_classifiers(), features = feature_list, name = "bronx_test_model")
-
-eq.save_refmodel(ReferenceModel, r['jobs'], r['computed'], r['info_dict'], r['enabled'], name='test_name', tag={}, op_tags=[])
+import uuid
+
+feature_list = [ 'duration', 'rchar', 'syscr', 'syscw', 'wchar', 'cstime', 'cutime', 'majflt', 'cpu_time', 'minflt', 'rssmax', 'cmajflt','cminflt', 'inblock', 'outblock', 'usertime', 'num_procs', 'starttime', 'vol_ctxsw', 'read_bytes', 'systemtime', 'time_oncpu', 'timeslices', 'invol_ctxsw', 'write_bytes', 'time_waiting', 'cancelled_write_bytes']
+
+
+def test_save_refmodel_persists_refmodel():
+    """
+    Integration-style test that creates a reference model, saves it,
+    verifies it can be retrieved, and then cleans it up.
+    """
+    model_name = "bronx_test_model_" + uuid.uuid4().hex
+
+    random_jobs = eq.get_jobs(limit=100, fmt='dict', trigger_post_process=False)
+
+    r = eq.create_refmodel(
+        random_jobs,
+        methods=es.mvod_classifiers(),
+        features=feature_list,
+        name=model_name,
+    )
+
+    try:
+        eq.save_refmodel(
+            ReferenceModel,
+            r['jobs'],
+            r['computed'],
+            r['info_dict'],
+            r['enabled'],
+            name=model_name,
+            tags={},
+            op_tags=[],
+        )
+
+        saved_models = eq.get_refmodels(model_name)
+        assert saved_models, "Expected at least one saved reference model"
+    finally:
+        # Clean up only the models created for this test
+        try:
+            models_to_delete = eq.get_refmodels(model_name)
+        except Exception:
+            models_to_delete = []
+        for m in models_to_delete:
+            if 'id' in m:
+                eq.delete_refmodels(m['id'])
-
-feature_list = [ 'duration', 'rchar', 'syscr', 'syscw', 'wchar', 'cstime', 'cutime', 'majflt', 'cpu_time', 'minflt', 'rssmax', 'cmajflt','cminflt', 'inblock', 'outblock', 'usertime', 'num_procs', 'starttime', 'vol_ctxsw', 'read_bytes', 'systemtime', 'time_oncpu', 'timeslices', 'invol_ctxsw', 'write_bytes', 'time_waiting', 'cancelled_write_bytes']
-random_jobs =  eq.get_jobs(limit = 100, fmt = 'dict', trigger_post_process=False)
-
-try:
-    r = eq.get_refmodels("bronx_test_model")
-    eq.delete_refmodels(r[0]['id'])
-finally:
-    print("ready for new bronx model")
-r = eq.create_refmodel(random_jobs, methods=es.mvod_classifiers(), features = feature_list, name = "bronx_test_model")
-
-eq.save_refmodel(ReferenceModel, r['jobs'], r['computed'], r['info_dict'], r['enabled'], name='test_name', tag={}, op_tags=[])
+import uuid
+
+feature_list = [ 'duration', 'rchar', 'syscr', 'syscw', 'wchar', 'cstime', 'cutime', 'majflt', 'cpu_time', 'minflt', 'rssmax', 'cmajflt','cminflt', 'inblock', 'outblock', 'usertime', 'num_procs', 'starttime', 'vol_ctxsw', 'read_bytes', 'systemtime', 'time_oncpu', 'timeslices', 'invol_ctxsw', 'write_bytes', 'time_waiting', 'cancelled_write_bytes']
+
+
+def test_save_refmodel_persists_refmodel():
+    """
+    Integration-style test that creates a reference model, saves it,
+    verifies it can be retrieved, and then cleans it up.
+    """
+    model_name = "bronx_test_model_" + uuid.uuid4().hex
+
+    random_jobs = eq.get_jobs(limit=100, fmt='dict', trigger_post_process=False)
+
+    r = eq.create_refmodel(
+        random_jobs,
+        methods=es.mvod_classifiers(),
+        features=feature_list,
+        name=model_name,
+    )
+
+    try:
+        eq.save_refmodel(
+            ReferenceModel,
+            r['jobs'],
+            r['computed'],
+            r['info_dict'],
+            r['enabled'],
+            name=model_name,
+            tags={},
+            op_tags=[],
+        )
+
+        saved_models = eq.get_refmodels(model_name)
+        assert saved_models, "Expected at least one saved reference model"
+    finally:
+        # Clean up only the models created for this test
+        try:
+            models_to_delete = eq.get_refmodels(model_name)
+        except Exception:
+            models_to_delete = []
+        for m in models_to_delete:
+            if 'id' in m:
+                eq.delete_refmodels(m['id'])