From 5f0e785aa40b2a5bbb349f607110593801e1fbf7 Mon Sep 17 00:00:00 2001
From: henrytsui000 <henrytsui000@gmail.com>
Date: Fri, 3 Jan 2025 18:03:25 +0800
Subject: [PATCH] =?UTF-8?q?=F0=9F=91=BD=EF=B8=8F=20[Update]=20HF=5FDemo=20?=
 =?UTF-8?q?due=20to=20new=20converter?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 demo/hf_demo.py | 22 +++++++++++-----------
 1 file changed, 11 insertions(+), 11 deletions(-)

diff --git a/demo/hf_demo.py b/demo/hf_demo.py
index 73ce1c5..0a327a2 100644
--- a/demo/hf_demo.py
+++ b/demo/hf_demo.py
@@ -10,7 +10,7 @@
 from yolo import (
     AugmentationComposer,
     NMSConfig,
-    PostProccess,
+    PostProcess,
     create_converter,
     create_model,
     draw_bboxes,
@@ -20,27 +20,26 @@
 IMAGE_SIZE = (640, 640)
 
 
-def load_model(model_name, device):
+def load_model(model_name):
     model_cfg = OmegaConf.load(f"yolo/config/model/{model_name}.yaml")
     model_cfg.model.auxiliary = {}
     model = create_model(model_cfg, True)
-    model.to(device).eval()
-    return model, model_cfg
+    converter = create_converter(model_cfg.name, model, model_cfg.anchor, IMAGE_SIZE, device)
+    model = model.to(device).eval()
+    return model, converter
 
 
 device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
-model, model_cfg = load_model(DEFAULT_MODEL, device)
-converter = create_converter(model_cfg.name, model, model_cfg.anchor, IMAGE_SIZE, device)
+model, converter = load_model(DEFAULT_MODEL)
 class_list = OmegaConf.load("yolo/config/dataset/coco.yaml").class_list
 
 transform = AugmentationComposer([])
 
 
-def predict(model_name, image, nms_confidence, nms_iou):
+def predict(model_name, image, nms_confidence, nms_iou, max_bbox):
     global DEFAULT_MODEL, model, device, converter, class_list, post_proccess
     if model_name != DEFAULT_MODEL:
-        model, model_cfg = load_model(model_name, device)
-        converter = create_converter(model_cfg.name, model, model_cfg.anchor, IMAGE_SIZE, device)
+        model, converter = load_model(model_name)
         DEFAULT_MODEL = model_name
 
     image_tensor, _, rev_tensor = transform(image)
@@ -48,8 +47,8 @@ def predict(model_name, image, nms_confidence, nms_iou):
     image_tensor = image_tensor.to(device)[None]
     rev_tensor = rev_tensor.to(device)[None]
 
-    nms_config = NMSConfig(nms_confidence, nms_iou)
-    post_proccess = PostProccess(converter, nms_config)
+    nms_config = NMSConfig(nms_confidence, nms_iou, max_bbox)
+    post_proccess = PostProcess(converter, nms_config)
 
     with torch.no_grad():
         predict = model(image_tensor)
@@ -67,6 +66,7 @@ def predict(model_name, image, nms_confidence, nms_iou):
         gradio.components.Image(type="pil", label="Input Image"),
         gradio.components.Slider(0, 1, step=0.01, value=0.5, label="NMS Confidence Threshold"),
         gradio.components.Slider(0, 1, step=0.01, value=0.5, label="NMS IoU Threshold"),
+        gradio.components.Slider(0, 1000, step=10, value=400, label="Max Bounding Box Number"),
     ],
     outputs=gradio.components.Image(type="pil", label="Output Image"),
 )