New TensorRT Utilities

ongtw · ongtw · commit 301fab82cc2f · 2022-01-14T10:05:13.000+08:00
diff --git a/bak_convert_tf_to_trt.py b/bak_convert_tf_to_trt.py
@@ -0,0 +1,50 @@
+#from helper import ModelOptimizer
+#import tensorrt as trt
+from tensorflow.python.compiler.tensorrt import trt_convert
+from time import perf_counter
+
+PRECISION = "FP16"
+GPU_RAM_4G = 4000000000
+GPU_RAM_6G = 6000000000
+GPU_RAM_8G = 8000000000
+MPL = "/home/aisg/src/ongtw/PeekingDuck/peekingduck_weights/movenet/multipose_lightning"
+SPL = "/home/aisg/src/ongtw/PeekingDuck/peekingduck_weights/movenet/singlepose_lightning"
+SPT = "/home/aisg/src/ongtw/PeekingDuck/peekingduck_weights/movenet/singlepose_thunder"
+
+model_dir = SPL
+model_out_dir = model_dir + "_fp16"
+
+# dotw: uses helper but error, helper not found...
+#opt_model = ModelOptimizer(model_dir)
+#model_fp16 = opt_model.convert(model_dir + "_fp16", precision=PRECISION)
+
+# dotw: error, create_inference_graph() missing 2 required positional arguments:
+#               'input_graph_def' and 'outputs'
+#trt_convert.create_inference_graph(
+#    input_saved_model_dir = model_dir,
+#    output_saved_model_dir = model_out_dir
+#)
+
+conv_parms = trt_convert.TrtConversionParams(
+    precision_mode = trt_convert.TrtPrecisionMode.FP16,
+    max_workspace_size_bytes = GPU_RAM_4G,
+    max_batch_size = 1
+)
+converter = trt_convert.TrtGraphConverterV2(
+    input_saved_model_dir = model_dir,
+    conversion_params = conv_parms
+)
+
+print("converting model...")
+st = perf_counter()
+converter.convert()
+#converter.build(input_fn = self.my_input_fn)
+et = perf_counter()
+print(f"conversion time = {et - st:.2f} sec")
+
+print("saving  model...")
+st = perf_counter()
+converter.save(model_out_dir)
+et = perf_counter()
+print(f"model saving time = {et - st:.2f} sec")
+
diff --git a/bak_tf2trt_v1.py b/bak_tf2trt_v1.py
@@ -0,0 +1,65 @@
+#from helper import ModelOptimizer
+import tensorrt as trt
+import tensorflow as tf
+from tensorflow.python.compiler.tensorrt import trt_convert
+from time import perf_counter
+
+#
+# dotw: 2021-01-12
+# - FPS increased greatly
+# - accuracy untested
+# - model file size larger
+# - very slow startup time
+# - lots of TF/TRT warnings
+#
+
+print(f"tensorflow version={tf.__version__}")
+print(f"tensorrt version={trt.__version__}")
+
+PRECISION = "FP16"
+GPU_RAM_4G = 4000000000
+GPU_RAM_6G = 6000000000
+GPU_RAM_8G = 8000000000
+MPL = "/home/aisg/src/ongtw/PeekingDuck/peekingduck_weights/movenet/multipose_lightning"
+SPL = "/home/aisg/src/ongtw/PeekingDuck/peekingduck_weights/movenet/singlepose_lightning"
+SPT = "/home/aisg/src/ongtw/PeekingDuck/peekingduck_weights/movenet/singlepose_thunder"
+
+model_dir = SPL
+model_out_dir = model_dir + "_fp16"
+
+# dotw: uses helper but error, helper not found...
+#opt_model = ModelOptimizer(model_dir)
+#model_fp16 = opt_model.convert(model_dir + "_fp16", precision=PRECISION)
+
+# dotw: error, create_inference_graph() missing 2 required positional arguments:
+#               'input_graph_def' and 'outputs'
+#trt_convert.create_inference_graph(
+#    input_saved_model_dir = model_dir,
+#    output_saved_model_dir = model_out_dir
+#)
+
+conv_parms = trt_convert.TrtConversionParams(
+    precision_mode = trt_convert.TrtPrecisionMode.FP16,
+    max_workspace_size_bytes = GPU_RAM_4G,
+)
+converter = trt_convert.TrtGraphConverterV2(
+    input_saved_model_dir = model_dir,
+    conversion_params = conv_parms
+)
+
+print(f"generating {model_out_dir}")
+print("converting original model...")
+st0 = perf_counter()
+converter.convert()
+#converter.build(input_fn = self.my_input_fn)
+et0 = perf_counter()
+print(f"conversion time = {et0 - st0:.2f} sec")
+
+print("saving generated model...")
+st1 = perf_counter()
+converter.save(model_out_dir)
+et1 = perf_counter()
+print(f"save time = {et1 - st1:.2f} sec")
+
+print(f"Total conversion time = {et1 - st0:.2f} sec")
+
diff --git a/check_tensor_gpu.py b/check_tensor_gpu.py
@@ -0,0 +1,13 @@
+from tensorflow.python.client import device_lib
+
+def check_tensor_core_gpu_present():
+    local_device_protos = device_lib.list_local_devices()
+    for line in local_device_protos:
+        if "compute capability" in str(line):
+            compute_capability = float(line.physical_device_desc.split("compute capability: ")[-1])
+            if compute_capability>=7.0:
+                return True
+    
+tensor_core_gpu = check_tensor_core_gpu_present()
+print(f"Tensor Core GPU Present: {tensor_core_gpu}")
+
diff --git a/convert_tf_to_trt.py b/convert_tf_to_trt.py
@@ -0,0 +1,55 @@
+#from helper import ModelOptimizer
+import tensorrt as trt
+import tensorflow as tf
+from tensorflow.python.compiler.tensorrt import trt_convert
+from time import perf_counter
+
+print(f"tensorflow version={tf.__version__}")
+print(f"tensorrt version={trt.__version__}")
+
+PRECISION = "FP16"
+GPU_RAM_4G = 4000000000
+GPU_RAM_6G = 6000000000
+GPU_RAM_8G = 8000000000
+MPL = "/home/aisg/src/ongtw/PeekingDuck/peekingduck_weights/movenet/multipose_lightning"
+SPL = "/home/aisg/src/ongtw/PeekingDuck/peekingduck_weights/movenet/singlepose_lightning"
+SPT = "/home/aisg/src/ongtw/PeekingDuck/peekingduck_weights/movenet/singlepose_thunder"
+
+model_dir = SPT
+model_out_dir = model_dir + "_fp16"
+
+# dotw: uses helper but error, helper not found...
+#opt_model = ModelOptimizer(model_dir)
+#model_fp16 = opt_model.convert(model_dir + "_fp16", precision=PRECISION)
+
+# dotw: error, create_inference_graph() missing 2 required positional arguments:
+#               'input_graph_def' and 'outputs'
+#trt_convert.create_inference_graph(
+#    input_saved_model_dir = model_dir,
+#    output_saved_model_dir = model_out_dir
+#)
+
+conv_parms = trt_convert.TrtConversionParams(
+    precision_mode = trt_convert.TrtPrecisionMode.FP16,
+    max_workspace_size_bytes = GPU_RAM_4G,
+#    max_batch_size = 1
+)
+converter = trt_convert.TrtGraphConverterV2(
+    input_saved_model_dir = model_dir,
+    conversion_params = conv_parms
+)
+
+print(f"generating {model_out_dir}")
+print("converting original model...")
+st = perf_counter()
+converter.convert()
+#converter.build(input_fn = self.my_input_fn)
+et = perf_counter()
+print(f"conversion time = {et - st:.2f} sec")
+
+print("saving generated model...")
+st = perf_counter()
+converter.save(model_out_dir)
+et = perf_counter()
+print(f"save time = {et - st:.2f} sec")
+
diff --git a/mem_usage.cu b/mem_usage.cu
@@ -0,0 +1,20 @@
+#include <stdio.h>
+#include "cuda.h"
+
+int main()
+{
+    float free_m, total_m, used_m;
+    size_t free_t, total_t;
+
+    cudaMemGetInfo(&free_t, &total_t);
+
+    total_m = total_t / 1048576.0;
+    free_m = free_t / 1048576.0 ;
+    used_m = total_m - free_m;
+
+    printf("mem total %.2f MB\n", total_m);
+    printf("mem free  %.2f MB\n", free_m);
+    printf("mem used  %.2f MB\n", used_m);
+
+    return 0;
+}
diff --git a/ram_usage.cu b/ram_usage.cu
@@ -0,0 +1,32 @@
+#include <iostream>
+#include <unistd.h>
+#include "cuda.h"
+
+int main()
+{
+    // show memory usage of GPU
+    size_t free_byte ;
+    size_t total_byte ;
+
+    while (true )
+    {
+        cudaError_t cuda_status = cudaMemGetInfo( &free_byte, &total_byte ) ;
+
+        if ( cudaSuccess != cuda_status ){
+            std::cout << "Error: cudaMemGetInfo fails, "
+                      << cudaGetErrorString(cuda_status) << std::endl;
+            exit(1);
+        }
+
+        double free_db = (double)free_byte ;
+        double total_db = (double)total_byte ;
+        double used_db = total_db - free_db ;
+
+        std::cout << "GPU memory usage: used = " << used_db/1024.0/1024.0 << ", free = "
+                  << free_db/1024.0/1024.0 << " MB, total = " << total_db/1024.0/1024.0 << " MB"
+                  << std::endl; sleep(1);
+        break;
+    }
+
+    return 0;
+}
diff --git a/tf2trt_v1.py b/tf2trt_v1.py
@@ -0,0 +1,115 @@
+import numpy as np
+#import tensorrt as trt
+#import tensorflow as tf
+from tensorflow.python.compiler.tensorrt import trt_convert
+from time import perf_counter
+
+print("TF to TRT Converter v2")
+#print(f"tensorflow version={tf.__version__}")
+#print(f"tensorrt version={trt.__version__}")
+
+#
+# Generator functions
+# Since cannot pass params into generators (Python Error: 'generator' object is not callable),
+# construct different generator types
+#
+def my_input_gen_192():
+    inp = np.zeros((1, 192, 192, 3)).astype(np.int32)
+    yield (inp,)
+
+def my_input_gen_256():
+    inp = np.zeros((1, 256, 256, 3)).astype(np.int32)
+    yield (inp,)
+
+PRECISION = "FP16"
+GPU_RAM_2G = 2000000000
+GPU_RAM_4G = 4000000000
+GPU_RAM_6G = 6000000000
+GPU_RAM_8G = 8000000000
+GPU_RAM = "4G"
+MODEL_PRECISION = {
+    "INT8": trt_convert.TrtPrecisionMode.INT8,
+    "FP16": trt_convert.TrtPrecisionMode.FP16,
+    "FP32": trt_convert.TrtPrecisionMode.FP32,
+}
+MODEL_RAM = {
+    2: 2000000000,
+    4: 4000000000,
+    6: 6000000000,
+    8: 8000000000,
+}
+# Main data structure to store model code and model info
+MODEL_MAP = {
+    "SPL": {
+        "dir": "/home/aisg/src/ongtw/PeekingDuck/peekingduck_weights/movenet/singlepose_lightning",
+        "gen": my_input_gen_192,
+    },
+    "SPT": {
+        "dir": "/home/aisg/src/ongtw/PeekingDuck/peekingduck_weights/movenet/singlepose_thunder",
+        "gen": my_input_gen_256,
+    },
+    "MPL": {
+        "dir": "/home/aisg/src/ongtw/PeekingDuck/peekingduck_weights/movenet/multipose_lightning",
+        "gen": my_input_gen_256,
+    },
+}
+
+
+#
+# Model attribute queries
+#
+def get_model_dir(model_code: str) -> str:
+    the_dir = MODEL_MAP[model_code]["dir"]
+    return the_dir
+
+def get_model_gen(model_code: str):
+    the_gen = MODEL_MAP[model_code]["gen"]
+    return the_gen
+
+def get_model_save_filepath(model_code: str, prec: str, gpu_ram: int) -> str:
+    the_dir = get_model_dir(model_code)
+    the_path = f"{the_dir}_v1_{prec.lower()}_{gpu_ram}GB"
+    return the_path
+
+
+#
+# Main program
+#
+def convert_model(model_code: str, prec: str, gpu_ram: int):
+    model_dir = get_model_dir(model_code)
+    model_save_path = get_model_save_filepath(model_code, prec, gpu_ram)
+    print(f"generating {model_save_path}")
+    # setup converter params
+    conv_parms = trt_convert.TrtConversionParams(
+        precision_mode = MODEL_PRECISION[prec],
+        max_workspace_size_bytes = MODEL_RAM[gpu_ram],
+    )
+    converter = trt_convert.TrtGraphConverterV2(
+        input_saved_model_dir = get_model_dir(model_code),
+        conversion_params = conv_parms
+    )
+    # convert original base model to TF-TRT model
+    print("converting original model...")
+    pc1 = perf_counter()
+    converter.convert()
+    conv_dur = perf_counter() - pc1
+    print(f"conversion time = {conv_dur:.2f} sec")
+    # save model
+    print("saving generated model...")
+    pc3 = perf_counter()
+    converter.save(model_save_path)
+    save_dur = perf_counter() - pc3
+    print(f"save time = {save_dur:.2f} sec")
+    # print time stats
+    total_dur = perf_counter() - pc1
+    print(f"{model_save_path}:")
+    print(f"Conversion time = {conv_dur:.2f} sec")
+    print(f"Save time       = {save_dur:.2f} sec")
+    print(f"Total time      = {total_dur:.2f} sec")
+
+
+if __name__ == "__main__":
+    for model_code in MODEL_MAP.keys():
+        convert_model(model_code, "FP16", 4)
+
+
diff --git a/tf2trt_v2.py b/tf2trt_v2.py
diff --git a/tf2trt_v2_spl.py b/tf2trt_v2_spl.py