yuanyao-nv
diff --git a/‎docs/Changelog.md
+271-5 b/‎docs/Changelog.md
+271-5
diff --git a/‎docs/Operators.md
+144-18 b/‎docs/Operators.md
+144-18
diff --git a/‎docs/TestCoverage.md
+124-2 b/‎docs/TestCoverage.md
+124-2
diff --git a/‎onnx/backend/test/case/node/cast.py
+59-1 b/‎onnx/backend/test/case/node/cast.py
+59-1
diff --git a/‎onnx/backend/test/case/node/dequantizelinear.py
+22 b/‎onnx/backend/test/case/node/dequantizelinear.py
+22
diff --git a/‎onnx/backend/test/case/node/quantizelinear.py
+38 b/‎onnx/backend/test/case/node/quantizelinear.py
+38
diff --git a/‎onnx/backend/test/data/node/test_cast_BFLOAT16_to_FLOAT/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_cast_BFLOAT16_to_FLOAT/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_cast_DOUBLE_to_FLOAT/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_cast_DOUBLE_to_FLOAT/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_cast_DOUBLE_to_FLOAT16/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_cast_DOUBLE_to_FLOAT16/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_cast_FLOAT16_to_DOUBLE/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_cast_FLOAT16_to_DOUBLE/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_cast_FLOAT16_to_FLOAT/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_cast_FLOAT16_to_FLOAT/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_cast_FLOAT16_to_FLOAT4E2M1/model.onnx
142 Bytes b/‎onnx/backend/test/data/node/test_cast_FLOAT16_to_FLOAT4E2M1/model.onnx
142 Bytes
diff --git a/‎onnx/backend/test/data/node/test_cast_FLOAT16_to_FLOAT4E2M1/test_data_set_0/input_0.pb
+2 b/‎onnx/backend/test/data/node/test_cast_FLOAT16_to_FLOAT4E2M1/test_data_set_0/input_0.pb
+2
diff --git a/‎onnx/backend/test/data/node/test_cast_FLOAT16_to_FLOAT4E2M1/test_data_set_0/output_0.pb
+2 b/‎onnx/backend/test/data/node/test_cast_FLOAT16_to_FLOAT4E2M1/test_data_set_0/output_0.pb
+2
diff --git a/‎onnx/backend/test/data/node/test_cast_FLOAT16_to_FLOAT8E4M3FN/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_cast_FLOAT16_to_FLOAT8E4M3FN/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_cast_FLOAT16_to_FLOAT8E4M3FNUZ/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_cast_FLOAT16_to_FLOAT8E4M3FNUZ/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_cast_FLOAT16_to_FLOAT8E5M2/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_cast_FLOAT16_to_FLOAT8E5M2/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_cast_FLOAT16_to_FLOAT8E5M2FNUZ/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_cast_FLOAT16_to_FLOAT8E5M2FNUZ/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_cast_FLOAT16_to_INT4/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_cast_FLOAT16_to_INT4/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_cast_FLOAT16_to_UINT4/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_cast_FLOAT16_to_UINT4/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_cast_FLOAT4E2M1_to_FLOAT/model.onnx
140 Bytes b/‎onnx/backend/test/data/node/test_cast_FLOAT4E2M1_to_FLOAT/model.onnx
140 Bytes
diff --git a/‎onnx/backend/test/data/node/test_cast_FLOAT4E2M1_to_FLOAT/test_data_set_0/input_0.pb
+2 b/‎onnx/backend/test/data/node/test_cast_FLOAT4E2M1_to_FLOAT/test_data_set_0/input_0.pb
+2
diff --git a/‎onnx/backend/test/data/node/test_cast_FLOAT4E2M1_to_FLOAT/test_data_set_0/output_0.pb
71 Bytes b/‎onnx/backend/test/data/node/test_cast_FLOAT4E2M1_to_FLOAT/test_data_set_0/output_0.pb
71 Bytes
diff --git a/‎onnx/backend/test/data/node/test_cast_FLOAT4E2M1_to_FLOAT16/model.onnx
142 Bytes b/‎onnx/backend/test/data/node/test_cast_FLOAT4E2M1_to_FLOAT16/model.onnx
142 Bytes
diff --git a/‎onnx/backend/test/data/node/test_cast_FLOAT4E2M1_to_FLOAT16/test_data_set_0/input_0.pb
+2 b/‎onnx/backend/test/data/node/test_cast_FLOAT4E2M1_to_FLOAT16/test_data_set_0/input_0.pb
+2
diff --git a/‎onnx/backend/test/data/node/test_cast_FLOAT4E2M1_to_FLOAT16/test_data_set_0/output_0.pb
48 Bytes b/‎onnx/backend/test/data/node/test_cast_FLOAT4E2M1_to_FLOAT16/test_data_set_0/output_0.pb
48 Bytes
diff --git a/‎onnx/backend/test/data/node/test_cast_FLOAT8E4M3FNUZ_to_FLOAT/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_cast_FLOAT8E4M3FNUZ_to_FLOAT/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_cast_FLOAT8E4M3FNUZ_to_FLOAT16/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_cast_FLOAT8E4M3FNUZ_to_FLOAT16/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_cast_FLOAT8E4M3FN_to_FLOAT/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_cast_FLOAT8E4M3FN_to_FLOAT/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_cast_FLOAT8E4M3FN_to_FLOAT16/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_cast_FLOAT8E4M3FN_to_FLOAT16/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_cast_FLOAT8E5M2FNUZ_to_FLOAT/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_cast_FLOAT8E5M2FNUZ_to_FLOAT/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_cast_FLOAT8E5M2FNUZ_to_FLOAT16/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_cast_FLOAT8E5M2FNUZ_to_FLOAT16/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_cast_FLOAT8E5M2_to_FLOAT/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_cast_FLOAT8E5M2_to_FLOAT/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_cast_FLOAT8E5M2_to_FLOAT16/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_cast_FLOAT8E5M2_to_FLOAT16/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_cast_FLOAT_to_BFLOAT16/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_cast_FLOAT_to_BFLOAT16/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_cast_FLOAT_to_DOUBLE/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_cast_FLOAT_to_DOUBLE/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_cast_FLOAT_to_FLOAT16/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_cast_FLOAT_to_FLOAT16/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_cast_FLOAT_to_FLOAT4E2M1/model.onnx
140 Bytes b/‎onnx/backend/test/data/node/test_cast_FLOAT_to_FLOAT4E2M1/model.onnx
140 Bytes
diff --git a/‎onnx/backend/test/data/node/test_cast_FLOAT_to_FLOAT4E2M1/test_data_set_0/input_0.pb
71 Bytes b/‎onnx/backend/test/data/node/test_cast_FLOAT_to_FLOAT4E2M1/test_data_set_0/input_0.pb
71 Bytes
diff --git a/‎onnx/backend/test/data/node/test_cast_FLOAT_to_FLOAT4E2M1/test_data_set_0/output_0.pb
+2 b/‎onnx/backend/test/data/node/test_cast_FLOAT_to_FLOAT4E2M1/test_data_set_0/output_0.pb
+2
diff --git a/‎onnx/backend/test/data/node/test_cast_FLOAT_to_FLOAT8E4M3FN/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_cast_FLOAT_to_FLOAT8E4M3FN/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_cast_FLOAT_to_FLOAT8E4M3FNUZ/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_cast_FLOAT_to_FLOAT8E4M3FNUZ/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_cast_FLOAT_to_FLOAT8E5M2/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_cast_FLOAT_to_FLOAT8E5M2/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_cast_FLOAT_to_FLOAT8E5M2FNUZ/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_cast_FLOAT_to_FLOAT8E5M2FNUZ/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_cast_FLOAT_to_INT4/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_cast_FLOAT_to_INT4/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_cast_FLOAT_to_STRING/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_cast_FLOAT_to_STRING/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_cast_FLOAT_to_UINT4/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_cast_FLOAT_to_UINT4/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_cast_INT4_to_FLOAT/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_cast_INT4_to_FLOAT/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_cast_INT4_to_FLOAT16/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_cast_INT4_to_FLOAT16/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_cast_INT4_to_INT8/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_cast_INT4_to_INT8/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_cast_STRING_to_FLOAT/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_cast_STRING_to_FLOAT/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_cast_UINT4_to_FLOAT/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_cast_UINT4_to_FLOAT/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_cast_UINT4_to_FLOAT16/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_cast_UINT4_to_FLOAT16/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_cast_UINT4_to_UINT8/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_cast_UINT4_to_UINT8/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_cast_no_saturate_FLOAT16_to_FLOAT8E4M3FN/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_cast_no_saturate_FLOAT16_to_FLOAT8E4M3FN/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_cast_no_saturate_FLOAT16_to_FLOAT8E4M3FNUZ/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_cast_no_saturate_FLOAT16_to_FLOAT8E4M3FNUZ/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_cast_no_saturate_FLOAT16_to_FLOAT8E5M2/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_cast_no_saturate_FLOAT16_to_FLOAT8E5M2/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_cast_no_saturate_FLOAT16_to_FLOAT8E5M2FNUZ/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_cast_no_saturate_FLOAT16_to_FLOAT8E5M2FNUZ/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_cast_no_saturate_FLOAT_to_FLOAT8E4M3FN/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_cast_no_saturate_FLOAT_to_FLOAT8E4M3FN/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_cast_no_saturate_FLOAT_to_FLOAT8E4M3FNUZ/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_cast_no_saturate_FLOAT_to_FLOAT8E4M3FNUZ/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_cast_no_saturate_FLOAT_to_FLOAT8E5M2/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_cast_no_saturate_FLOAT_to_FLOAT8E5M2/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_cast_no_saturate_FLOAT_to_FLOAT8E5M2FNUZ/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_cast_no_saturate_FLOAT_to_FLOAT8E5M2FNUZ/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_castlike_BFLOAT16_to_FLOAT/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_castlike_BFLOAT16_to_FLOAT/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_castlike_BFLOAT16_to_FLOAT_expanded/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_castlike_BFLOAT16_to_FLOAT_expanded/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_castlike_DOUBLE_to_FLOAT/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_castlike_DOUBLE_to_FLOAT/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_castlike_DOUBLE_to_FLOAT16/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_castlike_DOUBLE_to_FLOAT16/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_castlike_DOUBLE_to_FLOAT16_expanded/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_castlike_DOUBLE_to_FLOAT16_expanded/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_castlike_DOUBLE_to_FLOAT_expanded/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_castlike_DOUBLE_to_FLOAT_expanded/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_castlike_FLOAT16_to_DOUBLE/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_castlike_FLOAT16_to_DOUBLE/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_castlike_FLOAT16_to_DOUBLE_expanded/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_castlike_FLOAT16_to_DOUBLE_expanded/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_castlike_FLOAT16_to_FLOAT/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_castlike_FLOAT16_to_FLOAT/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_castlike_FLOAT16_to_FLOAT_expanded/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_castlike_FLOAT16_to_FLOAT_expanded/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_castlike_FLOAT8E4M3FNUZ_to_FLOAT/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_castlike_FLOAT8E4M3FNUZ_to_FLOAT/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_castlike_FLOAT8E4M3FNUZ_to_FLOAT_expanded/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_castlike_FLOAT8E4M3FNUZ_to_FLOAT_expanded/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_castlike_FLOAT8E4M3FN_to_FLOAT/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_castlike_FLOAT8E4M3FN_to_FLOAT/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_castlike_FLOAT8E4M3FN_to_FLOAT_expanded/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_castlike_FLOAT8E4M3FN_to_FLOAT_expanded/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_castlike_FLOAT8E5M2FNUZ_to_FLOAT/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_castlike_FLOAT8E5M2FNUZ_to_FLOAT/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_castlike_FLOAT8E5M2FNUZ_to_FLOAT_expanded/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_castlike_FLOAT8E5M2FNUZ_to_FLOAT_expanded/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_castlike_FLOAT8E5M2_to_FLOAT/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_castlike_FLOAT8E5M2_to_FLOAT/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_castlike_FLOAT8E5M2_to_FLOAT_expanded/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_castlike_FLOAT8E5M2_to_FLOAT_expanded/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_castlike_FLOAT_to_BFLOAT16/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_castlike_FLOAT_to_BFLOAT16/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_castlike_FLOAT_to_BFLOAT16_expanded/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_castlike_FLOAT_to_BFLOAT16_expanded/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_castlike_FLOAT_to_DOUBLE/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_castlike_FLOAT_to_DOUBLE/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_castlike_FLOAT_to_DOUBLE_expanded/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_castlike_FLOAT_to_DOUBLE_expanded/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_castlike_FLOAT_to_FLOAT16/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_castlike_FLOAT_to_FLOAT16/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_castlike_FLOAT_to_FLOAT16_expanded/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_castlike_FLOAT_to_FLOAT16_expanded/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_castlike_FLOAT_to_FLOAT8E4M3FN/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_castlike_FLOAT_to_FLOAT8E4M3FN/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_castlike_FLOAT_to_FLOAT8E4M3FNUZ/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_castlike_FLOAT_to_FLOAT8E4M3FNUZ/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_castlike_FLOAT_to_FLOAT8E4M3FNUZ_expanded/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_castlike_FLOAT_to_FLOAT8E4M3FNUZ_expanded/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_castlike_FLOAT_to_FLOAT8E4M3FN_expanded/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_castlike_FLOAT_to_FLOAT8E4M3FN_expanded/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_castlike_FLOAT_to_FLOAT8E5M2/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_castlike_FLOAT_to_FLOAT8E5M2/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_castlike_FLOAT_to_FLOAT8E5M2FNUZ/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_castlike_FLOAT_to_FLOAT8E5M2FNUZ/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_castlike_FLOAT_to_FLOAT8E5M2FNUZ_expanded/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_castlike_FLOAT_to_FLOAT8E5M2FNUZ_expanded/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_castlike_FLOAT_to_FLOAT8E5M2_expanded/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_castlike_FLOAT_to_FLOAT8E5M2_expanded/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_castlike_FLOAT_to_STRING/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_castlike_FLOAT_to_STRING/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_castlike_FLOAT_to_STRING_expanded/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_castlike_FLOAT_to_STRING_expanded/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_castlike_STRING_to_FLOAT/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_castlike_STRING_to_FLOAT/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_castlike_STRING_to_FLOAT_expanded/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_castlike_STRING_to_FLOAT_expanded/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_dequantizelinear/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_dequantizelinear/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_dequantizelinear_axis/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_dequantizelinear_axis/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_dequantizelinear_blocked/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_dequantizelinear_blocked/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_dequantizelinear_e4m3fn/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_dequantizelinear_e4m3fn/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_dequantizelinear_e4m3fn_float16/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_dequantizelinear_e4m3fn_float16/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_dequantizelinear_e4m3fn_zero_point/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_dequantizelinear_e4m3fn_zero_point/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_dequantizelinear_e5m2/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_dequantizelinear_e5m2/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_dequantizelinear_float4e2m1/model.onnx
202 Bytes b/‎onnx/backend/test/data/node/test_dequantizelinear_float4e2m1/model.onnx
202 Bytes
diff --git a/‎onnx/backend/test/data/node/test_dequantizelinear_float4e2m1/test_data_set_0/input_0.pb
+1 b/‎onnx/backend/test/data/node/test_dequantizelinear_float4e2m1/test_data_set_0/input_0.pb
+1
diff --git a/‎onnx/backend/test/data/node/test_dequantizelinear_float4e2m1/test_data_set_0/input_1.pb
17 Bytes b/‎onnx/backend/test/data/node/test_dequantizelinear_float4e2m1/test_data_set_0/input_1.pb
17 Bytes
diff --git a/‎onnx/backend/test/data/node/test_dequantizelinear_float4e2m1/test_data_set_0/input_2.pb
21 Bytes b/‎onnx/backend/test/data/node/test_dequantizelinear_float4e2m1/test_data_set_0/input_2.pb
21 Bytes
diff --git a/‎onnx/backend/test/data/node/test_dequantizelinear_float4e2m1/test_data_set_0/output_0.pb
29 Bytes b/‎onnx/backend/test/data/node/test_dequantizelinear_float4e2m1/test_data_set_0/output_0.pb
29 Bytes
diff --git a/‎onnx/backend/test/data/node/test_dequantizelinear_int16/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_dequantizelinear_int16/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_dequantizelinear_int4/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_dequantizelinear_int4/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_dequantizelinear_uint16/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_dequantizelinear_uint16/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_dequantizelinear_uint4/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_dequantizelinear_uint4/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_quantizelinear/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_quantizelinear/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_quantizelinear_axis/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_quantizelinear_axis/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_quantizelinear_blocked_asymmetric/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_quantizelinear_blocked_asymmetric/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_quantizelinear_blocked_symmetric/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_quantizelinear_blocked_symmetric/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_quantizelinear_e4m3fn/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_quantizelinear_e4m3fn/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_quantizelinear_e5m2/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_quantizelinear_e5m2/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_quantizelinear_float4e2m1/model.onnx
210 Bytes b/‎onnx/backend/test/data/node/test_quantizelinear_float4e2m1/model.onnx
210 Bytes
diff --git a/‎onnx/backend/test/data/node/test_quantizelinear_float4e2m1/test_data_set_0/input_0.pb
59 Bytes b/‎onnx/backend/test/data/node/test_quantizelinear_float4e2m1/test_data_set_0/input_0.pb
59 Bytes
diff --git a/‎onnx/backend/test/data/node/test_quantizelinear_float4e2m1/test_data_set_0/input_1.pb
27 Bytes b/‎onnx/backend/test/data/node/test_quantizelinear_float4e2m1/test_data_set_0/input_1.pb
27 Bytes
diff --git a/‎onnx/backend/test/data/node/test_quantizelinear_float4e2m1/test_data_set_0/input_2.pb
22 Bytes b/‎onnx/backend/test/data/node/test_quantizelinear_float4e2m1/test_data_set_0/input_2.pb
22 Bytes
diff --git a/‎onnx/backend/test/data/node/test_quantizelinear_float4e2m1/test_data_set_0/output_0.pb
+1 b/‎onnx/backend/test/data/node/test_quantizelinear_float4e2m1/test_data_set_0/output_0.pb
+1
diff --git a/‎onnx/backend/test/data/node/test_quantizelinear_int16/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_quantizelinear_int16/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_quantizelinear_int4/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_quantizelinear_int4/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_quantizelinear_uint16/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_quantizelinear_uint16/model.onnx
0 Bytes
diff --git a/‎onnx/backend/test/data/node/test_quantizelinear_uint4/model.onnx
0 Bytes b/‎onnx/backend/test/data/node/test_quantizelinear_uint4/model.onnx
0 Bytes
diff --git a/‎onnx/defs/operator_sets.h
+9-2 b/‎onnx/defs/operator_sets.h
+9-2
@@ -18,7 +18,11 @@
     make_tensor,
     tensor_dtype_to_field,
 )
-from onnx.numpy_helper import float8e4m3_to_float32, float8e5m2_to_float32
+from onnx.numpy_helper import (
+    float8e4m3_to_float32,
+    float8e5m2_to_float32,
+    unpacked_float4e2m1_to_float32,
+)
 
 
 class Cast(Base):
@@ -62,6 +66,10 @@ def export() -> None:
             ("INT4", "FLOAT"),
             ("INT4", "FLOAT16"),
             ("INT4", "INT8"),
+            ("FLOAT4E2M1", "FLOAT"),
+            ("FLOAT4E2M1", "FLOAT16"),
+            ("FLOAT", "FLOAT4E2M1"),
+            ("FLOAT16", "FLOAT4E2M1"),
         ]
 
         vect_float32_to_float8e4m3 = np.vectorize(float32_to_float8e4m3)
@@ -278,7 +286,57 @@ def export() -> None:
                 output_type_proto = onnx.helper.make_tensor_type_proto(
                     getattr(TensorProto, to_type), input_shape
                 )
+            elif from_type == "FLOAT4E2M1" or to_type == "FLOAT4E2M1":
+                np_fp32 = np.array(
+                    [
+                        "0.48",
+                        "0.25",
+                        "1.05",
+                        "-3.5",
+                        "-8",
+                        "9",
+                        "1000000",
+                        "1e-7",
+                        "NaN",
+                        "INF",
+                        "+INF",
+                        "-INF",
+                        "-4",
+                        "0.01",
+                        "-0.0",
+                    ],
+                    dtype=np.float32,
+                )
+                input_shape = (3, 5)
+                if from_type == "FLOAT":
+                    input_values = np_fp32
+                    input = make_tensor(
+                        "x", TensorProto.FLOAT, input_shape, input_values.tolist()
+                    )
+                elif from_type == "FLOAT16":
+                    input_values = np_fp32.astype(np.float16).astype(np.float32)
+                    input = make_tensor(
+                        "x", TensorProto.FLOAT16, input_shape, input_values.tolist()
+                    )
+                elif from_type == "FLOAT4E2M1":
+                    input = make_tensor(
+                        "x", TensorProto.FLOAT4E2M1, input_shape, np_fp32.tolist()
+                    )
+                else:
+                    raise ValueError(
+                        f"Conversion from {from_type} to {to_type} is not tested."
+                    )
 
+                if to_type not in ("FLOAT", "FLOAT16", "FLOAT4E2M1"):
+                    raise ValueError(
+                        f"Conversion from {from_type} to {to_type} is not tested."
+                    )
+                expected = unpacked_float4e2m1_to_float32(
+                    subbyte.float32_to_float4e2m1_unpacked(np_fp32)
+                )
+                output = make_tensor(
+                    "y", getattr(TensorProto, to_type), input_shape, expected.tolist()
+                )
             elif from_type != "STRING":
                 input = np.random.random_sample(shape).astype(
                     helper.tensor_dtype_to_np_dtype(getattr(TensorProto, from_type))
 
@@ -235,6 +235,28 @@ def export_int4() -> None:
             name="test_dequantizelinear_int4",
         )
 
+    @staticmethod
+    def export_float4e2m1() -> None:
+        node = onnx.helper.make_node(
+            "DequantizeLinear",
+            inputs=["x", "x_scale", "x_zero_point"],
+            outputs=["y"],
+            axis=0,
+        )
+
+        # scalar zero point and scale
+        x = make_tensor("x", TensorProto.FLOAT4E2M1, [5], [0, 1, -1, 1.5, -4])
+        x_scale = np.float32(2)
+        x_zero_point = make_tensor("x_zero_point", TensorProto.FLOAT4E2M1, (1,), [0])
+        y = np.array([0, 2, -2, 3, -8], dtype=np.float32)
+
+        expect(
+            node,
+            inputs=[x, x_scale, x_zero_point],
+            outputs=[y],
+            name="test_dequantizelinear_float4e2m1",
+        )
+
     @staticmethod
     def export_blocked() -> None:
         node = onnx.helper.make_node(
 
@@ -276,6 +276,44 @@ def export_int4() -> None:
             name="test_quantizelinear_int4",
         )
 
+    @staticmethod
+    def export_float4e2m1() -> None:
+        node = onnx.helper.make_node(
+            "QuantizeLinear",
+            inputs=["x", "y_scale", "y_zero_point"],
+            outputs=["y"],
+            axis=0,
+        )
+
+        x = np.array(
+            [
+                [0.0, 2.5, 4.8, 8.6],
+                [-30, -20, 6, 9],
+                [-0.0, -2.5, -4.8, -8.6],
+            ]
+        ).astype(np.float32)
+
+        y_scale = np.asarray([2.0, 3.0, 4.0], dtype=np.float32)
+        y_zero_point = make_tensor(
+            "y_zero_point",
+            TensorProto.FLOAT4E2M1,
+            y_scale.shape,
+            np.zeros_like(y_scale),
+        )
+        y = make_tensor(
+            "y",
+            TensorProto.FLOAT4E2M1,
+            x.shape,
+            [0, 1, 2, 4, -6, -6, 2, 3, 0, -0.5, -1, -2],
+        )
+
+        expect(
+            node,
+            inputs=[x, y_scale, y_zero_point],
+            outputs=[y],
+            name="test_quantizelinear_float4e2m1",
+        )
+
     @staticmethod
     def export_blocked_asymmetric() -> None:
         node = onnx.helper.make_node(
 
@@ -0,0 +1,2 @@
+
+*'�o�h�x�������������������B��Bx
@@ -0,0 +1,2 @@
+*
+�w�By
@@ -0,0 +1,2 @@
+*
+�w�Bx
@@ -0,0 +1,2 @@
+*
+�w�Bx
@@ -0,0 +1,2 @@
+*
+�w�By
@@ -0,0 +1 @@
+* :Bx
@@ -0,0 +1 @@
+*	 d�T��By
@@ -1291,11 +1291,18 @@ class OpSet_Onnx_ver22 {
 };
 
 // Iterate over schema from ai.onnx version 23
+class ONNX_OPERATOR_SET_SCHEMA_CLASS_NAME(Onnx, 23, Cast);
+class ONNX_OPERATOR_SET_SCHEMA_CLASS_NAME(Onnx, 23, CastLike);
+class ONNX_OPERATOR_SET_SCHEMA_CLASS_NAME(Onnx, 23, DequantizeLinear);
+class ONNX_OPERATOR_SET_SCHEMA_CLASS_NAME(Onnx, 23, QuantizeLinear);
+
 class OpSet_Onnx_ver23 {
  public:
   static void ForEachSchema(std::function<void(OpSchema&&)> fn) {
-    // TODO: Remove after introducing the first schema to opset 23
-    (void)fn;
+    fn(GetOpSchema<ONNX_OPERATOR_SET_SCHEMA_CLASS_NAME(Onnx, 23, Cast)>());
+    fn(GetOpSchema<ONNX_OPERATOR_SET_SCHEMA_CLASS_NAME(Onnx, 23, CastLike)>());
+    fn(GetOpSchema<ONNX_OPERATOR_SET_SCHEMA_CLASS_NAME(Onnx, 23, DequantizeLinear)>());
+    fn(GetOpSchema<ONNX_OPERATOR_SET_SCHEMA_CLASS_NAME(Onnx, 23, QuantizeLinear)>());
   }
 };