vllm-project
diff --git a/‎tests/ut/quantization/test_func_wrapper.py‎
Lines changed: 0 additions & 134 deletions b/‎tests/ut/quantization/test_func_wrapper.py‎
Lines changed: 0 additions & 134 deletions
diff --git a/‎vllm_ascend/ops/vocab_parallel_embedding.py‎
Lines changed: 1 addition & 0 deletions b/‎vllm_ascend/ops/vocab_parallel_embedding.py‎
Lines changed: 1 addition & 0 deletions
diff --git a/‎vllm_ascend/quantization/func_wrapper.py‎
Lines changed: 0 additions & 184 deletions b/‎vllm_ascend/quantization/func_wrapper.py‎
Lines changed: 0 additions & 184 deletions
@@ -97,6 +97,7 @@ def __init__(self,
 
         if params_dtype is None:
             params_dtype = torch.get_default_dtype()
+        self.params_dtype = params_dtype
         # Divide the weight matrix along the vocaburaly dimension.
         self.num_added_embeddings = self.num_embeddings - self.org_vocab_size
         self.num_embeddings_per_partition = divide(self.num_embeddings_padded,