neuralmagic · horheynm · Jun 14, 2024 · Jul 10, 2024
diff --git a/src/compressed_tensors/compressors/model_compressor.py b/src/compressed_tensors/compressors/model_compressor.py
@@ -269,7 +269,14 @@ def decompress(self, model_path: str, model: Module):
             self._replace_weights(dense_gen, model)
 
             def update_status(module):
-                module.quantization_status = QuantizationStatus.FROZEN
+                import torch
+
+                first_param_dtype = next(model.parameters()).dtype
+                if first_param_dtype == torch.float16:
+                    # loading unquantized model
+                    module.quantization_status = QuantizationStatus.INITIALIZED
+                else:
+                    module.quantization_status = QuantizationStatus.FROZEN
 
             model.apply(update_status)
             setattr(model, QUANTIZATION_CONFIG_NAME, self.quantization_config)