[GPTQ Modifier UX] Add default scheme #61

rahul-tuli · 2024-05-21T20:05:59Z

This PR adds a class method in QuantizationScheme, to load a default scheme; this is needed for PR neuralmagic/sparseml#2263

Satrat · 2024-05-21T21:01:59Z

src/compressed_tensors/quantization/quant_scheme.py

+        weights = QuantizationArgs(num_bits=8, symmetric=True)
+
+        # default to 8 bit integer asymmetric quantization
+        input_activations = QuantizationArgs(num_bits=8, symmetric=False)


vLLM only supports symmetric quantization so lets default this to True as well

src/compressed_tensors/quantization/quant_scheme.py

Add default scheme

f7f4338

rahul-tuli mentioned this pull request May 21, 2024

[Feature Branch] Quant modifier UX neuralmagic/sparseml#2263

Merged

7 tasks

Satrat reviewed May 21, 2024

View reviewed changes

bfineran reviewed May 22, 2024

View reviewed changes

src/compressed_tensors/quantization/quant_scheme.py Outdated Show resolved Hide resolved

Apply suggestions from code review

ecb27b8

bfineran approved these changes May 22, 2024

View reviewed changes

bfineran merged commit b76acf4 into main May 22, 2024
1 check passed

bfineran deleted the add-default-scheme branch May 22, 2024 15:35

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[GPTQ Modifier UX] Add default scheme #61

[GPTQ Modifier UX] Add default scheme #61

rahul-tuli commented May 21, 2024

Satrat May 21, 2024

[GPTQ Modifier UX] Add default scheme #61

[GPTQ Modifier UX] Add default scheme #61

Conversation

rahul-tuli commented May 21, 2024

Satrat May 21, 2024

Choose a reason for hiding this comment