[Bugfix] Fix lora loading for Compressed Tensors in #9120 (#9179)

2025-10-20 14:53:52 +08:00 · 2024-10-09 05:10:44 -07:00
parent dc4aea677a
commit 21906a6f50
1 changed files with 3 additions and 0 deletions
--- a/vllm/lora/layers.py
+++ b/vllm/lora/layers.py
@ -39,6 +39,9 @@ def _get_lora_device(base_layer: nn.Module) -> torch.device:
    # unquantizedLinear
    if hasattr(base_layer, "weight"):
        return base_layer.weight.device
+    # Compressed Tensor
+    elif hasattr(base_layer, "weight_packed"):
+        return base_layer.weight_packed.device
    # GPTQ/AWQ
    elif hasattr(base_layer, "qweight"):
        return base_layer.qweight.device