Fix config passed to deepseek_eagle

Signed-off-by: Tyler Michael Smith <tlrmchlsmth@gmail.com>
2025-10-20 23:03:52 +08:00 · 2025-09-30 13:03:27 +00:00
2 changed files with 3 additions and 1 deletions
--- a/vllm/model_executor/models/deepseek_eagle.py
+++ b/vllm/model_executor/models/deepseek_eagle.py
@ -50,6 +50,7 @@ class DeepseekV2Model(nn.Module):
            DeepseekV2DecoderLayer(
                vllm_config,
                prefix=maybe_prefix(prefix, f"layers.{i + start_layer_id}"),
+                config=self.config,
            ) for i in range(self.config.num_hidden_layers)
        ])

--- a/vllm/model_executor/models/deepseek_v2.py
+++ b/vllm/model_executor/models/deepseek_v2.py
@ -990,10 +990,11 @@ class DeepseekV2DecoderLayer(nn.Module):
    def __init__(self,
                 vllm_config: VllmConfig,
                 prefix: str,
+                 config: Optional[DeepseekV2Config] = None,
                 topk_indices_buffer: Optional[torch.Tensor] = None) -> None:
        super().__init__()

-        config = vllm_config.model_config.hf_config
+        config = config or vllm_config.model_config.hf_config
        model_config = vllm_config.model_config
        cache_config = vllm_config.cache_config
        quant_config = vllm_config.quant_config