vllm/moe at c64ee87267c9da7e13a29b80114f353a11e18a20 - vllm

mirror of https://github.com/vllm-project/vllm.git synced 2025-11-12 00:54:47 +08:00

Files

TJian 916836bbfb [FEAT] [ROCm] [Embedding] Add encoder-only model support into ROCm Flash Attention to enable embedding models. (#14664 )

Signed-off-by: tjtanaa <tunjian.tan@embeddedllm.com>

2025-03-12 09:31:19 -07:00

2025-01-27 17:23:08 -07:00

marlin_moe_ops.cu

2024-10-17 19:08:34 +00:00

moe_align_sum_kernels.cu

2025-02-13 18:43:37 -05:00

moe_ops.h

2025-03-12 08:00:28 -04:00

moe_wna16_utils.h

2025-03-10 20:12:40 -04:00

moe_wna16.cu

2025-03-10 20:12:40 -04:00

topk_softmax_kernels.cu

2024-06-09 16:23:30 -04:00

torch_bindings.cpp

2025-03-12 09:31:19 -07:00