vllm/cmake at a83a0f92b56b71855dc38e8e3d9809619e58bcd1 - vllm

mirror of https://github.com/vllm-project/vllm.git synced 2025-10-20 23:03:52 +08:00

Files

Akash kaothalkar e515668edf [Hardware][Power] Enable compressed tensor W8A8 INT8 quantization for POWER (#17153 )

Signed-off-by: Akash Kaothalkar <akash.kaothalkar@ibm.com>
Co-authored-by: Akash Kaothalkar <akash.kaothalkar@ibm.com>
Co-authored-by: mgoin <mgoin64@gmail.com>

2025-05-07 22:35:03 -07:00

external_projects

[Perf]Optimize rotary_emb implementation to use Triton operator for improved inference performance (#16457 )

2025-04-25 14:52:28 +08:00

cpu_extension.cmake

[Hardware][Power] Enable compressed tensor W8A8 INT8 quantization for POWER (#17153 )

2025-05-07 22:35:03 -07:00

hipify.py

[Misc] Fix improper placement of SPDX header in scripts (#12694 )

2025-02-03 11:16:59 -08:00

utils.cmake

[NVIDIA] Support nvfp4 quantization (#12784 )

2025-02-12 19:51:51 -08:00