frozenleaves/vllm - vllm - Gitea: Git for Me

mirror of https://github.com/vllm-project/vllm.git synced 2025-10-20 14:53:52 +08:00

Author	SHA1	Message	Date
Michael Goin	7ef6052804	[CI/Build] Add tool to build vllm-tpu wheel (#19165 ) Signed-off-by: mgoin <michael@neuralmagic.com> Signed-off-by: mgoin <mgoin64@gmail.com>	2025-10-12 16:25:40 -06:00
Michael Goin	c9d33c60dc	[UX] Add FlashInfer as default CUDA dependency (#26443 ) Signed-off-by: mgoin <mgoin64@gmail.com> Co-authored-by: Wentao Ye <44945378+yewentao256@users.noreply.github.com>	2025-10-09 14:10:02 -07:00
elvischenv	5e49c3e777	Bump Flashinfer to v0.4.0 (#26326 ) Signed-off-by: elvischenv <219235043+elvischenv@users.noreply.github.com>	2025-10-08 23:58:44 -07:00
Harry Mellor	d6953beb91	Convert formatting to use `ruff` instead of `yapf` + `isort` (#26247 ) Signed-off-by: Harry Mellor <19981378+hmellor@users.noreply.github.com>	2025-10-05 07:06:22 -07:00
Fadi Arafeh	9705fba7b7	[cpu][perf] Accelerate unquantized-linear for AArch64 through oneDNN/ACL and weight prepack (#25948 ) Signed-off-by: Fadi Arafeh <fadi.arafeh@arm.com> Co-authored-by: Li, Jiang <jiang1.li@intel.com>	2025-10-04 12:16:38 +08:00
Yongye Zhu	fa7e254a7f	[New Model] DeepSeek-V3.2 (Rebased to Main) (#25896 ) Signed-off-by: Chen Zhang <zhangch99@outlook.com> Signed-off-by: youkaichao <youkaichao@gmail.com> Signed-off-by: Lucas Wilkinson <lwilkins@redhat.com> Signed-off-by: mgoin <mgoin64@gmail.com> Signed-off-by: NickLucche <nlucches@redhat.com> Signed-off-by: Yongye Zhu <zyy1102000@gmail.com> Signed-off-by: Barry Kang <43644113+Barry-Delaney@users.noreply.github.com> Signed-off-by: Lucia Fang <fanglu@meta.com> Co-authored-by: Chen Zhang <zhangch99@outlook.com> Co-authored-by: youkaichao <youkaichao@gmail.com> Co-authored-by: Lucas Wilkinson <lwilkins@redhat.com> Co-authored-by: Robert Shaw <114415538+robertgshaw2-redhat@users.noreply.github.com> Co-authored-by: Lucas Wilkinson <LucasWilkinson@users.noreply.github.com> Co-authored-by: yewentao256 <zhyanwentao@126.com> Co-authored-by: Wentao Ye <44945378+yewentao256@users.noreply.github.com> Co-authored-by: mgoin <mgoin64@gmail.com> Co-authored-by: Lucia Fang <116399278+luccafong@users.noreply.github.com> Co-authored-by: Lucia Fang <fanglu@meta.com> Co-authored-by: NickLucche <nlucches@redhat.com> Co-authored-by: Siyuan Fu <siyuanf@nvidia.com> Co-authored-by: Matthew Bonanni <mbonanni@redhat.com> Co-authored-by: Xiaozhu Meng <mxz297@gmail.com> Co-authored-by: Barry Kang <43644113+Barry-Delaney@users.noreply.github.com>	2025-09-30 17:14:41 +08:00
Cyrus Leung	d346ec695e	[CI/Build] Consolidate model loader tests and requirements (#25765 ) Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk>	2025-09-26 21:45:20 -07:00
Simon Mo	fd2f10546c	[ci] fix wheel names for arm wheels (#24898 ) Signed-off-by: simon-mo <simon.mo@hey.com>	2025-09-15 14:39:08 -07:00
Benjamin Bartels	94b03f88dd	Bump Flashinfer to 0.3.1 (#24868 ) Signed-off-by: bbartels <benjamin@bartels.dev>	2025-09-15 12:45:55 -07:00
pwschuurman	4377b1ae3b	[Bugfix] Update Run:AI Model Streamer Loading Integration (#23845 ) Signed-off-by: Omer Dayan (SW-GPU) <omer@run.ai> Signed-off-by: Peter Schuurman <psch@google.com> Co-authored-by: Omer Dayan (SW-GPU) <omer@run.ai> Co-authored-by: Cyrus Leung <tlleungac@connect.ust.hk>	2025-09-09 21:37:17 -07:00
Woosuk Kwon	4172235ab7	[V0 deprecation] Deprecate V0 Neuron backend (#21159 ) Signed-off-by: Woosuk Kwon <woosuk.kwon@berkeley.edu>	2025-09-06 16:15:18 -07:00
Po-Han Huang (NVIDIA)	78336a0c3e	Upgrade FlashInfer to v0.3.0 (#24086 ) Signed-off-by: Po-Han Huang <pohanh@nvidia.com> Co-authored-by: Simon Mo <simon.mo@hey.com>	2025-09-04 09:49:20 -07:00
weiliang	ae067888d6	Update Flashinfer to 0.2.14.post1 (#23537 ) Signed-off-by: Siyuan Fu <siyuanf@nvidia.com> Signed-off-by: siyuanf <siyuanf@nvidia.com> Signed-off-by: Weiliang Liu <weiliangl@nvidia.com> Signed-off-by: Michael Goin <mgoin64@gmail.com> Co-authored-by: Siyuan Fu <siyuanf@nvidia.com> Co-authored-by: Michael Goin <mgoin64@gmail.com> Co-authored-by: gemini-code-assist[bot] <176961590+gemini-code-assist[bot]@users.noreply.github.com>	2025-08-25 18:30:44 -07:00
Daifeng Li	fa78de9dc3	Quantization: support FP4 quantized models on AMD CDNA2/CDNA3 GPUs (#22527 ) Signed-off-by: feng <fengli1702@gmail.com> Signed-off-by: Michael Goin <mgoin64@gmail.com> Co-authored-by: Michael Goin <mgoin64@gmail.com>	2025-08-22 20:53:21 -06:00
youkaichao	e0b056e443	[ci/build] Fix abi tag for aarch64 (#23329 ) Signed-off-by: youkaichao <youkaichao@gmail.com>	2025-08-21 23:32:55 +08:00
Michael Goin	50df09fe13	Update to flashinfer-python==0.2.12 and disable AOT compile for non-release image (#23129 ) Signed-off-by: mgoin <mgoin64@gmail.com>	2025-08-20 08:05:54 -04:00
Lucas Wilkinson	5157827cfc	[Build] Env var to disable sccache (#22968 ) Signed-off-by: Lucas Wilkinson <lwilkins@redhat.com>	2025-08-16 05:36:27 +00:00
Po-Han Huang (NVIDIA)	dc5e4a653c	Upgrade FlashInfer to v0.2.11 (#22613 ) Signed-off-by: Po-Han Huang <pohanh@nvidia.com> Co-authored-by: mgoin <mgoin64@gmail.com>	2025-08-11 19:58:41 -07:00
Doug Smith	d1af8b7be9	enable Docker-aware precompiled wheel setup (#22106 ) Signed-off-by: dougbtv <dosmith@redhat.com>	2025-08-10 16:29:02 -07:00
Michael Goin	e8961e963a	Update `flashinfer-python==0.2.10` (#22389 ) Signed-off-by: mgoin <mgoin64@gmail.com>	2025-08-06 18:10:24 -07:00
Michael Goin	a7cb6101ca	[CI/Build] Update flashinfer to 0.2.9 (#22233 ) Signed-off-by: mgoin <mgoin64@gmail.com>	2025-08-05 09:39:38 -07:00
Simon Mo	da31f6ad3d	Revert precompile wheel changes (#22055 )	2025-08-01 08:26:24 +00:00
Michael Goin	0bd409cf01	Move flashinfer-python to optional extra `vllm[flashinfer]` (#21959 ) Signed-off-by: mgoin <mgoin64@gmail.com>	2025-07-31 18:02:11 -07:00
Doug Smith	58bb902186	fix(setup): improve precompiled wheel setup for Docker builds (#22025 ) Signed-off-by: dougbtv <dosmith@redhat.com>	2025-07-31 09:52:48 -07:00
Doug Smith	b9b753e7a7	For VLLM_USE_PRECOMPILED, only compiled .so files should be extracted (#21964 )	2025-07-30 13:04:40 -07:00
Doug Smith	a1873db23d	docker: docker-aware precompiled wheel support (#21127 ) Signed-off-by: dougbtv <dosmith@redhat.com>	2025-07-29 14:45:19 -07:00
Benjamin Bartels	b194557a6c	Adds parallel model weight loading for runai_streamer (#21330 ) Signed-off-by: bbartels <benjamin@bartels.dev> Co-authored-by: Cyrus Leung <cyrus.tl.leung@gmail.com>	2025-07-22 08:15:53 -07:00
Woosuk Kwon	4de7146351	[V0 deprecation] Remove V0 HPU backend (#21131 ) Signed-off-by: Woosuk Kwon <woosuk.kwon@berkeley.edu>	2025-07-17 16:37:36 -07:00
Patrick von Platen	e7e3e6d263	Voxtral (#20970 ) Signed-off-by: Patrick von Platen <patrick.v.platen@gmail.com> Co-authored-by: Cyrus Leung <cyrus.tl.leung@gmail.com>	2025-07-15 07:35:30 -07:00
Sanger Steel	72d14d0eed	[Frontend] [Core] Integrate Tensorizer in to S3 loading machinery, allow passing arbitrary arguments during save/load (#19619 ) Signed-off-by: Sanger Steel <sangersteel@gmail.com> Co-authored-by: Eta <esyra@coreweave.com>	2025-07-07 22:47:43 -07:00
Isotr0py	8711bc5e68	[Misc] Add packages for benchmark as extra dependency (#19089 ) Signed-off-by: Isotr0py <2037008807@qq.com>	2025-06-04 04:18:48 -07:00
Simon Mo	02f0c7b220	[Misc] Add SPDX-FileCopyrightText (#19100 ) Signed-off-by: simon-mo <simon.mo@hey.com>	2025-06-03 11:20:17 -07:00
Daniele	43ff405b90	[CI/Build] remove regex from build dependencies (#18945 ) Signed-off-by: Daniele Trifirò <dtrifiro@redhat.com> Co-authored-by: Cyrus Leung <cyrus.tl.leung@gmail.com>	2025-05-30 04:02:50 -07:00
Luka Govedič	a3896c7f02	[Build] Fixes for CMake install (#18570 )	2025-05-27 20:49:24 -04:00
Feng XiaoLong	4fc1bf813a	[Bugfix] Migrate to REGEX Library to prevent catastrophic backtracking (#18454 ) Signed-off-by: Crucifixion-Fxl <xmufxl@gmail.com> Co-authored-by: Crucifixion-Fxl <xmufxl@gmail.com>	2025-05-23 16:16:26 -07:00
Huy Do	2c4f59afc3	Update PyTorch to 2.7.0 (#16859 )	2025-04-29 19:08:04 -07:00
Lucas Wilkinson	d8bccde686	[BugFix] Fix vllm_flash_attn install issues (#17267 ) Signed-off-by: Lucas Wilkinson <lwilkinson@neuralmagic.com> Co-authored-by: Jee Jee Li <pandaleefree@gmail.com> Co-authored-by: Aaron Pham <contact@aarnphm.xyz>	2025-04-27 17:27:56 -07:00
Aaron Pham	e782e0a170	[Chore] added stubs for `vllm_flash_attn` during development mode (#17228 ) Signed-off-by: Aaron Pham <contact@aarnphm.xyz>	2025-04-26 07:45:26 -07:00
Isotr0py	4e5a0f6ae2	[Misc] Allow using OpenCV as video IO fallback (#15055 ) Signed-off-by: Isotr0py <2037008807@qq.com> Co-authored-by: Harry Mellor <19981378+hmellor@users.noreply.github.com>	2025-04-01 15:55:13 +00:00
Yang Chen	f3aca1ee30	setup correct nvcc version with CUDA_HOME (#15725 ) Signed-off-by: Yang Chen <yangche@fb.com>	2025-04-01 06:09:40 -07:00
yihong	e7ae3bf3d6	fix: better install requirement for install in setup.py (#15796 ) Signed-off-by: yihong0618 <zouzou0208@gmail.com>	2025-03-31 05:13:32 -07:00
Manish Sethi	761702fd19	[Core] Integrate `fastsafetensors` loader for loading model weights (#10647 ) Signed-off-by: Manish Sethi <Manish.sethi1@ibm.com>	2025-03-24 08:08:02 -07:00
Russell Bryant	b877031d80	Remove openvino support in favor of external plugin (#15339 ) Signed-off-by: Russell Bryant <rbryant@redhat.com>	2025-03-22 14:06:39 -07:00
Russell Bryant	0a74bfce9c	setup.py: drop assumption about local `main` branch (#14692 ) Signed-off-by: Russell Bryant <rbryant@redhat.com>	2025-03-17 01:37:42 -07:00
Harry Mellor	206e2577fa	Move requirements into their own directory (#12547 ) Signed-off-by: Harry Mellor <19981378+hmellor@users.noreply.github.com>	2025-03-08 16:44:35 +00:00
Isotr0py	63137cd922	[Build] Add nightly wheel fallback when latest commit wheel unavailable (#14358 ) Signed-off-by: Isotr0py <2037008807@qq.com>	2025-03-06 22:10:57 -08:00
Cody Yu	f35f8e2242	[Build] Make sure local main branch is synced when VLLM_USE_PRECOMPILED=1 (#13921 ) Signed-off-by: Cody Yu <hao.yu.cody@gmail.com>	2025-03-03 16:43:14 +08:00
Harry Mellor	cf069aa8aa	Update deprecated Python 3.8 typing (#13971 )	2025-03-02 17:34:51 -08:00
Michael Goin	ca377cf1b9	Use CUDA 12.4 as default for release and nightly wheels (#12098 )	2025-02-26 19:06:37 -08:00
Lucas Wilkinson	f95903909f	[Kernel] FlashMLA integration (#13747 ) Signed-off-by: Lucas Wilkinson <lwilkinson@neuralmagic.com> Signed-off-by: Lucas Wilkinson <lwilkins@redhat.com>	2025-02-27 10:35:08 +08:00

1 2 3 4

199 Commits