Gitea: Git for Me

frozenleaves/ vllm

A high-throughput and memory-efficient inference and serving engine for LLMs

Updated 2025-10-20 03:47:19 +08:00

frozenleaves/ vllm-ascend

Community maintained hardware plugin for vLLM on Ascend

ascend inference llm llm-serving llmops mlops model-serving transformer vllm

Updated 2025-10-19 17:06:05 +08:00

frozenleaves/ alphafold3

AlphaFold 3 inference pipeline.

Updated 2025-10-17 23:06:15 +08:00

frozenleaves/ DeepSpeed

DeepSpeed is a deep learning optimization library that makes distributed training and inference easy, efficient, and effective.

billion-parameters compression data-parallelism deep-learning gpu inference machine-learning mixture-of-experts model-parallelism pipeline-parallelism pytorch trillion-parameters zero

Updated 2025-10-15 09:58:53 +08:00

frozenleaves/ vllm-dev

A high-throughput and memory-efficient inference and serving engine for LLMs

Updated 2025-10-11 16:48:30 +08:00