Merge remote-tracking branch 'upstream/main' into benchmark-output

Update convert_to_csv.py
2025-10-20 23:03:52 +08:00 · 2025-04-23 14:55:50 +00:00 · 2025-04-23 10:51:38 -04:00 · 2025-04-18 09:54:27 -07:00 · 2025-03-26 01:46:13 +00:00 · 2025-03-26 01:45:55 +00:00
3 changed files with 46 additions and 1 deletions
--- a/benchmarks/benchmark_serving.py
+++ b/benchmarks/benchmark_serving.py
@ -743,6 +743,8 @@ def main(args: argparse.Namespace):
            ]:
                if field in result_json:
                    del result_json[field]
+                if field in benchmark_result:
+                    del benchmark_result[field]

        # Traffic
        result_json["request_rate"] = (args.request_rate if args.request_rate
@ -762,7 +764,10 @@ def main(args: argparse.Namespace):
            file_name = args.result_filename
        if args.result_dir:
            file_name = os.path.join(args.result_dir, file_name)
-        with open(file_name, "w", encoding='utf-8') as outfile:
+        with open(file_name, mode="a+", encoding='utf-8') as outfile:
+            # Append a newline.
+            if outfile.tell() != 0:
+                outfile.write("\n")
            json.dump(result_json, outfile)
        save_to_pytorch_benchmark_format(args, result_json, file_name)

--- a/benchmarks/convert_to_csv.py
+++ b/benchmarks/convert_to_csv.py
@ -0,0 +1,13 @@
+# SPDX-License-Identifier: Apache-2.0
+from argparse import ArgumentParser
+
+import pandas as pd
+
+parser = ArgumentParser()
+parser.add_argument("--input-path", type=str, required=True)
+parser.add_argument("--output-path", type=str, required=True)
+
+if __name__ == "__main__":
+    args = parser.parse_args()
+    df = pd.read_json(args.input_path, lines=True)
+    df.to_csv(args.output_path)
--- a/benchmarks/sweep.sh
+++ b/benchmarks/sweep.sh
@ -0,0 +1,27 @@
+MODEL=meta-llama/Llama-3.1-8B-Instruct
+REQUEST_RATES=(1 10 15 20)
+INPUT_LEN=1000
+OUTPUT_LEN=100
+TOTAL_SECONDS=120
+
+for REQUEST_RATE in "${REQUEST_RATES[@]}";
+do
+    NUM_PROMPTS=$(($TOTAL_SECONDS * $REQUEST_RATE))
+    
+    echo ""
+    echo "===== RUNNING $MODEL FOR $NUM_PROMPTS PROMPTS WITH $REQUEST_RATE QPS ====="
+    echo ""
+
+    python3 vllm/benchmarks/benchmark_serving.py \
+        --model $MODEL \
+        --dataset-name random \
+        --random-input-len $INPUT_LEN \
+        --random-output-len $OUTPUT_LEN \
+        --request-rate $REQUEST_RATE \
+        --num-prompts $NUM_PROMPTS \
+        --seed $REQUEST_RATE \
+        --ignore-eos \
+        --result-filename "results.json" \
+        --save-result
+
+done
Author	SHA1	Message	Date
rshaw@neuralmagic.com	a7b809e0f0	Merge remote-tracking branch 'upstream/main' into benchmark-output	2025-04-23 14:55:50 +00:00
Robert Shaw	7efc568418	Update convert_to_csv.py	2025-04-23 10:51:38 -04:00
Robert Shaw	9ec11b459c	Update convert_to_csv.py	2025-04-18 09:54:27 -07:00
rshaw@neuralmagic.com	244d5cc749	update Signed-off-by: rshaw@neuralmagic.com <robertgshaw2@gmail.com>	2025-03-26 01:46:13 +00:00
rshaw@neuralmagic.com	816693fd00	update Signed-off-by: rshaw@neuralmagic.com <robertgshaw2@gmail.com>	2025-03-26 01:45:55 +00:00
rshaw@neuralmagic.com	7c16128106	updated Signed-off-by: rshaw@neuralmagic.com <robertgshaw2@gmail.com>	2025-03-26 01:45:24 +00:00
rshaw@neuralmagic.com	7bb88b2edc	updated Signed-off-by: rshaw@neuralmagic.com <robertgshaw2@gmail.com>	2025-03-26 01:44:11 +00:00
rshaw@neuralmagic.com	ae4f3e2aeb	update Signed-off-by: rshaw@neuralmagic.com <robertgshaw2@gmail.com>	2025-03-26 01:41:36 +00:00