flagos-ai · tianxiao-baai · Oct 30, 2025 · Nov 3, 2025 · Nov 3, 2025 · Nov 3, 2025
diff --git a/run_flaggems_tests.sh b/run_flaggems_tests.sh
@@ -0,0 +1,239 @@
+#!/bin/bash
+
+# ---------------- 配置部分 ----------------
+FLAGGEMS_PATH="/PATH/OF/YOUR/FLAGGEMS"
+OP_LIST="/PATH/OF/YOUR/OPS_LIST_FILE/" #算子清单文件,每行一个算子
+
+# 指定 GPU 列表
+GPUS=(0 1 2 3 4 5 6 7)
+TIMESTAMP=$(date +"%Y%m%d_%H%M")
+RESULTS_DIR="${FLAGGEMS_PATH}/results_${TIMESTAMP}"
+SUMMARY_FILE="${RESULTS_DIR}/summary.csv"
+
+# 创建根目录
+mkdir -p "$RESULTS_DIR"
+chmod u+rwx "$RESULTS_DIR"
+
+echo "# FlagGems 并行测试汇总" > "$SUMMARY_FILE"
+echo "# 时间: $(date '+%Y-%m-%d %H:%M:%S')" >> "$SUMMARY_FILE"
+echo >> "$SUMMARY_FILE"
+echo "Operator,Passed,Failed,Skipped,Total,Avg_Speedup,float16_speedup,float32_speedup,bfloat16_speedup,int16_speedup,int32_speedup,bool_speedup,cfloat_speedup" >> "$SUMMARY_FILE"
+
+
+GPU_COUNT=${#GPUS[@]}
+echo "使用的 GPU 列表: ${GPUS[*]} (共 ${GPU_COUNT} 张)"
+echo "结果输出目录: $RESULTS_DIR"
+echo
+
+# ---------------- 函数定义 ----------------
+run_op_test() {
+    local op="$1"
+    local gpu_id="$2"
+
+    # 清理 op 名称
+    op=$(echo "$op" | tr -d '\r' | xargs)
+    if [ -z "$op" ]; then
+        echo "⚠️ [GPU $gpu_id] 遇到空算子名，跳过"
+        return
+    fi
+
+    local op_dir="${RESULTS_DIR}/${op}"
+    mkdir -p "$op_dir"
+    chmod u+rwx "$op_dir"
+
+    echo "[GPU $gpu_id] 开始测试算子: $op"
+
+    # ---------------- 精度测试 ----------------
+    local acc_log="${op_dir}/accuracy.log"
+    # 注意这里需要根据 gpu 的不同来调整
+    CUDA_VISIBLE_DEVICES=$gpu_id bash -c "cd ${FLAGGEMS_PATH}/tests && pytest -m '$op' --ref cpu" > "$acc_log" 2>&1
+    local acc_exit=$?
+    [ $acc_exit -eq 0 ] && acc_res="PASS" || acc_res="FAIL"
+
+    # 提取 pytest 汇总
+    local summary_line
+    summary_line=$(grep -E "={3,8} .* in .*s.*={3,8}" "$acc_log" | tail -n 1)
+    local passed=0 failed=0 skipped=0 total=0 deselected=0 warnings=0
+    if [[ -n "$summary_line" ]]; then
+        [[ "$summary_line" =~ ([0-9]+)[[:space:]]+passed ]] && passed=${BASH_REMATCH[1]}
+        [[ "$summary_line" =~ ([0-9]+)[[:space:]]+failed ]] && failed=${BASH_REMATCH[1]}
+        [[ "$summary_line" =~ ([0-9]+)[[:space:]]+skipped ]] && skipped=${BASH_REMATCH[1]}
+        [[ "$summary_line" =~ ([0-9]+)[[:space:]]+deselected ]] && deselected=${BASH_REMATCH[1]}
+        [[ "$summary_line" =~ ([0-9]+)[[:space:]]+warnings ]] && warnings=${BASH_REMATCH[1]}
+        total=$((passed + failed + skipped))
+    fi
+    # ---------------- 性能测试 ----------------
+    local perf_log="${op_dir}/perf.log"
+    # 注意，这里需要根据 gpu 来调整
+    CUDA_VISIBLE_DEVICES=$gpu_id bash -c "cd ${FLAGGEMS_PATH}/benchmark && pytest -m '$op' --level core --record log" > "$perf_log" 2>&1
+    local perf_exit=$?
+    [ $perf_exit -eq 0 ] && perf_res="PASS" || perf_res="FAIL"
+
+    # 查找性能结果文件
+    local perf_result_file
+    perf_result_file=$(find "${FLAGGEMS_PATH}/benchmark" -maxdepth 1 -type f -name "result-m_*${op}*--level_core--record_log.log" | head -n 1)
+    if [ -n "$perf_result_file" ]; then
+        mv "$perf_result_file" "$op_dir/"
+        perf_result_file="${op_dir}/$(basename "$perf_result_file")"
+    else
+        perf_result_file="N/A"
+    fi
+
+    # ---------------- 解析性能结果 ----------------
+    local parsed_summary="N/A"
+    local avg_speedup="0"
+    local float16_speedup="0"
+    local float32_speedup="0"
+    local bfloat16_speedup="0"
+    local int16_speedup="0"
+    local int32_speedup="0"
+    local bool_speedup="0"
+    local cfloat_speedup="0"
+
+    if [ -f "${FLAGGEMS_PATH}/benchmark/summary_for_plot.py" ] && [ -f "$perf_result_file" ]; then
+        parsed_summary_log="${op_dir}/parsed_summary.log"
+        rm -f "$parsed_summary_log"
+        # 将 summary_for_plot.py 的 stdout/stderr 都捕获到 parsed_summary.log
+        python "${FLAGGEMS_PATH}/benchmark/summary_for_plot.py" "$perf_result_file" > "$parsed_summary_log" 2>&1
+        parsed_summary="$parsed_summary_log"
+
+        if [ -s "$parsed_summary_log" ]; then
+            # 用 awk 解析：读取 header -> 查找与 $op 匹配的行 -> 根据 header 索引提取列
+            # 输出格式：f16,f32,bf16,i16,i32,bl,cf,avg
+            read float16_speedup float32_speedup bfloat16_speedup int16_speedup int32_speedup bool_speedup cfloat_speedup avg_speedup < <(
+                awk -v target="$op" '
+                BEGIN{
+                    IGNORECASE = 1
+                }
+                function trim(s) {
+                    gsub(/^[ \t\r\n]+|[ \t\r\n]+$/, "", s)
+                    # remove surrounding quotes if any
+                    if (s ~ /^".*"$/) { sub(/^"/, "", s); sub(/"$/, "", s) }
+                    return s
+                }
+                NR==1 {
+                    # 读取 header，规范化为小写且去空格，用 headers[i]=name
+                    for(i=1;i<=NF;i++){
+                        h = tolower(trim($i))
+                        gsub(/[ \t]+/, "", h)
+                        headers[i]=h
+                    }
+                    next
+                }
+                {
+                    # 规范化第一列作为算子名并判断是否匹配 target
+                    opname = tolower(trim($1))
+                    tt = tolower(target)
+                    matched = 0
+                    if (opname == tt) matched = 1
+                    else if (opname == tt "_") matched = 1
+                    else if (index(opname, tt) == 1) matched = 1   # 名称以 target 开头也视为匹配（兼容 abs_）
+                    if (!matched) next
+
+                    # 若匹配则根据 headers 的位置提取对应的列，如果某列不存在，则给空
+                    f16 = f32 = bf16 = i16 = i32 = bl = cf = avg = "0"
+                    for(i=1;i<=NF;i++){
+                        h = headers[i]
+                        val = trim($(i))
+                        if (h == "float16_speedup") f16 = val
+                        else if (h == "float32_speedup") f32 = val
+                        else if (h == "bfloat16_speedup") bf16 = val
+                        else if (h == "int16_speedup") i16 = val
+                        else if (h == "int32_speedup") i32 = val
+                        else if (h == "bool_speedup") bl = val
+                        else if (h == "cfloat_speedup") cf = val
+                        else if (h == "avg_speedup" || h == "average_speedup" || h == "avg") avg = val
+                    }
+                    # 输出一行并退出（只取第一个匹配）
+                    printf "%s %s %s %s %s %s %s %s\n", f16, f32, bf16, i16, i32, bl, cf, avg
+                    exit
+                }
+                END {
+                    # 若没有匹配行，输出七个 0 占位和 avg=0
+                    printf "0 0 0 0 0 0 0 0\n"
+                }' "$parsed_summary_log"
+            )
+
+            # 把可能的空值或引号去掉、若为空置 0
+            float16_speedup=$(echo "$float16_speedup" | sed 's/^"//;s/"$//;s/^[[:space:]]*//;s/[[:space:]]*$//')
+            float32_speedup=$(echo "$float32_speedup" | sed 's/^"//;s/"$//;s/^[[:space:]]*//;s/[[:space:]]*$//')
+            bfloat16_speedup=$(echo "$bfloat16_speedup" | sed 's/^"//;s/"$//;s/^[[:space:]]*//;s/[[:space:]]*$//')
+            int16_speedup=$(echo "$int16_speedup" | sed 's/^"//;s/"$//;s/^[[:space:]]*//;s/[[:space:]]*$//')
+            int32_speedup=$(echo "$int32_speedup" | sed 's/^"//;s/"$//;s/^[[:space:]]*//;s/[[:space:]]*$//')
+            bool_speedup=$(echo "$bool_speedup" | sed 's/^"//;s/"$//;s/^[[:space:]]*//;s/[[:space:]]*$//')
+            cfloat_speedup=$(echo "$cfloat_speedup" | sed 's/^"//;s/"$//;s/^[[:space:]]*//;s/[[:space:]]*$//')
+            avg_speedup=$(echo "$avg_speedup" | sed 's/^"//;s/"$//;s/^[[:space:]]*//;s/[[:space:]]*$//')
+
+            # 如果 avg_speedup 为空或为 0，则用非 0 的 dtype 值计算平均作为回退
+            is_number_regex="^[0-9]+([.][0-9]+)?([eE][-+]?[0-9]+)?$"
+            if [ -z "$avg_speedup" ] || [ "$avg_speedup" = "0" ]; then
+                sum=0; cnt=0
+                for v in "$float16_speedup" "$float32_speedup" "$bfloat16_speedup" "$int16_speedup" "$int32_speedup" "$bool_speedup" "$cfloat_speedup"; do
+                    if [[ $v =~ $is_number_regex ]]; then
+                        # 只把大于 0 的计入
+                        gt=$(awk -v x="$v" 'BEGIN{ print (x+0>0) ? 1 : 0 }')
+                        if [ "$gt" -eq 1 ]; then
+                            sum=$(awk -v a="$sum" -v b="$v" 'BEGIN{ printf "%.12f", a + b }')
+                            cnt=$((cnt+1))
+                        fi
+                    fi
+                done
-                sum=0; cnt=0
-                for v in "$float16_speedup" "$float32_speedup" "$bfloat16_speedup" "$int16_speedup" "$int32_speedup" "$bool_speedup" "$cfloat_speedup"; do
-                    if [[ $v =~ $is_number_regex ]]; then
-                        # 只把大于 0 的计入
-                        gt=$(awk -v x="$v" 'BEGIN{ print (x+0>0) ? 1 : 0 }')
-                        if [ "$gt" -eq 1 ]; then
-                            sum=$(awk -v a="$sum" -v b="$v" 'BEGIN{ printf "%.12f", a + b }')
-                            cnt=$((cnt+1))
-                        fi
-                    fi
-                done
+                local values="$float16_speedup $float32_speedup $bfloat16_speedup $int16_speedup $int32_speedup $bool_speedup $cfloat_speedup"
+                read sum cnt < <(echo "$values" | awk '{
+                    s=0; c=0;
+                    for(i=1; i<=NF; i++) {
+                        if ($i > 0) { s+=$i; c++ }
+                    }
+                    print s, c
+                }')
+                sum=${sum:-0}
+                cnt=${cnt:-0}
-                sum=0; cnt=0
-                for v in "$float16_speedup" "$float32_speedup" "$bfloat16_speedup" "$int16_speedup" "$int32_speedup" "$bool_speedup" "$cfloat_speedup"; do
-                    if [[ $v =~ $is_number_regex ]]; then
-                        # 只把大于 0 的计入
-                        gt=$(awk -v x="$v" 'BEGIN{ print (x+0>0) ? 1 : 0 }')
-                        if [ "$gt" -eq 1 ]; then
-                            sum=$(awk -v a="$sum" -v b="$v" 'BEGIN{ printf "%.12f", a + b }')
-                            cnt=$((cnt+1))
-                        fi
-                    fi
-                done
+                local values="$float16_speedup $float32_speedup $bfloat16_speedup $int16_speedup $int32_speedup $bool_speedup $cfloat_speedup"
+                read sum cnt < <(echo "$values" | awk '{
+                    s=0; c=0;
+                    for(i=1; i<=NF; i++) {
+                        if ($i > 0) { s+=$i; c++ }
+                    }
+                    print s, c
+                }')
+                sum=${sum:-0}
+                cnt=${cnt:-0}
+                if [ "$cnt" -gt 0 ]; then
+                    avg_speedup=$(awk -v s="$sum" -v c="$cnt" 'BEGIN{ printf "%.6f", s / c }')
+                else
+                    avg_speedup="0"
+                fi
+            fi
+        fi
+    fi
+
+    # 输出终端
+    echo "✅ [GPU $gpu_id] $op 完成 (精度:$acc_res | p:$passed f:$failed s:$skipped t:$total | 平均加速比:$avg_speedup)"
+
+    # 写入 CSV（追加 dtype 列）
+    echo "$op,$passed,$failed,$skipped,$total,$avg_speedup,$float16_speedup,$float32_speedup,$bfloat16_speedup,$int16_speedup,$int32_speedup,$bool_speedup,$cfloat_speedup" >> "$SUMMARY_FILE"
+
+
+
+
+}
+
+# ---------------- 主任务分配 ----------------
+OPS=()
+while IFS= read -r line || [ -n "$line" ]; do
+    line=$(echo "$line" | tr -d '\r' | xargs)
+    if [ -n "$line" ] && [[ ! "$line" =~ ^# ]]; then
+        OPS+=("$line")
+    fi
+done < "$OP_LIST"
+
+if [ ${#OPS[@]} -eq 0 ]; then
+    echo "❌ 没有在 $OP_LIST 中找到任何有效算子"
+    exit 1
+fi
+
+# 分配算子到 GPU（轮询）
+declare -A GPU_TASKS
+for ((i=0; i<${#OPS[@]}; i++)); do
+    gpu_index=$((i % GPU_COUNT))
+    gpu_id=${GPUS[$gpu_index]}
+    GPU_TASKS[$gpu_id]="${GPU_TASKS[$gpu_id]} ${OPS[$i]}"
+done
+
+# ---------------- 执行测试 ----------------
+for gpu_id in "${GPUS[@]}"; do
+    {
+        for op in ${GPU_TASKS[$gpu_id]}; do
+            run_op_test "$op" "$gpu_id"
+        done
+    } &
+done
+
+wait
+
+echo "-------------------------------------------"
+echo "所有算子测试完成"
+echo "结果目录: ${RESULTS_DIR}"
+echo "汇总文件: ${SUMMARY_FILE}"
+echo "-------------------------------------------"
+