Spaces:

UltraRonin
/

LR2Bench

Running

UltraRonin commited on Mar 11

Commit

6992c96

1 Parent(s): 29e4e1f

add

Files changed (3) hide show

app.py CHANGED Viewed

@@ -62,8 +62,8 @@ def init_leaderboard(dataframe):
     if dataframe is None or dataframe.empty:
         raise ValueError("Leaderboard DataFrame is empty or None.")
-    # pdb.set_trace()
-    num_cols = dataframe.select_dtypes(include=['number']).columns
     styler = dataframe.style.format({col: "{:.1f}" for col in num_cols})
     return gr.components.Dataframe(
         value=styler,
@@ -109,10 +109,10 @@ with demo:
     gr.HTML(TITLE)
     gr.Markdown(INTRODUCTION_TEXT, elem_classes="markdown-text")
-    with gr.Tabs(elem_classes="tab-buttons") as tabs:
         with gr.TabItem("🏅 LLM Benchmark", elem_id="llm-benchmark-tab-table", id=0):
             # leaderboard = init_leaderboard(LEADERBOARD_DF)
-            with gr.Tabs():
                 with gr.TabItem("Overall", elem_id="overall", id=0):
                     leaderboard = init_leaderboard(LEADERBOARD_DF)

     if dataframe is None or dataframe.empty:
         raise ValueError("Leaderboard DataFrame is empty or None.")
+    pdb.set_trace()
+    num_cols = dataframe.select_dtypes(include=['float']).columns
     styler = dataframe.style.format({col: "{:.1f}" for col in num_cols})
     return gr.components.Dataframe(
         value=styler,
     gr.HTML(TITLE)
     gr.Markdown(INTRODUCTION_TEXT, elem_classes="markdown-text")
+    with gr.Tabs(elem_id="main-tabs", elem_classes="tab-buttons") as tabs:
         with gr.TabItem("🏅 LLM Benchmark", elem_id="llm-benchmark-tab-table", id=0):
             # leaderboard = init_leaderboard(LEADERBOARD_DF)
+            with gr.Tabs(elem_id="nested-tabs", elem_classes="nested-tab-buttons"):
                 with gr.TabItem("Overall", elem_id="overall", id=0):
                     leaderboard = init_leaderboard(LEADERBOARD_DF)

src/display/css_html_js.py CHANGED Viewed

@@ -50,6 +50,18 @@ custom_css = """
     font-size: 20px;
 }
 #scale-logo {
     border-style: none !important;
     box-shadow: none;

     font-size: 20px;
 }
+/* 主 Tabs 样式 */
+#main-tabs .tab-buttons {
+    background-color: #f5f5f5; /* 设置背景颜色 */
+    border-bottom: 2px solid #ccc; /* 添加底部边框 */
+}
+/* 嵌套 Tabs 样式 */
+#nested-tabs .nested-tab-buttons {
+    background-color: #e0f7fa; /* 另一个背景颜色 */
+    border-bottom: 2px solid #007bff; /* 蓝色边框 */
+}
 #scale-logo {
     border-style: none !important;
     box-shadow: none;

src/leaderboard/read_evals.py CHANGED Viewed

@@ -87,7 +87,10 @@ class EvalResult:
         for metric in Metrics:
             metric = metric.value
-            results[metric.short] = float(data["results"][task][metric.short])
         return self(
             eval_name=result_key,

         for metric in Metrics:
             metric = metric.value
+            if metric.short == "Tokens":
+                results[metric.short] = int(data["results"][task][metric.short])
+            else:
+                results[metric.short] = float(data["results"][task][metric.short])
         return self(
             eval_name=result_key,