My leaderboards - a 2legit2overfit Collection

2legit2overfit 's Collections

My leaderboards

My Fav datasets

My leaderboards

updated Apr 2, 2024

Running

Agents

232

AI2 WildBench Leaderboard (V2)

🦁

232

Display LLM performance leaderboards with customizable views
Running

4.92k

Arena Leaderboard

🏆

4.92k

View the LMArena leaderboard in full‑screen
Running on CPU Upgrade

14k

Open LLM Leaderboard

🏆

14k

Track, rank and evaluate open LLMs and chatbots
Running on CPU Upgrade

7.49k

MTEB Leaderboard

📊

7.49k

Embedding Leaderboard
Running

Agents

Featured

588

LLM-Perf Leaderboard

🏆

588

Compare LLM hardware performance and find the best model
Running

Agents

1.51k

Big Code Models Leaderboard

📈

1.51k

Explore and compare code model performance on a leaderboard
Running on CPU Upgrade

Agents

Featured

1.38k

Open ASR Leaderboard

🏆

1.38k

Explore and compare speech recognition model benchmarks
Build error

Agents

105

Enterprise Scenarios Leaderboard

🥇

105
Running

Agents

432

Reward Bench Leaderboard

📐

432

Explore and compare model scores on RewardBench benchmarks
Build error

Agents

Featured

63

Guardrails Arena

⚔

63

Jailbreak the LLM and privacy guardrails
Running

125

Berkeley Function Calling Leaderboard

🏃

125

View the Berkeley Function-Calling Leaderboard