BenchmarkAggregator
BenchmarkAggregator
📖 简介
Comprehensive LLM evaluation framework: GPQA Diamond to Chatbot Arena. Tests all major models equally, easily extensible.
查看英文原版
Comprehensive LLM evaluation framework: GPQA Diamond to Chatbot Arena. Tests all major models equally, easily extensible.
📥 安装此技能
ai-agent install benchmarkaggregator
📖 其他安装方式
方法 2:从 GitHub 克隆
git clone https://github.com/mrconter1/BenchmarkAggregatorcd benchmarkaggregatorai-agent link .
方法 3:手动安装
# 下载技能后复制到技能目录 cp -r benchmarkaggregator ~/.ai-agent/skills/
💡 提示: 技能将安装到你的本地 目录,不会存储在我们的服务器上。