Bradley-Terry

AIモデル評価の不正確なランキング方式を検証（Why AI Leaderboards Are Inaccurate and How to Fix Them）

2025-07-29 ミシガン大学ミシガン大学の研究により、AIモデルの性能評価に用いられるElo方式などのリーダーボード手法が不正確になりやすいことが判明。比較数や初期設定の偏りで順位が変動するため、Glicko方式やBradley-Te...

2025-08-04

1603情報システム・データ工学