1603情報システム・データ工学 AIモデル評価の不正確なランキング方式を検証(Why AI Leaderboards Are Inaccurate and How to Fix Them) 2025-07-29 ミシガン大学ミシガン大学の研究により、AIモデルの性能評価に用いられるElo方式などのリーダーボード手法が不正確になりやすいことが判明。比較数や初期設定の偏りで順位が変動するため、Glicko方式やBradley-Te... 2025-08-04 1603情報システム・データ工学