1603情報システム・データ工学 AIモデル評価の不正確なランキング方式を検証(Why AI Leaderboards Are Inaccurate and How to Fix Them)
2025-07-29 ミシガン大学ミシガン大学の研究により、AIモデルの性能評価に用いられるElo方式などのリーダーボード手法が不正確になりやすいことが判明。比較数や初期設定の偏りで順位が変動するため、Glicko方式やBradley-Te...
1603情報システム・データ工学
0504高分子製品
0403電子応用
0703金属材料
0300航空・宇宙一般
0303宇宙環境利用
0402電気応用
0302航行援助施設
1202農芸化学
1202農芸化学
1702地球物理及び地球化学
0403電子応用