AIが技術ベンチャー予測競争で人間を上回る(AI outperformed humans in a prediction tournament featuring technology ventures)

2026-05-26 ミシガン大学

University of Michigan の研究では、技術系ベンチャー企業の将来性を予測するトーナメント形式の実験で、AIが人間予測者を上回る成績を示した。研究チームは、スタートアップ企業の成功可能性や事業進展を予測する課題を設定し、人間参加者と大規模言語モデルを含むAIシステムの予測精度を比較した。その結果、AIは大量の公開情報を迅速に統合・分析することで、資金調達、成長性、市場適合性などをより正確に評価し、総合スコアで人間を上回った。特にデータ量が多く不確実性の高い案件で優位性が高かった一方、人間は文脈理解や非定量的要因の評価で強みを示した。研究は、AIが投資判断や技術評価支援に有効である可能性を示す一方、最適な意思決定にはAIと人間の協調が重要であると指摘している。

AIが技術ベンチャー予測競争で人間を上回る(AI outperformed humans in a prediction tournament featuring technology ventures)

<関連情報>

LLMの戦略的先見性:完全将来を見据えたベンチャートーナメントからの証拠 The Strategic Foresight of LLMs: Evidence from a Fully Prospective Venture Tournament

Felipe A. Csaszar, Aticus Peterson, Daniel Wilde
arXiv  Submitted on 2 Feb 2026
DOI:https://doi.org/10.48550/arXiv.2602.01684

Abstract

Can artificial intelligence outperform humans at strategic foresight — the capacity to form accurate judgments about uncertain, high-stakes outcomes before they unfold? We address this question through a fully prospective prediction tournament using live Kickstarter crowdfunding projects. Thirty U.S.-based technology ventures, launched after the training cutoffs of all models studied, were evaluated while fundraising remained in progress and outcomes were unknown. A diverse suite of frontier and open-weight large language models (LLMs) completed 870 pairwise comparisons, producing complete rankings of predicted fundraising success. We benchmarked these forecasts against 346 experienced managers recruited via Prolific and three MBA-trained investors working under monitored conditions. The results are striking: human evaluators achieved rank correlations with actual outcomes between 0.04 and 0.45, while several frontier LLMs exceeded 0.60, with the best (Gemini 2.5 Pro) reaching 0.74 — correctly ordering nearly four of every five venture pairs. These differences persist across multiple performance metrics and robustness checks. Neither wisdom-of-the-crowd ensembles nor human-AI hybrid teams outperformed the best standalone model.

1603情報システム・データ工学
ad
ad
Follow
ad
タイトルとURLをコピーしました