大規模言語モデル(LLMs)

大規模言語モデルが時間の方向を感じる(Large Language Models feel the direction of time) 1600情報工学一般

大規模言語モデルが時間の方向を感じる(Large Language Models feel the direction of time)

2024-09-16 スイス連邦工科大学ローザンヌ校(EPFL) 研究者たちは、大規模言語モデル(LLMs)が文中の次の単語を予測する際には優れているが、前の単語を予測する際には精度が低下する「時間の矢」効果を発見しました。この非対称性は、...
ad
タイトルとURLをコピーしました