好奇心駆動型レッドチーミング

AIチャットボットが有害な返答をするのを防ぐ、より迅速で優れた方法(A faster, better way to prevent an AI chatbot from giving toxic responses)

2024-04-10 マサチューセッツ工科大学(MIT)MITの研究者は、機械学習を用いてレッドチームのプロセスを改善し、チャットボットから広範囲の有害な応答を引き出すための多様なプロンプトを自動生成する手法を開発しました。この技術では、レ...

2024-04-11

1602ソフトウェア工学