AIエージェントの高速・省エネルギー実行技術を開発(Improving AI Agent Speed and Energy Efficiency)

2026-06-25 マサチューセッツ工科大学(MIT)

米国マサチューセッツ工科大学(MIT)の研究チームは、大規模言語モデル(LLM)を利用するAIエージェントの処理速度を向上させるとともに、計算エネルギーを削減する新たな推論手法を開発した。AIエージェントは複雑な課題を解決する際、複数回にわたりLLMを呼び出すため、応答遅延や計算コストが大きな課題となっていた。新手法では、エージェントの実行過程を効率的にスケジューリングし、不要な推論や重複計算を削減するとともに、複数の処理を並列化することで、応答時間の短縮と消費エネルギーの低減を実現した。実験では、従来手法と比べてAIエージェントの実行効率が大幅に向上し、同等の性能を維持したまま計算資源をより有効に利用できることが示された。本技術は、AIアシスタント、自律エージェント、ロボット制御など幅広い応用分野に利用可能であり、大規模AIシステムの運用コスト削減や持続可能なAI基盤の構築に貢献すると期待される。

<関連情報>

Murakkab:クラウドプラットフォームにおけるリソース効率の高いエージェント型ワークフローオーケストレーション Murakkab: Resource-Efficient Agentic Workflow Orchestration in Cloud Platforms

Gohar Irfan Chaudhry, Esha Choukse, Haoran Qiu, Íñigo Goiri, Rodrigo Fonseca, Adam Belay, Ricardo Bianchini
arXiv  last revised 3 Sep 2025 (this version, v2)
DOI:https://doi.org/10.48550/arXiv.2508.18298

AIエージェントの高速・省エネルギー実行技術を開発(Improving AI Agent Speed and Energy Efficiency)

Abstract

Agentic workflows commonly coordinate multiple models and tools with complex control logic. They are quickly becoming the dominant paradigm for AI applications. However, serving them remains inefficient with today’s frameworks. The key problem is that they expose workflows as opaque sequences of model and tool calls that tightly couple agent logic with model and hardware choices. Often, these workflow components are fragmented across different entities, preventing systems from reasoning about trade-offs across accuracy, latency, energy, and cost. This leads to resource waste and degraded service-level objectives (SLOs).
We present Murakkab, a resource-efficient serving system for agentic workflows. Murakkab introduces a declarative abstraction that decouples workflow specification from execution configuration. A profile-guided optimizer and adaptive runtime jointly manage the full stack: orchestrating workflow components, mapping them to models and hardware, and dynamically reconfiguring execution to satisfy user-defined SLOs. By exposing the internal structure of agentic workflows, Murakkab enables cross-layer optimization that existing frameworks and cloud schedulers cannot achieve.
Our evaluation on diverse workflows shows that Murakkab reduces GPU usage by up to 2.8 ×, energy consumption by 3.7 ×, and cost by 4.3 × while maintaining SLOs.

1602ソフトウェア工学
ad
ad
Follow
ad
タイトルとURLをコピーしました