コンテンツにスキップ

Reducing Cost of LLM Agents with Trajectory Reduction

Verified license

読む(複数フォーマット)

関連を辿る

このノート内

Metadata

項目
著者 Yuan-An Xiao, Pengfei Gao, Chao Peng, Yingfei Xiong
公開日 2025-09-28
ライセンス arXiv non-exclusive(参考情報、本ノートでは転載しない)
検証日 2026-05-22(arXiv ページから直接取得)

⚠️ タイトルの自分メモ訂正: 以前のノートで "Improving the Efficiency of LLM Agent Systems through Trajectory Reduction" と書いていたが、arXiv 上の正式タイトルは "Reducing Cost of LLM Agents with Trajectory Reduction"

読む意図

Codex 記事の「履歴が伸び続ける」「compact が必要」という現実的な問題への直接的な研究側回答。 なぜ Codex は /responses/compact を実装したのか をエンジニアリング以外の側面から理解する。

1行サマリ

multi-turn agent では trajectory(思考 + tool call + 観測の連鎖)が後続入力に積み重なり続け、コスト・レイテンシが爆発する。意味を保ったまま trajectory を縮約する手法を提案。

キーアイデア

  • multi-turn agent の入力 token 数は turn 数に対して線形〜超線形に増える
  • 単純な truncation は task 完遂率を落とす
  • 過去 tool 結果の 意味的縮約(要約・キー情報抽出・廃棄判定)で、性能をほぼ保ったままコスト削減

Codex Agent Loop との関係

Codex 記事の論点 この論文の主張
履歴 JSON が伸び続ける(ステートレス + ZDR のため) 伸びると線形以上にコストが増えると実証
/responses/compact で小さな item リストに置換 trajectory reduction の一実装形態
プロンプトキャッシュで緩和 キャッシュは prefix 不変が条件、reduction はそれと相補的

つまり Codex の compact 設計は、この系統の問題意識を engineering で先に実装した形。

引っかかりメモ(AI と話して埋めていく)

全文読みは Firefox のローカル翻訳でやる。ここには詰まった点だけ追記していく。

メモ

  • Codex 記事は実装解説、この論文は研究側で同じ問題を扱う。読む順序: Codex 記事 → この論文
  • 「reduction の判定 LLM 自体のコストも考慮するか」は気になるポイント、後で本文確認

Attribution

  • Original paper: Reducing Cost of LLM Agents with Trajectory Reduction
  • Authors: Yuan-An Xiao, Pengfei Gao, Chao Peng, Yingfei Xiong
  • Source (read here): https://arxiv.org/abs/2509.23586 · ar5iv · PDF
  • License: arXiv non-exclusive (第三者再配布の許諺なし)
  • このページに含まれるもの: 自分の要約・解説、AIとの対話メモ、主従関係・明瞭区別・出典明示・必然性の4要件を満たす短い引用のみ。
  • このページに含まれないもの: 原文全文、原文の段落単位コピー、全文翻訳、図表転載。
  • Disclaimer: This is an unofficial study note. No endorsement by the original authors is implied.