コンテンツにスキップ

Agentic Harness Engineering: Observability-Driven Automatic Evolution of Coding-Agent Harnesses

Verified license

読む(複数フォーマット)

関連を辿る

このノート内

Metadata

項目
著者 (代表) Jiahang Lin, Shichun Liu, Chengjun Pan, Lizhi Lin, Shihan Dou ほか(11名)
公開日 2026-04-28
ライセンス arXiv non-exclusive(参考情報、本ノートでは転載しない)
検証日 2026-05-22(arXiv ページから直接取得)

読む意図

Codex harness 的な設計が研究対象として成熟してきた後続文脈を理解する。 Codex 記事(2026-01-23)→ この論文(2026-04-28)の順なので、これは「Codex の影響下で出た」研究と見るのが自然。Codex-CLI を実際に比較対象としている。

1行サマリ

coding-agent harness 自体を、観測可能性に基づいて自動進化させる手法を提案。Codex-CLI を含む既存 harness と比較。

キーアイデア

  • harness(ツール群、プロンプト、ループ制御、観測形式)を独立した最適化対象として扱う
  • Observability = 各 turn の何が成功/失敗したかを構造化ログとして残す
  • それを使って harness を自動的に書き換え・進化させる
  • 単一の固定 harness より、タスクごとに進化する harness が強い

Codex Agent Loop との関係

  • Codex 記事は「人間が設計した1つの harness」を分解した実装解説
  • この論文は「harness そのものを自動最適化する」研究
  • 関係性: Codex 記事の harness は、この種の自動進化のベースライン候補
  • Codex 記事の中で議論されるキャッシュミス要因(tools 変更・モデル変更・sandbox 変更)は、自動進化型 harness では頻繁に起きるので、研究側でどう扱うか興味深い

引っかかりメモ(AI と話して埋めていく)

全文読みは Firefox のローカル翻訳でやる。ここには詰まった点だけ追記していく。

メモ

  • 公開日が 2026-04-28 なので、Codex 記事の「背景論文」ではなく「後続研究」
  • harness を auto-evolve する系は今後増える予感。読み込み優先度を上げる

Attribution

  • Original paper: Agentic Harness Engineering: Observability-Driven Automatic Evolution of Coding-Agent Harnesses
  • Authors: Jiahang Lin, Shichun Liu, Chengjun Pan, Lizhi Lin, Shihan Dou, et al. (11 authors)
  • Source (read here): https://arxiv.org/abs/2604.25850 · ar5iv · PDF
  • License: arXiv non-exclusive (第三者再配布の許諺なし)
  • このページに含まれるもの: 自分の要約・解説、AIとの対話メモ、主従関係・明瞭区別・出典明示・必然性の4要件を満たす短い引用のみ。
  • このページに含まれないもの: 原文全文、原文の段落単位コピー、全文翻訳、図表転載。
  • Disclaimer: This is an unofficial study note. No endorsement by the original authors is implied.