SWE-agent: Agent-Computer Interfaces Enable Automated Software Engineering¶
Verified license
- License: CC BY 4.0
- 検証日: 2026-05-22
- 検証方法:
pwsh -NoProfile -File scripts/check-arxiv-license.ps1 - このページの掲載モード:
full-text-allowed
Links¶
公式¶
- Project: https://swe-agent.com/
- Code (GitHub): https://github.com/swe-agent/SWE-agent
- Docs: https://swe-agent.com/latest/
- 関連ベンチマーク: SWE-bench
読む(複数フォーマット)¶
- arXiv abstract: https://arxiv.org/abs/2405.15793
- arXiv HTML5 (スマホ友好): https://arxiv.org/html/2405.15793
- ar5iv HTML (LaTeX豊かな表示): https://ar5iv.labs.arxiv.org/html/2405.15793
- PDF: https://arxiv.org/pdf/2405.15793
- alphaXiv (コメント付き): https://www.alphaxiv.org/abs/2405.15793
関連を辿る¶
- Hugging Face Papers: https://huggingface.co/papers/2405.15793
- Semantic Scholar: https://www.semanticscholar.org/arxiv/2405.15793
- Connected Papers: https://www.connectedpapers.com/search?q=SWE-agent%20Agent-Computer%20Interfaces
- Google Scholar: https://scholar.google.com/scholar?q=arXiv%3A2405.15793
- DBLP: https://dblp.org/search?q=SWE-agent+Agent-Computer+Interfaces
このノート内¶
Metadata¶
| 項目 | 値 |
|---|---|
| 著者 | John Yang, Carlos E. Jimenez, Alexander Wettig, Kilian Lieret, Shunyu Yao, Karthik Narasimhan, Ofir Press |
| 公開日 | 2024-05-06 |
| ライセンス | CC BY 4.0(参考情報、本ノートでは全文転載しない) |
| 検証日 | 2026-05-22(arXiv ページから直接取得) |
読む意図¶
Codex harness を読むなら ACI (Agent-Computer Interface) という概念を持っておくべき。
「モデル本体が同じでも、ツール・実行環境・観測の設計次第で性能が大きく変わる」という主張は、Codex 記事の shell / update_plan / AGENTS.md / sandbox 設計の重要性そのもの。
1行サマリ¶
LM agent がコード編集・リポジトリ探索・テスト実行を行うための ACI を慎重に設計すると SWE-bench スコアが大きく上がる。モデル選択と同じくらい interface 設計が性能要因。
キーアイデア¶
- ACI = Agent-Computer Interface: 人間用 CLI/UI ではなく、LLM agent 用に再設計された interface
- ファイル編集は
edit <range>のような構造化コマンドで、行番号やコンテキストを明示 - ディレクトリ探索は
lsの生出力ではなく、要約化された形式 - エラー時のフィードバックは「次にどう直せばいいか」を含む
- 単純に既存 shell を渡すより、SWE-bench で大幅改善
Codex Agent Loop との関係¶
Codex 記事で重要なのはまさにこの観点:
- Codex の
shellツールは生 shell ではなく、サンドボックス・承認モード・cwd 等の 構造化された ACI update_planは SWE-agent の plan management に近いAGENTS.md/AGENTS.override.md/ skills metadata は モデルが環境を理解するための ACI 拡張- MCP サーバー由来のツールも JSON Schema で明示 = ACI 設計の一形態
つまり Codex harness は「ACI 設計が重要」という SWE-agent の主張を、汎用 coding agent に展開した実装。
引っかかりメモ(AI と話して埋めていく)¶
全文読みは Firefox のローカル翻訳でやる。ここには詰まった点だけ追記していく。
メモ¶
- SWE-bench のスコアを上げる経路として「モデル巨大化」「fine-tune」「ACI 改善」の3本があり、SWE-agent は3つ目に賭けた論文
- Codex 記事を「ACI 設計の現場ノート」として読むと刺さる
Attribution¶
- Original paper: SWE-agent: Agent-Computer Interfaces Enable Automated Software Engineering
- Authors: John Yang, Carlos E. Jimenez, Alexander Wettig, Kilian Lieret, Shunyu Yao, Karthik Narasimhan, Ofir Press
- Source: https://arxiv.org/abs/2405.15793
- License: CC BY 4.0
- Changes: Japanese annotations, study commentary, and formatting were added by the maintainer of this notebook. The original text is not reproduced in full on this page.
- Disclaimer: This is an unofficial study note. No endorsement by the original authors is implied.