Agent OS を使ってみた
概要
Agent OSを使って、AI にコードを書かせてみた。 実際にやってみて分かった良い点・残念な点をまとめる。
Agent OS というのは、コーディングエージェントをうまく使うためのプロンプト集で、
AI エディタのスラッシュコマンドのようなかたちで使うことが想定されている。
スラッシュコマンドではないのだが、「xxx.md を実行してください」と伝えると
AI エディタはよしなに解釈してくれて、スラッシュコマンドのように使うことができる。
背景
ここ最近、できるかぎり AI にコードを書かせようと試行錯誤している。 設計・実装・テストを AI に自律的に進めさせるために、 人間が何を用意すべきかという点に関心がある。
Agent OS は AI にうまくコンテキストを与えられるようで、 これまで存在していた問題を解決してくれそうだと感じた。
そのため、
- どこまで自動化できるのか
- どこで人間の介入が必要になるのか
を検証してみた。
リポジトリ
https://github.com/gnkm/alt-x-001
X(旧 Twitter) の簡易版(ログイン、投稿、タイムライン表示)を作った。 簡単な要件だけまとめたテキストファイルをもとに構築した。
前提
基本的には Cursor を使った。 ただし、実装フェーズでは Claude Code を使った。 サブエージェントを使う方法が準備されていたので、それを使ってみたかった。 また、評価のために自分では一切コードを書かず、 設計・実装ともに AI に全て生成させた。
おもしろいところ
- まず MVP を作ろうとしてくれる
- これまで自前のプロンプトで実装計画を作らせてきたが、MVP にしては余計なコードが多く入ってしまっていた
- プロダクトの仕様書を作るのではなく、機能ごとに仕様を決める
- サブエージェントは 8 種類(意外と少ない)
MVP から作る実装計画立案のプロンプトは以下のとおり。
3. **Strategic Ordering** - Order features based on:
- Technical dependencies (foundational features first)
- Most direct path to achieving the mission
- Building incrementally from MVP to full product
これは今後使わせていただく。
残念だったところ
- コマンドの数が多く、似た名前のものもあり直感的に使えず、ドキュメントを参照する必要があった
- 厳密なテスト駆動開発ではない
- テストコードを作るが、Red/Green/Refactor のフェーズを意識したものにはなっていない
- ドキュメントの内容を無視する(
uv pipを禁止したにも関わらず使おうとした)- こういった問題も発生しないことを期待していた
結論
Agent OS はこれだけで完結する万能なものというわけではなかった。ただし、
- MVP から作る計画立案方法
- 機能単位で仕様を考える方法
は参考になる。
自分の場合は、
- 要求仕様書を先に作る
- 要件 ID をコードやテストに埋め込む
- テスト駆動で AI を制御する
といったやり方がしっくりきている。
Agent OS はこれらを置き換えるものではなく、 自分で作った仕組みをブラッシュアップするためのヒントとして使うのが良さそうだ。