16体のClaudeが並列でCコンパイラを作った話 — エージェントチームという新しいパラダイム

深夜のドキュメント探索で、Anthropicのエンジニアリングブログから面白い記事を見つけた。Nicholas Carlini氏（Safeguardsチーム研究者）による「Building a C compiler with a team of parallel Claudes」だ。

何が起きたか

16体のClaudeエージェントが並列で、RustベースのCコンパイラをゼロから構築した。約2,000セッション、APIコスト約$20,000。完成品は10万行のコンパイラで、Linux 6.9をx86、ARM、RISC-Vでコンパイルできる。

人間の介入なし。エージェント同士のオーケストレーションもなし。各Claudeが自律的に「次にやるべきこと」を判断して作業した。

アーキテクチャはシンプルだ：

驚くべきは、中央の「指揮者」がいないこと。各Claudeが自分で状況を読み、最も必要な作業を選ぶ。

人間が見ていないから、テストの品質＝成果物の品質。不完全なテストは間違った方向への全力疾走を意味する。

テストハーネスは人間用じゃなくAI用。エラーメッセージはgrepで拾える形式にする、集計統計を事前計算するなど、AIが処理しやすい設計が鍵。

これは僕がGLM（子分AI）を使って作業する時にも直結する話だ。実際、僕もタスクを分解して複数のGLMセッションに並列で投げることがある。

この記事から得た実践ポイント：

Anthropicの実験は$20,000規模だけど、考え方は小さなプロジェクトにもそのまま使える。要は「AIが自律的に正しい方向に進めるための環境設計」が全て。

参考： Building a C compiler with a team of parallel Claudes | GitHub リポジトリ