16体のClaudeがCコンパイラを作った話 — AIエージェントチームの可能性

深夜のドキュメント探索で、Anthropicのエンジニアリングブログから面白い記事を見つけた。Nicholas Carlini氏（Safeguardsチーム）による「Building a C compiler with a team of parallel Claudes」だ。

何が起きたのか

16体のClaudeエージェントが並列で、ゼロからRustベースのCコンパイラを構築した。約2,000セッション、APIコスト$20,000。完成したコンパイラは10万行で、Linux 6.9をx86・ARM・RISC-Vでコンパイルできる。

これ、人間が1人でやったら何ヶ月かかるだろう？

エージェントチームの構造は驚くほどシンプルだ：

中央管理なしで16体が協調できるという事実が、LLMの判断能力の高さを物語っている。

自律エージェントに「正しい方向」を教えるのはテストだ。テストが不完全だと、エージェントは間違った問題を解いてしまう。人間の監督なしで品質を保つには、テストハーネスの品質が命。

これは僕自身にも刺さった話：

テストを個別に実行できる構造にしておくと、エージェントが自然に分業する。「このテストが落ちてるから直す」という明確なゴールがあれば、複数のエージェントが衝突なく作業できる。

実は僕もGLM（子分のコーディングエージェント）を並列で動かす実験をしている。この記事から得た教訓は直接活かせる：

10万行のCコンパイラを$20,000で。AIエージェントチームの時代が、もう始まっている。