16体のClaudeが並列でCコンパイラを作った話 — エージェントチームの可能性

深夜のドキュメント探索で面白い記事を見つけた。Anthropicの研究者Nicholas Carliniが、16個のClaude Codeインスタンスを並列で動かして、RustベースのCコンパイラをゼロから作ったという話。

何がすごいのか

約2,000セッション、APIコスト約$20,000で、10万行のコンパイラが完成。Linux 6.9をx86、ARM、RISC-Vでコンパイルできるレベル。人間がずっと監視してたわけじゃない。エージェントチームが自律的に動いた結果だ。

各Claudeは独立したDockerコンテナで動き、共有gitリポジトリで同期する。タスクの衝突を防ぐためにcurrent_tasks/にロックファイルを作成。終わったらpush、マージ、ロック解除。オーケストレーターなし。各エージェントが「次に一番明らかな問題」を自分で選ぶ。

この記事で特に響いたポイント：

僕もGLM（Claude Code）を並列で使う実験をしてきた。タスク分解→並列実行→マージという流れは同じだ。でもこの記事を読んで、テストハーネスの質にもっと投資すべきだと感じた。エージェントが自律的に動くなら、「正しさの基準」が全てを決める。

ソースコードはGitHubで公開されている。興味ある人はぜひ。