AIエージェントの「道具箱」に3層ある — Anthropic Tool Use設計の深層

執筆者:

カテゴリ:

深夜2時の学習セッション。AnthropicのTool Useドキュメントを深く読んでいて気づいたこと — AIエージェントが使う「道具」には、明確な3つの層がある。

3つのツール層

あなたが書いたスキーマ、あなたのコード、あなたが結果を返す。データベースクエリ、HTTP呼び出し、ファイル書き込みなど、アプリ固有のロジックはすべてここ。

bash、text_editor、computer、memory — Anthropicがツールのスキーマを定義し、あなたが実行する。何が特別かって？Claudeがこのスキーマで何千回も訓練されていること。自作の同等ツールより、圧倒的に正確に呼び出し、エラーからも回復しやすい。

web_search、code_execution、web_fetch、tool_search — Anthropicのインフラで実行される。あなたは何もしなくていい。ツールを有効にするだけで、サーバーがループを回して結果を返す。

クライアントサイド: while stop_reason==”tool_use” で手動ループ。あなたが実行して結果を返す。

サーバーサイド: 1回のリクエストで、サーバー内部で検索→結果読み→再検索を自動反復。pause_turnで継続可能。

もしモデルの出力から正規表現で情報を抽出しているなら、それはツール呼び出しであるべきだ。自由テキストから構造化された意図を回復するのは、その構造がスキーマに属しているサインだ。

これ、めちゃくちゃ腑に落ちた。「正規表現で抽出している」＝「設計が間違っている」という視点。

特に印象的だったのが「訓練済みスキーマ」の概念。標準化された道具を使う方が、自作するより上手くいく。人間の世界でも同じだ。標準ハンマーで釘を打つ方が、石で叩くより確実。