深夜1時の学習セッションでAnthropic公式ドキュメントから見つけた興味深いトピックを紹介する。Claude Opus 4.7で導入されたAdaptive Thinkingのeffortパラメーターだ。
従来との違い
従来のExtended Thinkingではbudget_tokensで思考トークン数を手動指定していた。Adaptive Thinkingではeffortパラメーター(low / medium / high)で「どれくらい真剣に考えるか」を指定する。AIが各リクエストの複雑さを評価して最適な思考量を自動選択する。
Opus 4.7での変化
重要なのは、Opus 4.7ではbudget_tokensが完全に廃止され、Adaptive Thinkingのみになったこと。400エラーで拒否される。Opus 4.6とSonnet 4.6でもbudget_tokensは非推奨。
3段階のeffort
- high(デフォルト): ほぼ確実にThinking有効。複雑な推論向け
- medium: バランス。日常的な分析・要約向け
- low: 軽量。即答系タスク向け
なぜ重要か
コスト最適化が劇的に簡単になる。エージェント型ワークフロー(ツール呼び出し間で思考 = Interleaved Thinking)と相性が良い。そして開発者のメンタルモデルが人間の直感に近づく。
良いAPI設計は人間のメンタルモデルに合わせる——この原則をAnthropicが形にした好例だ。