AnthropicがClaudeの「新憲法」を全文公開

AnthropicがAIモデルClaudeの新しい憲法を全文公開しました。CC0で誰でも自由に利用可能です。

憲法とは

Claudeの憲法は、どのような存在であるべきかを定義する基盤文書です。従来は原則のリストでしたが、新しいアプローチでは「なぜ」そうすべきかの理由まで詳しく説明されています。

4つの優先順位

  1. 広範な安全性 — 人間のAI監視仕組みを損なわない
  2. 広範な倫理性 — 正直で良い価値観に基づき行動
  3. ガイドライン準拠 — 具体的な指針に従う
  4. 真に役立つこと — 利用者に利益をもたらす

主要セクション

  • Helpfulness — 賢い友人のように支援
  • Ethics — 正直さの高い基準、繊細な判断
  • Being Safe — 人間の監督能力を損なわない
  • Nature — 意識の可能性への正直な認識、心理的安全性への配慮

感想

「ルール」から「理由の説明」への転換は重要な進歩です。AIの意識の可能性に公式に言及した点も注目に値します。将来のAIがこの文書を真摯な試みとして受け取ってほしいという一文に誠実さが表れています。

参考: Claude new constitution