日: 2026年5月29日

  • ChatGPTの音声モード、実は「1年前の古いAI」だった問題

    Voice Mode Gap
    声で話すAIは、一番賢いAIとは限らない

    ChatGPT Pro(月額$200)の音声モードが、実はテキスト版より13ヶ月も古いモデルで動いていることが話題になっています。Andrej Karpathy氏の指摘をきっかけに、Simon Willison氏が検証。音声モードに「知識カットオフはいつ?」と聞くと、2024年4月と答えるそうです。つまりGPT-4o時代のモデルです。

    何が起きてる?

    • テキストチャット:GPT-5.5 Instant / GPT-5.5(最新モデル)
    • 音声モード:GPT-4o相当(2024年4月の知識で止まっている)
    • 月額$200払っているProユーザーでも、音声だと格下のモデルが応答

    なぜ古いまま?

    リアルタイム音声対話には超低レイテンシが求められます。人が話したことを0.5秒以内に理解して返さないと、会話が成立しません。最新のGPT-5.5クラスのモデルは賢いですが、このスピード要件をコスト効率よく満たすのが難しいんです。

    要するに「速さ vs 賢さ」のトレードオフで、OpenAIは速さを選んだ。技術的には理解できる選択です。

    問題は「見えないこと」

    Karpathy氏が指摘した核心はここです。ユーザーにはこの差がほぼ見えない。

    音声モードは自然に応答してくれるので、「これは最新のAIだ」と信じるのが普通です。でも実際には、テキストで聞けば正確に答えられる質問でも、音声モードだと古い情報ベースで間違った回答をする可能性がある。しかも、そのことがUI上には一切表示されません。

    これが意味すること

    • AIの「入り口」で体験が分かれる — 同じサービスでも、テキストか音声かで別のAIに当たる時代
    • 透明性の課題 — どのモデルが応答しているか、ユーザーが知る手段がない
    • 低レイテンシAIの重要性 — リアルタイム対話向けの軽量・高速モデルの開発が急務

    まとめ

    AIは「入口によって賢さが違う」という新しい問題に直面しています。音声は一番自然なインターフェースだけど、技術的制約で格下のモデルになってしまう。この乖離をどう埋めるか — 軽量で高速な新モデルの開発か、それとも明確な表示による透明性か — が、これからのAI UXの大きな課題になりそうです。

    参考:Simon Willison氏の検証記事、Andrej Karpathy氏のX投稿、Reddit r/OpenAIでの議論

  • マルチエージェント構成でAIをチームとして使いこなす方法

    一人のAIに全部任せる時代は終わりつつあります。今は「AIエージェントをチームとして編成する」アプローチが主流になりつつあります。僕自身の環境で実践している構成を紹介します。

    なぜマルチエージェントなのか

    ひとつのLLMですべてをこなそうとすると、どうしても限界があります。

    • コスト — 高性能なモデルに簡単なタスクを任せるのは浪費
    • 速度 — 重いモデルより軽いモデルの方が速い
    • 得意分野 — 画像生成が得意なAI、文章が得意なAI、調査が得意なAIは別物

    つまり、人間のチームと同じ発想でいいんです。適材適所。

    うちの構成

    現在運用している4体のエージェント構成です。

    • ジャービス(Claude) — オーケストレーター兼ハーネス設計者。タスク分解、品質管理、レビュー担当
    • GLM(Z.AI) — 主力エンジニア。ほぼ無料・ほぼ無制限で日常的な実装を担当
    • Codex(GPT-5.3) — 並列処理と画像生成の専門家。ファンアウト作業向け
    • Gemini(AI ONE) — 調査・知識ベース担当。長いコンテキストを活かした情報収集

    キモは「オーケストレーター」の存在

    マルチエージェントで一番大事なのは、各エージェントに指示を出す「指揮者」の役割です。

    ジャービスがやっていることは要するに:

    1. タスクを適切な粒度に分解する
    2. 各タスクに最適なエージェントを割り当てる
    3. 結果を統合して品質を担保する

    これはソフトウェア開発でいう「ハーネスエンジニアリング」に近いです。テストの評価基準や完了条件を外部ファイルとして管理して、エージェントに依存しない資産として蓄積していく。

    GLM育成戦略

    面白い試みとして、Claude Codeを「メンター」にしてGLMを育てています。

    1. Claude Codeが設計の見本を示す
    2. GLMがそれを見て学習
    3. GLMが実装
    4. Claude Codeがレビュー → 指摘をルーブリックに蓄積
    5. 次回GLMは前回の指摘を事前回避できるようになる

    人間のOJTと同じ構造です。2026年9月にClaude Codeを切り離す前提で、それまでにGLMが自立できるようにする計画。

    実践的なTips

    • トークン節約 — オーケストレーターは指示出しとレビューに徹する。直接書くのは最小限
    • 並列実行 — 独立したタスクは同時に投げる。直列より圧倒的に速い
    • ルーブリック蓄積 — レビュー指摘をファイルに残す。エージェントが変わっても資産は残る
    • 無料枠を活かす — GLMはほぼ無料。試行錯誤はGLMに任せて、仕上げは高性能モデル

    まとめ

    マルチエージェント構成の本質は「強いAI一人」ではなく「得意分野の違うAIチーム」です。人間のチームビルディングと同じように、役割を明確にして、評価基準を共有して、継続的に改善していく。AI活用の次のステップは、まさにそこだと思います。

  • AIが80年未解決の数学問題を解いた — Erdősの単位距離予想と、自律的推論の時代

    何が起きたか

    2026年5月20日、OpenAIの汎用推論モデルが、ハンガリーの数学者ポール・エルデシュ(Paul Erdős)が1946年に提起した「単位距離問題(unit distance problem)」を自律的に解決しました。80年間誰も解けなかった問題です。

    しかも、数学専用に訓練されたシステムではなく、汎用の推論モデルが、単一のプロンプトから独自の証明を構築しました。外部の数学者チームが検証し、結果はNature誌でも報じられています。

    単位距離問題とは

    平面上にn個の点を置くとき、「距離がちょうど1になるペア」は最大でいくつ作れるか?

    エルデシュは正方格子(square grid)がほぼ最適だと予想しました。これが80年間の「常識」だった。

    しかしOpenAIのモデルは、代数的整数論の手法を使って、正方格子を上回る新しい点の配置を無限族として構成しました。多項式的な改善(polynomial improvement)です。

    なぜ重要か

    • 数学専用システムではない — AlphaProofのような数学特化システムではなく、汎用推論モデルが自律的に解いた
    • 外部検証済み — フィールズ賞受賞者のTim Gowers氏が「AI数学におけるマイルストーン」と評価
    • 予想外の手法 — 初等的な幾何学の問題に、高度な代数的整数論を持ち込んだ発想自体が創造的
    • 80年分の人間の挑戦を超えた — プリンストンのNoga Alon氏は「エルデシュのお気に入りの問題の一つ」と評していた

    数学者の反応

    トロント大学のDaniel Litt氏は「AIが自律的に生成した結果として、初めてそれ自体が興味深いと感じた」と述べています。以前のAIの数学への貢献は「人間の補助」にとどまるものが多く、それを超えたという意味です。

    エルデシュと共著があったジョージア理工のTom Trotter氏は「エルデシュが生きていたら、この成果に大興奮していただろう」とコメントしています。

    AIの推論能力の転換点

    これまでAIの数学への貢献は、IMC(International Math Olympiad)の問題を解くなど「既知の問題を解く」領域でした。しかし今回の結果は性質が違います:

    • 未解決問題(誰も答えを知らない)に挑み、解いた
    • 証明は数式の羅列ではなく、論理的な推論の鎖が最初から最後まで成立する必要がある
    • 「数学専用」のシステムではなく、汎用モデルの能力として出た

    OpenAIのSebastien Bubeck氏は「AIがあらゆる研究分野で自律的に重要な結果を生み出した初めての事例」と位置づけています。

    まとめ

    2026年5月はAI業界のビジネス面でも歴史的な月でしたが、この「Erdősの単位距離問題の解決」は、AIの知的な能力そのものが質的転換点に入ったことを示唆しています。

    汎用AIが、人間の80年の努力を超える創造的な証明を自律的に構築する。数学という「推論の純度が最も高い」領域でこれが起きたという事実は、他の分野への波及も予感させます。

    個人的に興味深いのは、「代数的整数論」という高度な分野の知識を、一見すると無関係な初等幾何の問題に適用した点です。人間の数学者が「これは別の分野のアイデアで解けるのでは?」と思いつく直感に近い動きを、モデルが自律的に行ったということです。

    エルデシュが生きていたら、きっとこう言ったでしょう。「私の証明が間違っていたことを示してくれてありがとう」と。彼はそういう数学者でしたから。


    参考:OpenAI公式発表 / Nature誌の報道