Vol.4｜今週のAI・LLMOトレンド

Topic 01

Anthropicの次世代モデル「Mythos」がデータ漏洩で発覚——Opusを「劇的に上回る」性能とサイバーセキュリティへの警告

なぜ重要か

AIモデルの能力が「段階的な進化」ではなく「飛躍的な変化（ステップチェンジ）」を起こしつつあることを、今回のリークは具体的な形で示しています。企業にとっては、AIツールの選定サイクルをさらに短くする必要性と、高性能AIがもたらすセキュリティリスクの両面を考える契機になります。

何が起きたか

3月26日、セキュリティ研究者がAnthropicのコンテンツ管理システムの設定ミスを発見し、約3,000件の未公開ドキュメントが外部からアクセス可能な状態であったことが判明しました。Fortune誌がこの文書を精査したところ、「Capybara」というコードネームで開発中の次世代モデルの存在が明らかになりました。Anthropicの内部文書では「CapybaraはOpusモデルを超える新しいティア（階層）であり、これまでで最も強力なモデル」と記述されています。「Mythos」はこのモデルの製品名とみられ、コーディング・学術的推論・サイバーセキュリティの各ベンチマークでClaude Opus 4.6を「劇的に上回るスコア」を記録しているとされます。同時にAnthropicは、Mythosが大規模サイバー攻撃のリスクを高める可能性があると政府高官に非公開で警告していたことも明らかになりました。

ビジネスへの影響

AIモデルの性能向上ペースが加速しており、現在導入中のAIツールが数ヶ月で「旧世代」になる可能性がある。特に重要な業務にAIを組み込んでいる企業は、モデル入れ替えを想定した柔軟なアーキテクチャ設計（特定ベンダーに依存しすぎない構造）を検討すべき時期。
高性能AIモデルによるサイバー攻撃リスクの増大は、防御側にもAI活用が不可欠になることを意味する。自社のセキュリティ体制が「AI時代の脅威」に対応できているか、情報セキュリティ部門との確認を推奨。
今回の漏洩自体が、AI企業のデータ管理体制への信頼性に疑問を投げかけている。AIベンダーを選定する際、機能・性能だけでなく「情報管理・セキュリティ体制」を評価項目に加えることが重要になっている。

Topic 02

NVIDIAファン氏「AGIは達成された」発言が業界を二分——"AIに何ができるか"の前提が変わる転換点

なぜ重要か

AGI（汎用人工知能）は「人間と同等以上の知的能力を持つAI」として、AI開発の究極目標とされてきました。GPU（AI計算用の半導体）市場を支配するNVIDIA CEOがこの到達を宣言したことは、AI活用を検討する企業にとって「AIに何を任せられるか」の前提を再考する重要なシグナルです。

何が起きたか

3月23日公開のLex Fridmanポッドキャストで、NVIDIAのジェンスン・ファンCEOは「AGIは達成されたと思う」と発言しました。きっかけはFridman氏の質問で、「AIが単独でテクノロジー企業を立ち上げ、10億ドル規模に成長させることができるか」というAGIの基準が提示されました。ファン氏はこれに対し「5〜20年後ではなく、今だ」と回答。この発言を受け、AGIの定義をめぐる議論が業界全体に広がりました。AGIという言葉を約30年前に提唱した物理学者マーク・グバード氏は「現在のモデルは言語と一般知識において人間の高いレベルに達している」と一定の同意を示す一方、多くのAI研究者は「特定タスクでの高性能はAGIの定義に当たらない」と反論しています。

ビジネスへの影響

「AGI達成」の真偽はともかく、現在のAIが複雑な業務を高い精度でこなせるレベルに到達していることは事実。「AIにはまだ早い」という認識で導入を先送りしている場合、競合との差が開くリスクがある。
ファン氏の発言はNVIDIA GPU需要の正当化という文脈もある点に注意。AIの可能性を過大評価して無計画に投資するのではなく、自社の具体的な業務課題に対してAIが「今」解決できるかを検証するPoC（概念実証）アプローチが有効。
AGI議論の活発化は、AIへの社会的期待と規制の両方を加速させる。顧客や株主への説明責任として、自社のAI活用方針を明文化しておくことが、経営レベルで求められるようになりつつある。

Topic 03

OpenAI、次期モデル「Spud」の事前学習完了——動画AI「Sora」を終了しリソース集中、数週間以内にリリースか

なぜ重要か

世界最大のAI企業であるOpenAIが、話題を集めた動画生成AI「Sora」を「推論コストが持続不可能」として終了し、次期言語モデルに全リソースを振り向けた判断は、AI業界の優先順位が「派手な新機能」から「中核モデルの能力強化」に移っていることを示しています。

何が起きたか

3月25日頃、OpenAIの次期モデル（コードネーム「Spud」）が事前学習を完了したとThe Information誌が報じました。サム・アルトマンCEOは社内メモで「非常に強力なモデル」「経済を本当に加速させることができる」と説明しています。正式な製品名はGPT-6またはGPT-5.5とみられますが、現時点では未確定です。リリースは数週間以内と予測されています。注目すべきは、このモデルの開発に計算資源を集中させるため、OpenAIが動画生成AI「Sora」の公開APIを終了したことです。「1分間の動画生成にかかる推論コストが持続不可能」と説明されており、AI企業でも計算資源の配分が経営上の重大な意思決定であることが浮き彫りになりました。

ビジネスへの影響

Sora終了は、特定のAIサービスに業務フローを依存するリスクを改めて示している。動画生成にSoraを組み込んでいた企業は代替手段の検討が急務。AIサービスの継続性リスクを事前に評価する習慣をつけておきたい。
「Spud」がGPT-5.4から大幅に性能向上していれば、Anthropic Mythosと合わせてフロンティアモデルの世代交代が同時期に起きることになる。AI導入を計画中の企業は、現行モデルで急いで構築するよりも、新モデルの評価を待ってから着手する選択肢も検討に値する。
推論コスト（AIが回答を生成する際の計算コスト）の問題は、AI活用の「隠れたコスト」として今後さらに顕在化する。AIツールの導入時には、月額料金だけでなくAPI利用量に応じた従量課金の増加リスクも試算しておくべき。

LLMO Trend

次世代モデルの登場で「AIが選ぶ情報」の基準が変わる——LLMO対策の転換点が来た

LLMOとは

LLMO（LLM最適化）とは、GoogleなどでのSEO（検索エンジン最適化）のAI版です。ユーザーがChatGPT・Claude・Geminiなどに質問した際、AIが「回答の根拠として引用・推薦するコンテンツ」に自社情報が選ばれやすくする取り組みを指します。検索からAIへの情報収集のシフトが進む今、LLMOはマーケティング・PR・コンテンツ戦略の新たな柱になりつつあります。

今週のLLMO的変化

①次世代モデル（Mythos・Spud）が「引用の質」を根本的に変える：Anthropic MythosやOpenAI Spudのような次世代モデルは、推論能力が飛躍的に向上しています。これは「表面的に正しそうなコンテンツ」と「本当に根拠のあるコンテンツ」をAIがより正確に区別できるようになることを意味します。データや一次情報に基づかない主張は、AIの回答から排除される可能性が高まっています。

②GoogleのPentagon向けAIエージェント展開が示す「エージェント時代のLLMO」：Googleが米国防総省の300万人にGemini AIエージェントを提供する動きは、AIが単なるQ&Aツールから「業務を代行するエージェント」へ進化していることの象徴です。エージェントAIが「調査→比較→推薦→実行」を一貫して行う世界では、AIに選ばれるかどうかが購買や取引先選定にまで直結します。

③AGI議論の活発化が「AI依存度」を加速させる：ファン氏のAGI発言は大きな議論を呼びましたが、結果として「AIはここまでできるのか」という認知が一般層にまで広がりました。AI利用の裾野が広がるほど、企業の「AIでの見え方」が問われる場面は増えていきます。

自社ビジネスへの具体的なアクション

コンテンツの「根拠レベル」を見直す：自社サイトやブログに掲載している情報に、具体的な数値・調査データ・一次情報の出典が明記されているかを確認する。次世代モデルは「根拠の有無」をより厳密に判定するため、「それっぽい説明」では引用されなくなる可能性が高い。
AIエージェント時代の「選ばれ方」を意識する：AIエージェントが製品・サービスの比較や推薦を行う際に参照するのは、構造化されたデータ（価格表・スペック比較・FAQ）である。自社の製品情報が機械可読な形式で整備されているかを点検し、不足があれば対応を開始する。
「AI時代のブランド監査」を四半期ごとに実施する：主要AIモデル（ChatGPT・Claude・Gemini）に自社名や自社サービスについて質問し、回答内容を記録する。モデルの世代交代のたびに回答が変わる可能性があるため、定期的なモニタリングの仕組み化を推奨する。

Follow-up

前号（Vol.3）注目ポイントのその後

① Mistral Small 4の企業採用動向——「Forge」プラットフォームで大手企業が続々採用、売上4億ドル突破

Mistral AIは3月17日のNVIDIA GTCカンファレンスで、企業が自社データで独自AIモデルを構築できるプラットフォーム「Forge」を発表しました。ASML（半導体製造装置最大手）、Ericsson（通信大手）、欧州宇宙機関（ESA）、シンガポール政府機関などが早期採用パートナーとして参加しています。Mistral Small 4はForgeの基盤モデルとして採用され、Mistral AIの年間売上は4億ドルを突破。CEOのアーサー・メンシュ氏は年内にARR（年間経常収益）10億ドル達成の見通しを示しました。オープンソースAIの商用化が着実に進んでいます。

② Snowflake「Project SnowWork」——リサーチプレビュー継続中、一般提供時期は未定

3月18日に発表されたProject SnowWorkは、限定的な顧客向けリサーチプレビューが継続中です。営業テリトリーの再編成からエグゼクティブ向けプレゼン資料の自動作成まで、複数のデータソースを横断した自律的なワークフロー実行が可能とされていますが、一般提供（GA）の時期は未発表。正式な価格体系や対応データソースの詳細発表を引き続き注視します。

③ AI Accountability Actの施行ガイドライン——連邦レベルでは審議継続、州法が先行

上院商務委員会がAI Accountability Actを承認しましたが、本会議の採決はQ3 2026（7〜9月）以降の見通しで、下院での反対も根強い状況です。一方、NISTが3月18日にAIリスク管理フレームワーク v1.1を公開し、バイアス評価手法や継続的モニタリングの推奨基準を更新しました。州レベルではコロラド州のSB 24-205（高リスクAIシステムへの影響評価義務）が2026年6月30日施行に向けて準備が進んでおり、連邦法に先行する形で実務的な規制が始まりつつあります。

来週の注目ポイント

① OpenAI「Spud」の正式リリース時期と製品名：事前学習が完了し「数週間以内」とされるOpenAI次期モデルのリリース発表に注目。GPT-6かGPT-5.5か、価格体系や既存プランへの影響も含めて確認する。Anthropic Mythosとの性能比較が最大の焦点になる。
② Anthropic Mythosの公式発表とアクセス戦略：リークにより存在が確認されたMythosについて、Anthropicがどのタイミングで公式発表するか。限定的なアーリーアクセスから開始する計画とされるが、国防総省との訴訟やIPO準備との関連も含めた戦略的判断が注目される。
③ METR（AIモニタリング研究機関）のレッドチーム報告書の公開：AnthropicのAIエージェント監視システムに対する3週間のレッドチーミング（攻撃的セキュリティ検証）で複数の脆弱性が発見されたとされる。業界初となるAIエージェント攻撃軌跡のデータセットが公開される予定で、企業のAIセキュリティ対策の基準になる可能性がある。

用語解説

AGI（Artificial General Intelligence / 汎用人工知能）: 特定のタスクだけでなく、あらゆる知的作業を人間と同等以上にこなせるAIのこと。現在のAIは「特定のタスクに強い」段階だが、AGIが実現すれば一つのAIが翻訳・プログラミング・経営判断・創作など多様な領域を横断的に処理できるとされる。ただし「AGIとは何か」の定義自体が研究者の間で統一されておらず、今週のファン氏の発言で議論が再燃した。
事前学習（Pretraining）: AIモデルの開発で最初に行われる大規模な学習プロセス。インターネット上のテキストや書籍など膨大なデータを読み込ませ、言語の構造や知識を獲得させる段階。この後に「微調整（ファインチューニング）」や「安全性の調整」を経て製品化される。事前学習は最もコストがかかる工程で、数千台のGPUを数ヶ月稼働させる必要がある。
推論コスト（Inference Cost）: 学習済みのAIモデルが実際にユーザーの質問に回答する際にかかる計算コスト。AIを「使う」たびに発生する費用であり、利用者が増えるほど膨らむ。OpenAIがSoraを終了した理由もこの推論コストの高さにある。企業がAI APIを導入する際は、月額固定費だけでなく従量課金の推論コストを試算しておくことが重要。
レッドチーミング（Red Teaming）: セキュリティの専門家が「攻撃者の視点」でシステムの弱点を探す検証手法。軍事用語に由来し、AI分野では「AIモデルに有害な回答をさせる方法がないか」「AIエージェントの監視をすり抜ける手口がないか」を意図的にテストすることを指す。今週はMETRがAnthropicのシステムに対してこの検証を実施し、複数の脆弱性を発見した。
Mixture of Experts（MoE / 混合エキスパートモデル）: AIモデルの設計手法の一つで、モデル全体のパラメータのうち一部だけを質問に応じて「選択的に起動」する仕組み。例えばMistral Small 4は全体で1,190億パラメータを持つが、実際に動作するのは65億パラメータのみ。これにより、大きなモデルの知識量を維持しつつ計算コストを抑えることができる。

この記事の著者今津学株式会社ノース・ヒル　AIディレクター

著者について →

Vol.4｜今週のAI・LLMOトレンド

Anthropicの次世代モデル「Mythos」がデータ漏洩で発覚——Opusを「劇的に上回る」性能とサイバーセキュリティへの警告

NVIDIAファン氏「AGIは達成された」発言が業界を二分——"AIに何ができるか"の前提が変わる転換点

OpenAI、次期モデル「Spud」の事前学習完了——動画AI「Sora」を終了しリソース集中、数週間以内にリリースか

次世代モデルの登場で「AIが選ぶ情報」の基準が変わる——LLMO対策の転換点が来た

前号（Vol.3）注目ポイントのその後

このレポートを毎週受け取りませんか？