ChatGPT・Claude・Perplexityが同時ダウン──生成AI時代に浮き彫りとなったインフラ脆弱性と可用性対策

June 01, 2025に更新 2議事録を読みます

生成AIサービスが世界同時に停止した様子を示す暗い世界地図と警告アイコンのイラスト

主要 AI チャットサービスが世界規模で同時障害

― ChatGPT・Claude・Perplexity が 2024 年 6 月 4 日に発生した大規模ダウンの舞台裏 ―

2024 年 6 月 4 日(米国時間)、OpenAI の ChatGPT、Anthropic の Claude、Perplexity AI の Perplexity がほぼ同時にオフラインとなり、数時間にわたって世界中のユーザーが影響を受けました。これほど多くの生成 AI サービスが同時に停止したのは極めて異例であり、インフラの脆弱性や急激な利用増加への備えが改めて問われる事態となりました。


障害タイムライン(太平洋夏時間 =PDT)

時刻サービス事象
00:21ChatGPT第 1 波の接続障害が発生
04:19ChatGPTいったん復旧
07:33ChatGPT第 2 波の障害が発生(「定員に達しています」と海賊口調で表示)
10:17ChatGPT完全復旧
12:10 (東部夏時間 EDT)Claudeエラー警告を表示しサービス停止
12:40 頃Claude正常運用を再開
同上Perplexity断続的に接続不能、「高トラフィックにより容量上限」と通知

※OpenAI API や platform.openai.com は影響を受けず稼働を継続。


影響範囲とユーザー体験


推定原因と公式コメント

OpenAI は詳細な技術レポートを公開していませんが、一部コミュニティでは DDoS 攻撃サードパーティ依存サービスの障害 が取り沙汰されています。Reddit のフォーラムでは「大量トラフィックが原因の DDoS」との指摘もありましたが、公式の確証は得られていません。

Anthropic と Perplexity は「高負荷」「容量の上限」を原因として挙げ、サーバーリソースの増強とレートリミットの最適化を行ったと報告しています。


各社の対応と学び

企業主な対策学び
OpenAIステータスページと X(旧 Twitter)で逐次報告。「海賊口調」のユーモアで混乱を緩和迅速な情報共有ブランドトーン維持 がユーザー不安を軽減
Anthropic自動スケール設定を一時的に強化し、復旧後に冗長構成を見直しキャパシティプランニング の重要性
Perplexityキャッシュレイヤーを一時バイパスしてリカバリーを高速化フェイルオーバー設計 が MTTR¹ を短縮

*¹ MTTR = Mean Time To Recovery(平均復旧時間)


ユーザーと開発者へのベストプラクティス

  1. ステータスページをブックマーク

  2. API キーの多重化

    • 重要ワークフローでは複数ベンダーへの切り替えロジックを実装。
  3. ローカル推論環境の用意

    • 小規模モデルをローカルまたはオンプレミスに配置し、最悪時のバックアップとして活用。
  4. 障害検知とアラートを自動化

    • 例:ステータスページの RSS/JSON を定期ポーリングし、社内 Slack へ通知。

なぜ同時障害は起きたのか — インフラ視点の考察

  • クラウド共通依存
    各社が同一クラウドベンダー(例:AWS、Azure)の同一リージョンにリソースを配置している場合、基盤側のネットワーク障害が波及する可能性。
  • サードパーティ依存
    モニタリングや認証、データベースなど共通コンポーネントが障害を起こすとサービス横断で影響が出る。
  • 外部攻撃
    ほぼ同時刻に複数サービスを狙った大規模 DDoS であれば、ネットワーク境界で輻輳が発生し同時落ちにつながる。

生成 AI 業界への示唆

  1. 高可用性アーキテクチャの再設計
    • マルチクラウド/マルチリージョン戦略が喫緊の課題。
  2. 利用規模の急拡大に耐えるスケーリング戦略
    • 特に新モデルリリースや話題イベント直後はアクセス集中が読める。
  3. サプライチェーンリスク管理
    • サードパーティサービスの冗長化、契約 SLA の見直しが必須。

まとめ

  • ChatGPT は 2 回、Claude と Perplexity は ほぼ同時刻 に停止。
  • 原因は公表されていないが、クラウド基盤または外部攻撃 が主因との見方が優勢。
  • 生成 AI の社会実装が進むにつれ、可用性とレジリエンス は信頼構築の最重要指標に。

こうした障害は今後も起こり得ます。開発者・ビジネス利用者は ベンダーロックインの緩和冗長化設計 を進め、「止まらない AI 体験」の実現を図りましょう。