ChatGPT・Claude・Perplexityが同時ダウン──生成AI時代に浮き彫りとなったインフラ脆弱性と可用性対策

June 01, 2025に更新 2議事録を読みます

生成AIサービスが世界同時に停止した様子を示す暗い世界地図と警告アイコンのイラスト

主要 AI チャットサービスが世界規模で同時障害

― ChatGPT・Claude・Perplexity が 2024 年 6 月 4 日に発生した大規模ダウンの舞台裏 ―

2024 年 6 月 4 日（米国時間）、OpenAI の ChatGPT、Anthropic の Claude、Perplexity AI の Perplexity がほぼ同時にオフラインとなり、数時間にわたって世界中のユーザーが影響を受けました。これほど多くの生成 AI サービスが同時に停止したのは極めて異例であり、インフラの脆弱性や急激な利用増加への備えが改めて問われる事態となりました。

障害タイムライン（太平洋夏時間 =PDT）

時刻	サービス	事象
00:21	ChatGPT	第 1 波の接続障害が発生
04:19	ChatGPT	いったん復旧
07:33	ChatGPT	第 2 波の障害が発生（「定員に達しています」と海賊口調で表示）
10:17	ChatGPT	完全復旧
12:10 （東部夏時間 EDT）	Claude	エラー警告を表示しサービス停止
12:40 頃	Claude	正常運用を再開
同上	Perplexity	断続的に接続不能、「高トラフィックにより容量上限」と通知

※OpenAI API や platform.openai.com は影響を受けず稼働を継続。

影響範囲とユーザー体験

ChatGPT は週次アクティブユーザー 1 億人超と推定されており、検索・開発・学習など幅広い場面で利用されているため影響は最大規模でした。
Claude と Perplexity も研究者やビジネスユーザーを中心に急成長しており、復旧までの短時間でもサポート窓口やソーシャルメディアには多数の報告が寄せられました。
3 つのサービスが同時に落ちたため、「次善策として別の AI を使う」という回避手段が取りづらかった点が今回の特徴です。

推定原因と公式コメント

OpenAI は詳細な技術レポートを公開していませんが、一部コミュニティでは DDoS 攻撃 や サードパーティ依存サービスの障害 が取り沙汰されています。Reddit のフォーラムでは「大量トラフィックが原因の DDoS」との指摘もありましたが、公式の確証は得られていません。

Anthropic と Perplexity は「高負荷」「容量の上限」を原因として挙げ、サーバーリソースの増強とレートリミットの最適化を行ったと報告しています。

各社の対応と学び

企業	主な対策	学び
OpenAI	ステータスページと X（旧 Twitter）で逐次報告。「海賊口調」のユーモアで混乱を緩和	迅速な情報共有とブランドトーン維持がユーザー不安を軽減
Anthropic	自動スケール設定を一時的に強化し、復旧後に冗長構成を見直し	キャパシティプランニングの重要性
Perplexity	キャッシュレイヤーを一時バイパスしてリカバリーを高速化	フェイルオーバー設計が MTTR¹ を短縮

*¹ MTTR = Mean Time To Recovery（平均復旧時間）

ユーザーと開発者へのベストプラクティス

ステータスページをブックマーク
- OpenAI：status.openai.com
- Anthropic：status.anthropic.com
- Perplexity：status.perplexity.ai
API キーの多重化
- 重要ワークフローでは複数ベンダーへの切り替えロジックを実装。
ローカル推論環境の用意
- 小規模モデルをローカルまたはオンプレミスに配置し、最悪時のバックアップとして活用。
障害検知とアラートを自動化
- 例：ステータスページの RSS/JSON を定期ポーリングし、社内 Slack へ通知。

なぜ同時障害は起きたのか — インフラ視点の考察

クラウド共通依存
各社が同一クラウドベンダー（例：AWS、Azure）の同一リージョンにリソースを配置している場合、基盤側のネットワーク障害が波及する可能性。
サードパーティ依存
モニタリングや認証、データベースなど共通コンポーネントが障害を起こすとサービス横断で影響が出る。
外部攻撃
ほぼ同時刻に複数サービスを狙った大規模 DDoS であれば、ネットワーク境界で輻輳が発生し同時落ちにつながる。

生成 AI 業界への示唆

高可用性アーキテクチャの再設計
- マルチクラウド／マルチリージョン戦略が喫緊の課題。
利用規模の急拡大に耐えるスケーリング戦略
- 特に新モデルリリースや話題イベント直後はアクセス集中が読める。
サプライチェーンリスク管理
- サードパーティサービスの冗長化、契約 SLA の見直しが必須。

まとめ

ChatGPT は 2 回、Claude と Perplexity は ほぼ同時刻 に停止。
原因は公表されていないが、クラウド基盤または外部攻撃 が主因との見方が優勢。
生成 AI の社会実装が進むにつれ、可用性とレジリエンス は信頼構築の最重要指標に。

こうした障害は今後も起こり得ます。開発者・ビジネス利用者は ベンダーロックインの緩和 と 冗長化設計 を進め、「止まらない AI 体験」の実現を図りましょう。