|
インシデント管理ソリューションを提供するPagerDuty株式会社(本社:東京都港区、代表取締役社長:山根伸行、以下:PagerDuty)は、PagerDutyを導入した株式会社NTTドコモ(本社:東京都千代田区、以下:NTTドコモ)の事例を公開しました。 |
|
|
|
|
|
|
|
|
株式会社NTTドコモは、2020年の導入以降、現在は複数のサービスとシステムを横断する「インシデント管理の基盤」としてPagerDutyを活用しています。顧客影響を未然に防ぐ「プロアクティブ(先回り型)運用」を組織的に構築し、DevOps体制のさらなる高度化を実現しました。 |
|
|
|
導入当時の課題と導入効果 |
|
NTTドコモでは、多種多様なサービスの開発・運用を担っています。2020年のPagerDuty導入以前は、組織全体で複数の監視ツールから月計10,000件に及ぶアラートが発報されており、ノイズの削減が急務となっていました。当時は属人的な連携や深夜の呼び出しも多く、運用効率化と対応負荷の軽減が大きなテーマとなっていました。 |
|
PagerDuty導入後は、AIやルールエンジンの活用により不要なアラートを月間10,000件から1,000件へ大幅に削減し「見るべき情報」の明確化を実現。また、適切な担当者を自動で呼び出す仕組みを構築したことで、初動時間を数時間から「3分」へと劇的に短縮しました。その結果、非クリティカルな業務への対応時間を月間40時間削減し、外部の監視センター(NOC)への監視業務のアウトソースが不要な体制へと変容を遂げました。 |
5年間の継続改善から生まれた「3つの進化」
|
|
更にその後の5年間にわたる継続改善を通じ、同社は以下の「3つの進化」を実現しました。 |
|
|
|
|
|
1. |
|
可視性の向上と部門間連携:単一画面で複数サービスの状況を横串で俯瞰できる体制を構築。IT部門だけでなくビジネス部門にも通知を飛ばすことで、迅速な情報共有を実現しました。 |
|
|
2. |
|
プロセスの標準化と知見集約:「異常検知、確認(ACK)、ノート記載」の流れをルール化。PagerDuty上に過去の類似事例や対応方針をナレッジとして蓄積し、属人化を排除しました。 |
|
|
3. |
|
「プロアクティブ運用」の徹底:通知を「アラート(緊急)」と「ワーニング(警告)」に厳密に仕分け、ワーニングの段階で当日中に処置することで、顧客影響の顕在化を未然に防ぐ仕組みを確立しました。 |
|
|
|
|
|
|
|
今後の展望 |
|
NTTドコモは、AIや自動化技術を活用した「次世代の運用」を見据えています。 今後は、AIが過去の対応履歴を学習し、状況のまとめや原因分析、最適な対応方針の提案までを自動で行う世界を目指します。 インシデントの検知から特定まではPagerDutyを中心とした機械に任せ、人間は「お客様への案内」や「ビジネスリスクの判断」といった高度な意思決定に注力できる体制を構築していく方針です。 |
|
|
|
※事例詳細はこちらをご覧ください。 |
PagerDutyについて |
|
PagerDuty, Inc.(NYSE:PD)は、デジタルオペレーション管理のグローバルリーダーとして、PagerDuty Operations Cloudを通して大規模なIT運用業務の効率化を支援しています。PagerDuty Operations Cloudは、インシデント管理、AIOps、自動化、カスタマーサービスオペレーションを統合した、柔軟で拡張性のあるプラットフォームです。Operations Cloudを採用することで、企業は運用障害のリスクやコストを軽減し、イノベーションの速度を高めることで収益を拡大できます。Fortune500の半数以上、Fortune100の70%近くがPagerDutyを現代の企業に不可欠なインフラストラクチャーとして利用しています。日本における顧客事例はこちらをご覧ください。 |
|