AI活用の成否を左右するデータ管理とバックアップコスト最適化の重要性
あらゆる場所のデータにAIを提供する唯一の企業 Cloudera 株式会社(所在地:東京都中央区、社長執行役員 山賀裕二)は、World Backup DayおよびWorld Cloud Security Dayにあたり、バックアップとセキュリティを「AIエコノミクス」の観点から再定義し、持続可能なデータレジリエンスのあり方について提言を発表しました。
 
IDCのGlobal DataSphere Forecastは、世界のデータ量が2028年までに393.9ゼタバイトへと急増すると予測しています。この成長は、事業継続性、データ保護、ガバナンス、そしてそれらを維持するコストに一層の負荷をかけます。これにより、レジリエンスはAIエコノミクスの問題へと転換され、保持・保護されるデータセットが増えるたびに、ストレージ、バックアップ運用、コンプライアンス対応、さらには下流のAI品質および是正対応にかかる支出が累積していきます。
 
Clouderaの日本リージョナル・バイスプレジデント兼 社長執行役員、山賀裕二は次のように述べています。「近年、日本においてもAIの業務への本格的な活用がデータ量を急増させています。IDC Japanによると、国内のデータセンターサービス市場は2023年の約2.7兆円から、2028年には5兆円規模へと拡大する見込みであり、AI需要の高まりがその成長をけん引しています。また、生成AIの普及に伴い、データセンターの電力需要やインフラ負荷も急速に増加しており、企業におけるデータ管理と運用コストの最適化は喫緊の課題となっています。
 
一方で、日本企業は後をたたないサイバー攻撃や規制強化への対応も求められており、データ保護とレジリエンス強化の重要性はこれまで以上に高まっています。こうした環境下において、単にデータを増やし続けるのではなく、『どのデータをどのように保護するのか』を戦略的に見極めることが、コストとリスクの両面で重要になっています」
 
こうした背景のもと、問うべきは「どれだけ多くのデータをバックアップしているか」や「どれだけ多くのクラウドセキュリティ対策を追加しているか」ではありません。それらの投資が、経済的に持続可能な形で事業レジリエンスの向上につながっているかどうかです。バックアップは無制限に拡大する保険ではなく、明確な保持ポリシーと強固なガバナンスのもとで運用されるべきです。そうでなければ、財務面・運用面の負担が増大し、正当化が難しくなります。重要なのは、障害発生時に適切な復旧を実現するために、「必要なデータを、適切なレベルで保護する」ことです。
 
ガバナンスが、レジリエンスを「選択的」にする
効果的なデータレジリエンスは、自社のデータ資産を正しく理解することから始まります。どのようなデータが存在し、どのように利用され、どのような復旧要件が求められるのかを把握することが不可欠です。この可視性がなければ、すべてのデータが同等に重要と扱われ、過剰なバックアップや不明確な復旧優先順位を招きます。
 
ガバナンスは、こうした課題に対して、保護の優先順位を明確にする枠組みを提供します。データをビジネスへの影響度に応じて分類することで、保護レベルを段階的に設計できます。一部のデータは高水準で保護し、それ以外は低コストな手法や短い保持期間で管理することが可能になります。
 
重要性の判断は、技術的な観点だけでなく、規制対応や契約義務、運用リスク、レピュテーションへの影響など、ビジネス上の要素に基づいて行われます。ガバナンスに基づく意思決定により、保護と保持は単なるIT設定ではなく、ビジネスリスクに基づく戦略的な選択へと変わります。
 
質の低いデータに「二重のコスト」を払わない
ガバナンスが不十分な場合、多くの企業は「念のため」にデータを保存・バックアップし続けます。その結果、時間の経過とともに、実際にはほとんど価値のないデータが大量に蓄積されます。
 
Veritas Global Databerg Reportの調査によると、保存されているデータの最大85%がダークデータ、または冗長・陳腐・無価値(ROT)なデータである可能性があるとされています。それにもかかわらず、組織はこれらのデータを保存・保護し続け、バックアップ対象を拡大し、復旧の複雑性を増大させています。より大規模なバックアップ環境では、信頼できる運用を再開する前に、より多くのデータの検証と復元が必要になります。その影響はインフラコストにとどまりません。
 
AI主導のワークフローを採用する組織では、その影響はさらに増幅される可能性があります。適切にガバナンスされていないデータは、分析パイプラインやAIモデルに直接流れ込み、ノイズを生み出し、インサイトの信頼性を低下させます。その結果、組織は価値の低いデータの保存・保護にリソースを投じた上で、そのデータが下流システムで引き起こす問題を修正するために再び投資するという、「二重払い」の状態に陥ります。
 
リカバリテストが、ガバナンスの有効性を証明する
ガバナンス戦略は、実際に信頼できる復旧結果を生み出してこそ意味を持ちます。定期的なリストアやディザスタリカバリのテストは、保護レベルがビジネスの優先順位と一致しているかを検証する重要な手段です。これらのテストにより、バックアップされていても復旧に寄与しないデータや、想定以上に高い保護が必要なシステムなど、重要な気づきが得られます。また、データパイプライン全体の依存関係を明らかにし、データリネージを活用し、すべてを復元せずとも、適切な順序で復旧を進めることを可能にします。
 
リーダーは、ディザスタリカバリ計画のテスト実施状況、復旧時間目標(RTO)の明確化、その達成度、改善の進捗といった指標を継続的に追うことで、戦略の実効性を確認できます。こうした取り組みは、ガバナンスを強化するフィードバックループを生み出します。
 
データの拡散を抑え、レジリエンスコストの増大を防ぐ
ハイブリッド/マルチクラウド環境では、無秩序なデータ複製が保護・ガバナンス・バックアップの対象を増やし、コストを押し上げます。データが複数のシステムや管理されていない経路に分散することで、AI導入に伴う総コストはさらに増加します。
 
そのため、サードパーティのSaaSプラットフォームや外部サービスへのデータ移動は、利便性ではなく、意図的なガバナンスの意思決定として扱うべきです。データが管理された環境を離れると、可視性は低下し、統制の適用は困難になり、復旧の調整も難しくなります。
 
環境間の一貫性も同様に重要です。オンプレミスとクラウドの両プラットフォームは、同様の方法でガバナンスを効かせる必要があり、断片的な形でデータを管理・保護することで重複データセットや肥大化したバックアップ環境を招くことを避けなければなりません。Iceberg REST Catalogプロトコルのようなオープン標準は、エンジンやカタログ間の相互運用性を高め、プラットフォーム間でデータを利用可能にするためだけに追加コピーを作成する必要性を減らすことで、この課題の解決に寄与します。
 
その結果、重複が減り、所有権と保持ポリシーが明確になり、より小さくクリーンなバックアップ環境が実現され、ガバナンスと管理が容易になり、維持コストも削減されます。
 
リーダーへの示唆
World Backup DayおよびWorld Cloud Security Dayは、現代におけるレジリエンスの本質を見直す好機です。それは単にデータのコピーを増やしたり、統制を強化することではなく、価値の低い、あるいは把握されていないデータに対して無駄なコストをかけないための、意図的かつガバナンスに基づく意思決定です。
 
ガバナンスは、バックアップコストの最適化、復旧時間の短縮、そしてAIの信頼性向上を実現します。企業はこれにより、理解していない、必要としていない、あるいは本来保持すべきではなかったデータを守るためにコストを払い続ける状態から脱却することができます。
 
Cloudera について
Clouderaは、あらゆる場所に存在するデータにAIを提供する唯一のハイブリッドデータ&AIプラットフォーム企業として、大手企業から高い信頼を得ています。実績あるオープンソース基盤を活用し、パブリッククラウド、データセンター、エッジを統合する一貫したクラウド体験を提供します。ビッグデータのパイオニアとして、Clouderaは企業があらゆる形態のデータを100%活用し、AIを適用するとともに制御できるよう支援します。これにより、統合されたセキュリティとガバナンス、そしてリアルタイムの予測的インサイトを提供します。世界中のあらゆる業界の大手組織が、意思決定の高度化、収益性の向上、脅威への対策、そして人命の保護のために、Clouderaを活用しています。
 
詳細については、 ホームページをご参照、 Facebook および X をフォローください。Clouderaおよび関連するマークは、Cloudera Inc.の商標または登録商標です。その他の企業名および製品名は、それぞれの所有者の商標である可能性があります。