ディザスタリカバリに関して言えば、組織にとって重要な2つの指標は、目標復旧時点(RPO)と目標復旧時間(RTO)です。これらは、それぞれデータ消失量とデータの復元にかかる時間を示します。これらの問題に対する自社のリスク許容度を明確に認識しておくと、バックアップと復元の戦略がビジネス目標と一致していることを確認する際に役立ちます。
RPOとRTO、そして、これらが組織のディザスタリカバリ計画で果たす重要な役割について見ていきましょう。
RPOとは?
目標復旧時点(RPO)とは、組織が許容できる最大データ消失量のことです。データ消失の許容度は、ほとんどの場合、時間単位で測定されます。
金融、政府、または医療業界に属する組織など、機密データを取り扱う組織では、RPOを設定する際に法的要件を考慮する必要があります。ビジネス要件もRPOに影響を与える場合があります。たとえば、決済ゲートウェイ、電子メールサーバー、株式データベースのRPOは、1分以下に設定されている場合があります。これに対し、企業の消費者向けブログのデータベースでは、RPOが24時間に設定されていることもあります。
RTOとは?
目標復旧時間(RTO)とは、障害発生後にコンピューター、システム、ネットワーク、またはアプリケーションがダウンする最長時間です。RTOは、ほとんどの場合、秒、分、時間、または日単位で測定されます。
サーバーが短時間オフラインになると、通常はその他のメールサーバーが配信を再試行するため、メールサーバーのRTOは最長4時間に設定されることもあります。これとは対照的に、大量のトランザクションを処理する銀行では、金融アプリケーションに対してわずか数秒のRTOを設定する場合があります。
RTOは、アプリケーションおよびそれがビジネスに与える影響に基づいて設定されます。データ消失や停止は収益の創出に影響を及ぼし、停止の影響を数値化することは、RTOや、復旧時間を最小限に抑えるための環境の設定方法を決定する上で重要な要因になります。
RPOとRTOの違いとは?
RPOとRTOは、どちらも期間で表されます。RPOは組織のデータ消失許容度を考慮し、復元されるデータの古さで測定されるため、過去を振り返るものです。RTOは、停止や中断がビジネスの収益創出能力に影響を与え、障害が発生した場合にその後経過する時間を測定するため、将来を見据えるものです。
RPOを定義すると、バックアップの頻度を決定しやすくなります。たとえば、RPOがゼロの場合、スナップショットや増分バックアップを頻繁に実行する必要があります。許容範囲を長くするほど、バックアップの頻度は少なくなり、ストレージコストを削減できます。
RTOは、システムのアーキテクチャを決定する際に役立ちます。ある程度の復旧時間を許容できる場合は、イメージから復元する単一のシステムも選択肢の1つです。目標とするRTOがゼロかそれに近い場合は、冗長性、負荷分散、フェイルオーバーの各オプションへの投資が必要になります。
データの停止や中断は、販売状況やブランドの評判に直接影響を及ぼし、お客様の信頼と維持に悪影響を及ぼす可能性があるため、適切なRTOとRPOを設定することは、エンタープライズ組織にとって特に重要です。
ディザスタリカバリにおけるRPOとRTOの重要性
復元目標は、ディザスタリカバリ戦略を構築する上で重要な指標です。許容できるデータ消失や中断のレベルを数値化するのに役立ち、信頼性と投資対効果の高いバックアップと復元のシステムを構築できます。
古いバックアップやリストアに時間がかかりすぎるバックアップは、組織にとってほとんど役に立ちません。妥当な時間内に通常の運用をリストアできることが分かれば、さらに安心材料になります。
RPOとRTOの違いに加えて、ディザスタリカバリ計画を策定する際に各指標が果たす役割を理解することは非常に重要です。データ消失を許容できる範囲と、サービスが利用できない状態を許容できる期間を把握しておくことは、バックアップソリューションや復元ワークフローに関する意思決定に役立ちます。
目標復旧時点の計算方法とは?
RPOを計算するには、以下を考慮してください。
データ変更率の頻度:RPOは、少なくとも、データの変更頻度と一致している必要があります。これにより、新しいデータとバックアップデータの差分が最小限に抑えられ、データ消失のリスクが低減されます
ビジネス継続性計画(BCP)に合わせたRPOの調整:データの重要度に応じて、個々のビジネスプロセスのRPOは異なる場合があります。アプリケーションによっては、ビジネス継続性のために常時オンのアプローチを必要とするものもあれば、データ消失に対して比較的寛容なものもあります
業界標準の検討:ベストプラクティスは業界によって異なりますが、次のRPOに関する経験則を考慮してください。
0~1時間:ビジネス上重要なワークロードや、大量、動的、または再現が困難なデータの場合の最短の時間枠
1〜4時間:中程度に重要と見なされるアプリケーションで、少量のデータ消失は許容されます
4〜12時間:更新頻度が低い(日次など)データの場合、時々のスナップショット取得でも許容されます
13〜24時間:更新頻度が低く、重要ではあるものの、極めて重要とは見なされないデータに対して、今でもよく見られる最長のRPO
意思決定プロセスを文書化します。RPOが決定したら、IT部門と利害関係者から承認を得ます。
RPOを定期的に見直して、関連性があり適切であることを確認します。必要に応じてこれらの設定を調整し、データを最大限に保護できるようにします。
リスクの計算
RPOとRTOは、どちらもリスクを計算するものであり、企業が失う可能性のあるデータの量と、インシデント発生後にオフライン状態を許容できる期間を測定します。これらの復元目標は、ビジネスプロセスに応じて、秒、時間、分、または日単位で測定できます。リスクの数値化は複雑なプロセスであり、アプリケーション、データセット、および企業目標を考慮する必要があります。
すべての利害関係者が、データ消失とダウンタイムに対するリスク許容度について意見を述べる機会を持つ必要があります。単一のIT組織がビジネスにサービスを提供し、バックアップと復元ソリューションの導入、管理、監視を担当している場合、そのソリューションは最も重要なビジネスプロセスのニーズに応えるものでなければなりません。
アプリケーションのRTO値とRPO値を定義する方法
組織のRTOを定義するには、次の点を考慮してください。
1分、1時間、1日あたりの停止コスト
お客様と締結している既存の復元SLA
どのアプリケーションが最も優先度が高いか
クリティカルアプリケーションを復元する理想的な順序
RPOを定義するには、次の点を考慮してください。
どのようなシナリオでもデータ消失を許容できるかどうか
データ消失がブランドに与える影響
法的影響
財務的影響
戦略を策定する際に考慮しなければならない難解で重要な要素は、データ消失やダウンタイムがブランドイメージに及ぼす可能性のある悪影響です。これを金額で数値化することは難しい場合が多いですが、大幅なダウンタイムやデータ消失は、お客様からの信頼を失うことにつながる可能性があります。
上記の問題をデータ転送、ストレージ、復元ソリューションのコストと比較検討し、ニーズに最も適した戦略を見つけてください。
アプリケーションやビジネスプロセスは、それぞれ個別に評価しましょう。プロセスのこの部分では、終始、利害関係者から意見を求め、不確実な場合は、できる限り迅速な復元とデータ消失の抑制に配慮します。
RPOとRTOを最適化するためのベストプラクティス
RPOとRTOを最適化するには、次のベストプラクティスを適用してください。
頻繁なバックアップ
極めて低いRPOの環境を実現するために、Veeamの継続的データ保護技術やその他のアプリケーションを認識したバックアップまたは増分バックアップを利用すると、スナップショットを頻繁に作成することができます。あまりクリティカルでないアプリケーションの場合は、適切なバックアップ頻度を設定します。コピーの整合性のテストなど、バックアッププロセスを自動化することで、安心を得られます。
頻繁にフルバックアップを行うと、ストレージコストの面で大きなオーバーヘッドが生じます。増分バックアップなら、各バックアップ間の変更を記録することでコストを削減できます。
複数のバックアップを種類の異なるメディアに保存します。理想としては、マルウェアやランサムウェア攻撃によるデータ消失から保護するために、イミュータブルなオフサイトバックアップも必要です。
冗長性とフェイルオーバー
重要なサービスについては、冗長性とフェイルオーバーによってダウンタイムを最小限に抑えます。この方法がバックアップの代わりになるわけではありませんが、これによってサービスが中断されるようなアプリケーション障害や停止から保護することができます。
特定のRAIDアレイを使用すると、冗長性レイヤーが提供され、データ消失のリスクが軽減されて、ハードウェア障害に対応できます。繰り返しますが、これは単に追加の保護レイヤーであり、ビジネス継続性計画におけるバックアップに代わるものではありません。
データやワークロードが冗長なクラウドサービス間で複製されている場合、ランサムウェアなどによってデータが破損したり消失したりするリスクは依然として存在します。Veeamの継続的データ保護技術は、ミッションクリティカルな仮想マシンでのデータ消失のリスクを軽減できるツールの1つです。
テストと検証
RPOとRTOの優先順位を評価して目標を設定することは、ほんの始まりにすぎません。組織がこれらの目標を達成できると確信するには、バックアップと復元のプラクティスを定期的にテストする必要があります。
復元目標のテストに関するベストプラクティスは数多くありますが、最も重要なプラクティスは、これらのテストを実際に実行することです。テストプロセスを完了するために必要なリソースと時間への投資は不可欠です。また、適切なテストには、ストレージ、コンピューティング、ネットワーク、および時間が必要になる可能性があることにも留意してください。
復元テストを計画する際には、次の点を考慮してください。
SLA要件を満たす最適なテストスケジュール
データまたはワークロードを運用状態に復元するために必要な時間
データ復元に必要なストレージ要件
重要なワークロードに対するストレージとコンピューティングの要件
テストをカスタマイズしてエラーなく実行できるようにするための自動化ツールとオーケストレーションツール
優先度ベースの復元
復元戦略を策定する際には、どのワークロードがミッションクリティカルであるかを検討し、優先順位を付けます。クリティカルアプリケーションを仮想マシンで実行すると、復元プロセスを早めることができます。たとえば、社内トレーニング資料のデータベースをリストアするよりも、顧客データや財務記録を復元する方が優先度が高くなります。
自動化
自動化により、人の手を介さずにバックアップを作成できます。スケジュールされたバックアップにより、データ消失のリスクが低減されます。最新のデータ保護ツールは、自動化されたテストとオーケストレーションをサポートしているため、バックアップがエラーなく復元可能な状態であるという安心感をもたらします。
自動バックアップがあるからといって、現状に甘んじてはいけません。バックアッププロセスを定期的に見直して、ビジネスクリティカルなデータがすべてカバーされていることを確認してください。
オフサイトストレージ
バックアップの3-2-1ルールでは、次のことが規定されています。
データのコピーを3つ作成して
2種類以上のメディアにバックアップし
コピーの1つはオフサイトに保管する
こうしておけば、意図せぬ削除または破損するのを防げるだけでなく、リムーバブルストレージやNASストレージに保管されているオンサイトのコピーが破壊されかねない火災や洪水などの災害による消失からもデータを確実に保護できます。
継続的な監視と分析
あらゆるITソリューションで、監視と分析から、インフラストラクチャのパフォーマンスに関する洞察が得られます。バックアップと復元ソリューションの場合、監視可能なメトリックスは多数あります。
バックアップのテスト:エラーなくバックアップが完了していることを確認する
インフラストラクチャの監視:バックアップの成功に影響を及ぼす可能性のある問題を特定する
利用状況の傾向の分析:バックアップストレージ容量に関する今後の問題を防ぐ
ビジネス継続性の向上に関する詳しい情報については、詳細な復元目標のベストプラクティスガイドをご覧ください。
Veeamでディザスタリカバリ戦略を強化
RPOとRTOはどちらも、バックアップと復元の戦略を定義する際に欠かすことのできない指標です。予算と利用可能なリソースのバランスをとる際には、データ消失(RPO)とダウンタイム(RTO)の許容範囲を考慮してください。
常にベストプラクティスを念頭に置き、組織全体の利害関係者と連携し、貴社のディザスタリカバリ戦略がビジネスニーズを満たしていることを確認します。頻繁なバックアップとテストプロセスの自動化は必要不可欠です。また、ミッションクリティカルなアプリケーションに冗長性を持たせるなど、その他の予防策を講じることも有効です。規制対象となっている業界のニーズに合ったソリューションを含め、Veeamのデータ保護ソリューションをぜひご検討ください。
Veeamのデータ保護プラットフォームに関するご相談やデモのお申し込みについては、Veeamまでお問い合わせください。
関連コンテンツ
Veeam Data Platform:バックアップレプリケーション – 仮想、物理、クラウド