Arcserve UDP 復旧ポイント サーバ(RPS)の容量計算が簡単になります!
Arcserve UDP の発売以来、多くのお客様に使われているのが重複排除機能です。上手に活用する事でバックアップ ストレージの費用を節約したり、環境によってはバックアップ時間や遠隔地へのレプリケート時間を短縮する事もできます。
ただ、重複排除機能を使い始める際に悩ましいのが、バックアップ ストレージの容量見積もり(サイジング)です。容量計算に重複排除率という変数が増えるほか、バックアップ データを管理する復旧ポイント サーバ(以下「RPS」と省略)の物理メモリ(RAM)容量にも気を使う必要が出てきます。
そこで今回、必要な情報を入力するだけで、RPS に搭載する必要がある HDD とメモリ、 SSD の容量を計算できるツールを Web に公開しました。これから RPS のスペックを計算しなければという方はもちろん、バックアップ設計のヒアリング シートとしても活用してください。以下の URL から Excel ファイルをダウンロードして使います。
Arcserve UDP 復旧ポイント サーバ(RPS)サイジング ツール(*1)
https://www.arcserve.com/wp-content/uploads/2019/12/udp-rps-sizing-tool.xlsx
■ Arcserve UDP 復旧ポイント サーバ(RPS)サイジング ツールの使い方
さて、今日はこのツールの使い方も説明します。ファイルを開くとまず目に入ってくるのが以下の [RPSスペック計算シート] というシートです。このうち、上部の背景がオレンジ色のセルが個別に入力する項目で、計算結果が背景が灰色のセルに表示されます。
以下、それぞれの入力項目を説明します。
・年間データ増加率(%)
バックアップの対象になるデータの増加率です。この値を元に、現時点から 5 年後までの RPS の必要容量を計算できるようになっています。企業/団体が扱うデータの量は毎年 15% ずつ増えていく、と言われている事から、初期値を 15% にしています。
・日々のデータ変更率(%)
日次増分バックアップ容量を計算するのに使います。バックアップ対象システムの使われ方によって変動する値ですが、お客様の事例を見ていると 1~3% の間に収まるケースが多いです。
こちらの記事に変更率(増分率)の事例をまとめています。
・重複排除ブロックサイズ(KB)、重複排除/圧縮によるストレージ容量の削減率(%)
Arcserve UDP が重複排除を行なう際に、データを区切る単位がこのブロック サイズです。ブロック サイズを小さくすると重複排除の効率が高くなる代わりに、ハッシュ値を展開・保存するメモリ(または SSD)の必要容量が増えます。逆に、ブロック サイズを大きくすると重複排除が弱くなる代わりに、メモリ/SSD の必要容量が減ります。Arcserve UDP v6.0 以降では ブロック サイズのデフォルト値は 16 KB です。
RPS の必要メモリ容量が多すぎるという場合は、この値を 32 KB や 64 KB に変更してみて下さい。ただ、このツール上でブロック サイズを変更しても重複排除率は自動で調整されません。ブロックサイズを上げた場合は、重複排除率も気持ち小さくするとよりリアルな計算ができます。
ブロック サイズを変更する事で、重複排除率にどのような影響があるかは、以下の事例が参考になります。
また、実際にバックアップ対象データを調べて、重複排除率を測定する事もできます。ここまでやると、サイジングの精度がかなり高くなります。
Arcserve UDP v6 新機能紹介 ~ (5) キャパシティ プラニング ツールでバックアップ サーバのサイジングをより正確に ~
・バックアップの世代数
保存するバックアップ(復旧ポイント)の数を入力します。日次/週次/月次それぞれの世代数を入力できますが、例えば週次/月次バックアップは行なわないという事であれば、これらの数字は 0 にして下さい。
■ 計算結果の見方
ここまで必要事項を入力すると、灰色網掛け部分に計算結果が表示されます。 RPS のサイジングに当り見ていただきたいのは以下の項目です。
・必要なメモリ容量(SSDモード/RAMモード)、重複排除用 RAM / SSD 容量
Arcserve UDP の重複排除機能ではバックアップ済みのデータ ブロックを素早く判別するために、バックアップ済みデータのハッシュ値を計算し、RPS のメモリに展開します。
デフォルトの RAM モードだとすべてのハッシュをメモリに展開するので、多くの物理メモリが必要になります。この場合の必要なメモリ容量は [必要なメモリ容量 (RAMモード)] を確認します。
また、ハッシュの保存先として SSD を使う(*2)事で、バックアップ速度にあまり影響出さずにメモリの使用量を節約できます。この場合、必要なメモリ(*3)の容量は [必要なメモリ容量 (SSDモード)] を、SSD の容量は [重複排除用 RAM / SSD 容量] を確認します。
・必要な HDD 容量
バックアップ データの保存に必要な、RPS のローカル ディスクの容量です。バックアップ データの保存先は物理的には RPS の内蔵ディスクに限らず、直接接続のストレージ(DAS)や SAN ストレージを使う場合もあります。なお、バックアップ先を NAS にする事もできますが、重複排除に必要なハッシュとインデックスだけは必ず RPS 内に保存して下さい。ハッシュやインデックスが RPS の外部にあると、バックアップやリストアの速度が低下します。
以上、ホテがお伝えしました。
*1 名前の通りこのツールは復旧ポイント サーバ(RPS)の必要スペックを求めるものです。Arcserve UDP コンソールやエージェントレス バックアップ プロキシと兼用する場合は、以下の資料を参考にこれらの必要スペック(主にメモリ)も加算してください。
*2 RPS に SSD を搭載すれば自動で SSD モードになるというわけではないので注意が必要です。SSD モードを有効にするには、RPS にデータストアを作成する際に [ハッシュ デスティネーションは SSD (Solid State Drive)上にある] というチェック ボックスにチェックを入れるとともに、ハッシュ デスティネーションとして SSD のドライブ上のパスを指定する必要があります。これをやらないと、せっかく RPS に SSD を搭載しても RAM モードとして動作してしまい、ハッシュ値がすべてメモリに展開され、物理メモリ不足でバックアップ速度が低下したり、データストアが止まったりする事もありえます。
*3 SSD モードにしても、メモリが全く必要なくなるわけではありません。RPS では OS や Arcserve UDP を動作させるのにも一定の容量のメモリを必要とします。詳しい考え方は以下の資料もご覧下さい。
« バックアップ データを暗号化する方法まとめ(Arcserve UDP / Arcserve Backup) | トップページ | vSphere Data Protection (vDP)提供終了は、仮想化統合基盤のデータ保護と災害対策を強化させる良い機会です »
「技術情報」カテゴリの記事
- Arcserve CRS シリーズの運用管理 Tips(2025.10.31)
- Arcserve UDP 10.2 新機能紹介:復旧ポイントサーバのデータストアで Amazon S3 / Azure Blob / Google Cloud Storage が利用可能に(2025.10.17)
- オンプレミス版 Arcserve Cyber Resilient Storage (CRS) の OS とは?(2025.10.03)
- Arcserve UDPで保護したLinuxマシンへのファイル単位リストアの動作仕様について解説します(2025.08.01)
- Arcserve UDP 10 で Proxmox VE 仮想マシンのベアメタル復旧をしてみた!(2025.07.04)
「Arcserve UDP」カテゴリの記事
- サイバーレジリエンスを高める Arcserve UDP の運用(2025.11.14)
- アップグレードは必須。さらにCRSで、ランサムウェアに打ち勝つ環境を(2025.11.07)
- Arcserve UDP 10.2 新機能紹介:復旧ポイントサーバのデータストアで Amazon S3 / Azure Blob / Google Cloud Storage が利用可能に(2025.10.17)
- オンプレミス版 Arcserve Cyber Resilient Storage (CRS) の OS とは?(2025.10.03)
- ランサムウェア対策はこれで決まり!新イミュータブル ストレージ、ついに登場!!(2025.09.05)
コメント
« バックアップ データを暗号化する方法まとめ(Arcserve UDP / Arcserve Backup) | トップページ | vSphere Data Protection (vDP)提供終了は、仮想化統合基盤のデータ保護と災害対策を強化させる良い機会です »


非常に役立つツールの展開ありがとうございます。
「Arcserve UDP 復旧ポイント サーバ(RPS)サイジング ツール」について質問になります。
RPSにてデータストアを設定する際、「データ ストア フォルダ」以外にも
「データ デスティネーション」「インデックス デスティネーション」「ハッシュ デスティネーション」の3つのパスの
設定が求められますが、この3つに対してはどのようにサイジングすればよいでしょうか。
本ツールでは「バックアップデータ+インデックス」 は計算できるようですが、「データ デスティネーション」「ハッシュ デスティネーション」の説明はなく、
「インデックス デスティネーション」単体での容量計算についても、具体的な値がありませんでした。
>バックアップ先を NAS にする事もできますが、重複排除に必要なハッシュとインデックスだけは
>必ず RPS 内に保存して下さい。
と本記事でも記載があるので、ハッシュとインデックスのためにどれだけRPS本体に容量を確保すべきかを計算しないとサイジングできないのですが、
計算方法はありますでしょうか。
投稿: くび | 2025年6月 3日 (火) 17時30分
くび様
コメントいただきましてありがとうございます!
まず、「ハッシュ デスティネーション」のに必要な容量は、サイジング ツールの [重複排除用 RAM / SSD 容量] 欄の容量をご確認ください。この値がハッシュ デスティネーションに保存されるハッシュの容量です。
ハッシュ以外のデスティネーションの合計容量は、ご確認いただいている [実効容量:バックアップ データ + インデックス (TB)] です。この内訳は、サイジング ツール内の数式から調べられます。以下数式を引用、変数を日本語訳しています。
[保持ポリシーを考慮した保護対象データ量] × (1-[重複排除率]) × (1-[圧縮率]) + [保持ポリシーを考慮した保護対象データ量] × 0.1
このうち、前半部分が「データ デスティネーション」の容量、後半部分が 「データストア フォルダ」と「インデックス デスティネーション」の合計値です。すなわち、「データストア フォルダ」と「インデックス デスティネーション」の合計容量は以下で表されます。
[保持ポリシーを考慮した保護対象データ量] × 0.1
申し訳ございませんが、このうち「データストア フォルダ」と「インデックス デスティネーション」の内訳については指標をお出ししていません。そのため、RPS 本体には「データストア フォルダ」と「インデックス デスティネーション」のため、[保持ポリシーを考慮した保護対象データ量] の10%の容量を確保いただけますと幸いです。
投稿: ホテ | 2025年6月 4日 (水) 18時56分
詳細な計算の内訳ありがとうございます。
立て続けに申し訳ありませんが、以下追加で4点質問させていただきます。
Q1:
計算式のご説明によると容量は
「データ デスティネーション」 > 「データストア フォルダ」と「インデックス デスティネーション」の合計
となり、データデスティネーションの方が容量が大きくなる認識ですが合っていますでしょうか。
Q2:
「データストア フォルダ」とはどのようなデータが格納されるのでしょうか。
てっきりバックアップデータはデータストアフォルダに格納されると考えていたのですが、
Q1が正しいとするとデータデスティネーションの方にバックアップデータのほとんどが格納されるように
思えたので確認になります。
Q3:
「データストア フォルダ」と「インデックス デスティネーション」内訳は公表できないとのことですが、
ファイル共有ストレージに「データストアフォルダ」、RPSローカルに「インデックス デスティネーション」と分けた場合、ファイル共有ストレージに10%、RPSローカルに10%、 合計20%見込まないといけないということでしょうか。
Q4:
すこし話題がずれますが、「ハッシュデスティネーション」「インデックスデスティネーション」に格納される情報はRPSが重複排除処理で使う情報を格納するもので、バックアップデータそのもののように機密情報が含まれるものは格納されない認識ですが合ってますでしょうか。
投稿: くび | 2025年6月 5日 (木) 10時48分
くび様
コメントのご確認ありがとうございます。以下、各ご質問に返信いたします。
> Q1について
はい、重複排除率や圧縮率にもよるので絶対とは言えませんが、一般的にはほとんどのケースでデータ デスティネーションの方が容量が大きくなります。
> Q2について
「データ ストア フォルダ」 にはバックアップ データ(復旧ポイント)を管理するためのメタ データが格納されます。
> Q3について
はい、ご認識の通りです。実際には合計 20% が使われることはないはずですが、それぞれのサイジングの目安はお出しできないため、それぞれのデスティネーションで 10% ずつの容量を確保いただけますと安全です。
> Q4について
はい、「インデックス」や「ハッシュ」だけでは機密情報を含むデータをリストアすることはできません。重複排除が有効なデータストアにおいては、「データ ストア フォルダ」「データ デスティネーション」「インデックス デスティネーション」上のデータが揃って初めてリストアが行えます。
また、「インデックス デスティネーション」や「ハッシュ デスティネーション」に格納されるのはバイナリ データなので、その中のデータを人間が読み取ることもできません。
投稿: ホテ | 2025年6月 5日 (木) 20時25分