« Arcserve UDPの「RPSレプリケート」とArcserve Replication/HAの「レプリケーション」との違いは? | トップページ | UDP:Linux仮想マシンをエージェントレスでバックアップし、ファイル単位でリストアする際のポイント2つ。 »

2018年7月10日 (火)

Arcserve UDP : データ ストアは 1 つでだいたい十分

Arcserve UDP で復旧ポイント サーバを立てる際にデータ ストアをいくつ作れば良いのか悩んだ事はありませんか?タイトルが既に出オチな感じはしますが、、、今日はデータ ストアの数について考えてみます。

00_data_store_list

(1 台の復旧ポイント サーバに複数のデータ ストアが作成できますが、、、)

 

■ そもそもデータ ストアって何?

Arcserve UDP で重複排除バックアップ データの遠隔転送を行うには、復旧ポイントサーバ(以下、RPS)というコンポーネントが必要です。この RPS の中にバックアップ データの保存先として定義するのが「データ ストア」です。下はデータ ストアの作成画面で、圧縮や重複排除(デデュプリケーション)、暗号化などの設定はデータ ストアごとに行います。

01_create_a_ds

(データ ストアの作成画面)

 

RPS の中に作られたデータ ストアはプランを作る時にデスティネーション(バックアップ先)として指定されます。複数のノード(バックアップ対象)が登録されているプランでも、指定するデータ ストアは 1 つだけです。1 つのデータ ストアで複数のノードのバックアップ データを保管することができます。

02_add_a_plan

(プランの中でバックアップ先としてデータ ストアを指定します)

 

RPS には下の画面のようにデータ ストアを複数追加できます。いくつも追加できるので、なんとなく細かくデータ ストアを作らなければいけないような気もしてきます。例えばプランごとにデータ ストアを用意してみたりとか、、、でも、ちょっと待ってください。データ ストアは複数のプランで共有できるので、まずは 1 つあれば十分です。データ ストアが複数必要な場面は実はあまりないんです。

00_data_store_list_2

(データ ストアを 2 つ作った図)

 

むしろ、データ ストアを複数作る事によるデメリットもあります。

 

■ データ ストアを分けると重複排除の効率が悪くなる

Arcserve UDP の重複排除はデータ ストアごとに行われます。複数のノードが 1 つデータ ストアにバックアップすれば、ノード間で共通のブロック(下の図の例では赤いブロック)はバックアップ対象から除外されます。これをグローバル デデュプリケーションと呼びます。

03_global_dedupe

(データ ストアをまとめると重複排除の効率が良くなる)

 

一方、ノードごとに違うデータ ストアにバックアップすると、共通のブロックはそれぞれのデータ ストアにバックアップされることになります。その分ハード ディスクやハッシュ展開用のメモリが余計に使用され、重複排除の効率は悪くなります。

ということで、重複排除を使うのであれば、データ ストアは出来るだけまとめた方が有利です。

 

■ データ ストアを分けると同時実行ジョブ数を制限しにくくなる

Arcserve UDP では RPS に過剰な負荷がかかるのを防ぐため、ジョブの同時実行数を制限する機能があります。同時に実行できるジョブの数はデフォルトで「4」で、 RPS のスペックに応じて最適な数に変更できます。

データ ストアの変更
 
同時アクティブ ノードの制限
データ ストアでの最大同時実行ジョブ数を指定します。
デフォルト値: 4
1 から 9999 までの値で指定します。値は、同時に実行できるジョブの数を示します。実行されるジョブがその数に達した場合、別のジョブはキューに置かれ、いずれかの実行中のジョブが完了した場合にのみジョブが開始できます。完了したジョブとは、完了、キャンセル、または失敗したジョブのことを指します。

 

ただ、この制限はデータ ストアごとに行うので、データ ストアがいくつもあると実質的な制限がなくなってしまいます。

04_active_node_limit

(ジョブの同時実行数が適切に制限されている例)

 

05_active_node_limit

(データ ストアごとには制限はかかっているものの、データ ストアの数が多いと RPS 単位では意味がない、、、)

 

ジョブの同時実行数をきちんと管理するためにも、データ ストアの数は多くし過ぎないほうが良いです。

 

[2019年10月28日追記]
------------------------
なお、「Arcserve UDP は 4 つまでしかジョブを同時実行できないの?」と言われる事もありますが、「4」というのはあくまでデフォルト値(初期値)です。
RPS のスペックが十分にあれば、これより大きい値にしても問題ありません。例えば、Arcserve UDP アプライアンスに作られるデータ ストアでは同時アクティブ ノード数が「20」に設定されていますし、50 並列で実行している事例もあります。

参考資料:Arcserve UDP 7.0 仮想環境における大規模並列バックアップ検証レポート
------------------------

 

■ データ ストアを追加するのは RPS のボリュームを増やす時

とはいえ、データ ストアを複数作らなければいけない時もあります。

先ほどの設定画面にもありましたが、データ ストアを作成する際にはデータの保存先としてはボリュームを含んだパスを指定します。1 つのデータ ストアが複数のボリュームをまたいでバックアップ データを保存する事はできません。

そのため、例えば、RPS の容量が不足して後からボリュームを追加するという場面では、そのボリュームをデータの保存先として指定したデータ ストアを新しく作る事になります。

また、バックアップ データのローカル レプリケート機能を使う際には、複製元と複製先の物理ストレージ(ディスク)は当然分けることになるので、データ ストアも複製元/複製先の 2 つ作る必要があります。

 

まとめ

・基本は 1 つの RPS に 1 つのデータ ストア
・バックアップ先のボリュームの数だけデータ ストアが必要

 

以上、ホテがお伝えしました。

« Arcserve UDPの「RPSレプリケート」とArcserve Replication/HAの「レプリケーション」との違いは? | トップページ | UDP:Linux仮想マシンをエージェントレスでバックアップし、ファイル単位でリストアする際のポイント2つ。 »

技術情報」カテゴリの記事

Arcserve UDP」カテゴリの記事

コメント

コメントを書く

コメントは記事投稿者が公開するまで表示されません。

(ウェブ上には掲載しません)

トラックバック


この記事へのトラックバック一覧です: Arcserve UDP : データ ストアは 1 つでだいたい十分:

« Arcserve UDPの「RPSレプリケート」とArcserve Replication/HAの「レプリケーション」との違いは? | トップページ | UDP:Linux仮想マシンをエージェントレスでバックアップし、ファイル単位でリストアする際のポイント2つ。 »