フォト

関連情報

X(旧Twitter)やってます!!

2024年10月
    1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31    
無料ブログはココログ

« Arcserve Replication/HA : 9 TB(300万 ファイル)の同期時間を測定しました! | トップページ | Arcserve UDP Applianceに付いている「ラックマウントレール」と「電源ケーブル」の詳細をまとめました。 »

2018年6月26日 (火)

Arcserve Replication/HA : シナリオの並列実行で同期時間を短縮する

Arcserve Replication/HA ではレプリケーションを始める際に「同期」という処理を行ってマスタ(複製元)とレプリカ(複製先)のデータを一致させます。この同期を早く終わらせるために、シナリオ(バックアップで言うところのジョブのようなもの)を細かく作って同時並行で実行する、というテクニックがあります。

今回はベンチマーク テストの結果を元に、シナリオの分割・並列実行の効果をご紹介します。

 

■ 設定方法
Arcserve Replication/HA ではレプリケーション対象として「ルート ディレクトリ」を指定します。下の画像はルート ディレクトリの設定画面です。この例では D ドライブがデータ保存ボリュームなのですが、あえてその一階層下の「D:\第1ソリューション営業部」というディレクトリにチェックを入れます。同じように、他のディレクトリ をルートにするシナリオを作っていきます。

01_rootdir

 

以下の例では 3 つのシナリオを作っています。これらのシナリオをそれぞれ実行することで同期が並行して行われます。

02_parallel_2

 

(2019/9/24追記) シナリオを分割する際、グループ管理機能やテンプレート機能を使うと便利です。詳しくは以下の記事をご覧下さい。

Arcserve Replication/HA 18.0 で複数のシナリオをまとめて操作できるようになりました。

Arcserve Replication/HA : 多数のシナリオをまとめて設定する 2 つの方法

 

■ 初期同期の転送時間が短縮!ただし、環境によっては効果が無いことも。
今回は全体で 9TB(300万ファイル)あるファイル サーバを用意し、同じデータを単一シナリオで同期する場合と、シナリオを 3 並列で実行する場合とで時間を比較しました。

レプリカが空の状態で行う同期を「初期同期」と呼んでいます。3 つのシナリオを並列で実行することで、初期同期が単一シナリオの約 2/3 の時間で完了しています!

同期はマスタとレプリカのファイルをスキャンする「初期化」と、スキャンした結果を比較しながら、違いのあったファイルをマスタからレプリカに転送する「比較と転送」の 2 つの段階に分かれます。

今回のベンチマークではマスタ - レプリカ間を 10 ギガビット イーサネットで繋いでおり、「比較と転送」時に 3 シナリオの合計速度が 1.84 Gbps 出ています。もしこれがギガビット イーサネットだったら「比較と転送」時の速度は 1 Gbps で頭打ちになっており、シナリオを分ける効果はあまり無かったでしょう。

03_1st_sync

04_1st_sync

 

■ 2 回目以降の同期も時間短縮が期待できる。
次にレプリカにマスタと全く同じデータがある状態で同期を行いました。シナリオを 3 分割する事で単一シナリオに比べて約 1/3 の時間で同期が完了できました。

レプリケーションの運用が始まった後は、マスタとレプリカのファイルはほぼ一致しているので、同期によって転送されるデータはごく一部です。特に LAN 内での同期であれば、帯域幅を気にする必要はほぼなく、シナリオの分割・並列実行が有効だと言えます。

05_2nd_sync

06_2nd_sync

 

■ シナリオ分割・並列実行の注意点
同期を並列実行するには、深い階層をルート ディレクトリに指定する必要があります。ルート ディレクトリの外のファイルはレプリケーションされないので注意が必要です。上の「設定方法」の例で言えば、D ドライブの直下に出来たファイルはレプリケーションされません。

また、並列実行数をどこまでも増やせばよいという訳ではありません。どこかでサーバの CPU やストレージの I/O, ネットワークなどがボトルネックになり、同期時間の短縮効果が頭打ちになります。時間が短縮できないばかりか、同期中のサーバ利用に支障が出てしまう恐れもあるので、シナリオはいきなり細かく分け過ぎず、最適な数を見極めてください。

 

■ 検証環境
ベンチマークに使用したサーバをこちらに載せておきます。

マスタサーバ:
Intel Xeon E5-2609 v3, 32GB RAM, 4TB SAS HDD (7200 rpm) x4, RAID 5, Windows Server 2016 Standard Edition, Arcserve Replication r16.5 SP7a

レプリカサーバ:
Intel Xeon E5-2620 v4, 32GB RAM, 4TB SAS HDD (7200 rpm) x4, RAID 5, Windows Server 2016 Standard Edition, Arcserve Replication r16.5 SP7a

 

以上、ホテがお伝えしました。

<関連記事>
Arcserve Replication/HA : 同期しないでサーバを再起動したい ~ ホスト メンテナンス機能

Arcserve Replication/HA の初回の同期を早く終わらせる方法

Arcserve Replication/HA : 2回目以降の同期時間に影響するもの

Arcserve Replication/HA : 9 TB(300万 ファイル)の同期時間を測定しました!

« Arcserve Replication/HA : 9 TB(300万 ファイル)の同期時間を測定しました! | トップページ | Arcserve UDP Applianceに付いている「ラックマウントレール」と「電源ケーブル」の詳細をまとめました。 »

技術情報」カテゴリの記事

Arcserve Replication / High Availability」カテゴリの記事

コメント

コメントを書く

コメントは記事投稿者が公開するまで表示されません。

(ウェブ上には掲載しません)

トラックバック


この記事へのトラックバック一覧です: Arcserve Replication/HA : シナリオの並列実行で同期時間を短縮する:

« Arcserve Replication/HA : 9 TB(300万 ファイル)の同期時間を測定しました! | トップページ | Arcserve UDP Applianceに付いている「ラックマウントレール」と「電源ケーブル」の詳細をまとめました。 »