フォト

関連情報

X(旧Twitter)やってます!!

2024年10月
    1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31    
無料ブログはココログ

« Arcserve UDP Archiving: IT管理者はアーカイブされたメールには一切アクセスできません。 | トップページ | Arcserve Replication/HA : シナリオの並列実行で同期時間を短縮する »

2018年6月19日 (火)

Arcserve Replication/HA : 9 TB(300万 ファイル)の同期時間を測定しました!

Arcserve Replication/HA ではレプリケーションを始める際に「同期」という処理を行い、マスタ(複製元)とレプリカ(複製先)のデータを一致させます。同期が終わらないとレプリケーションが始まらないので、これがどれくらいの時間で終わるのか気になりますよね!?

同期にも色々種類がありますが、今回はファイル サーバを想定した環境でファイル レベル同期の時間を測定した結果を報告します。

 

■ 1.データ量による同期時間の違い

まず、レプリカ サーバが空の状態で同期を行いました。この状態での同期を便宜的に「初期同期」と呼びます。

以下のテスト結果から初期同期では同期対象のデータ量/ファイル数に比例して必要な時間が長くなることが分かります。

また、もうひとつ注目いただきたいのは、「比較と転送」 の速度です。 9 TB のデータを 16 時間強で転送しており、速度に直すと 1.23 Gbps になります。今回はマスタ-レプリカ間を 10 ギガビット・イーサネット(10 GbE)で繋いでいるため 1Gbps を超える速度が出ています。

初期同期を行うのは初回導入時以外にはディスクが全損するような大規模障害の後始末の時などで、あまり何度もある事ではないでしょう。とはいえ、数十 TB、数百 TB のファイル サーバであれば初期同期が終わるまで数日かかります。これが短縮できるのであれば、10 GbE のネットワーク インターフェース カードを 2 枚買うくらいの投資なら、十分元が取れるのではないでしょうか。

01_2

02

 

■ 2. 初期同期と差分同期の違い

レプリカに 9 割 マスタと同じデータがある状態で同期を行い(これを便宜的に「差分同期」と呼びます)、初期同期の時間と比較しています。

ファイル レベル同期では、最初にマスタ/レプリカのファイルをスキャンして(初期化)、その結果を比較し、違いのあるファイルだけを転送します(比較と転送)。このため、マスタとレプリカのデータの差が小さければ、その分「比較と転送」の時間も短くなります。

03

04

 

■ 3. 回線速度による違い

マスタ-レプリカ間のネットワークの速度を変えて同期を行い、結果を比較しました。「比較と転送」のフェーズではマスタからレプリカにネットワーク経由でデータが流れるので、帯域幅が狭いと時間も長くなります。

このテストでは差分同期を行っていますが、レプリカが空の状態での初期同期ではさらに転送するデータが多く、特に WAN 越えでレプリケーションしたいという場合には注意が必要です。この時間を短縮する方法を過去の記事(初回の同期時間を短縮する方法)にまとめてありますので、ぜひご覧下さい。

05

06

 

■ 検証環境

ベンチマークテストに使ったマスタ/レプリカ サーバのスペックはこちらです。

マスタサーバ:
Intel Xeon E5-2609 v3, 32GB RAM, 4TB SAS HDD (7200 rpm) x4, RAID 5, Windows Server 2016 Standard Edition, Arcserve Replication r16.5 SP7a

レプリカサーバ:
Intel Xeon E5-2620 v4, 32GB RAM, 4TB SAS HDD (7200 rpm) x4, RAID 5, Windows Server 2016 Standard Edition, Arcserve Replication r16.5 SP7a

 

今回は環境の関係で 9 TB までの検証でしたが、実際には数百 TB 以上のデータをレプリケーションされているお客様もいらっしゃいます。その際に課題になるのはやはり同期です。この記事以外にも同期に関するテクニックをまとめていますので、そちらもご覧ください。

以上、ホテがお伝えしました。

<お客様事例>

株式会社平和様:300 TB の映像データを Arcserve Replication で保護(外部サイト)

<関連記事>

Arcserve Replication/HA:同期しないでサーバを再起動したい ~ ホスト メンテナンス機能

Arcserve Replication/HA の初回の同期を早く終わらせる方法

Arcserve Replication/HA:2回目以降の同期時間に影響するもの

Arcserve Replication/HA : シナリオの並列実行で同期時間を短縮する

« Arcserve UDP Archiving: IT管理者はアーカイブされたメールには一切アクセスできません。 | トップページ | Arcserve Replication/HA : シナリオの並列実行で同期時間を短縮する »

技術情報」カテゴリの記事

Arcserve Replication / High Availability」カテゴリの記事

コメント

コメントを書く

コメントは記事投稿者が公開するまで表示されません。

(ウェブ上には掲載しません)

トラックバック

« Arcserve UDP Archiving: IT管理者はアーカイブされたメールには一切アクセスできません。 | トップページ | Arcserve Replication/HA : シナリオの並列実行で同期時間を短縮する »