« アクセス権のレプリケーション | トップページ | 最新版への無償アップグレード-申し込み受付中!! »

2010年7月13日 (火)

提案時に確認すべき3つのポイント

マサオミです。

ほぼ隔週になってきてますね・・・。
なるべく2週間に1度くらいは更新していきますので、
引き続きよろしくお願いします。

さて、Tech Tuesdayの本日は
「提案時に確認すべき3つのポイント」をご紹介します。
知っている方にはおなじみの内容ですが、
おさらいも兼ねて読んでいただければ嬉しいです。

いきなり結論からお伝えすると、3つのポイントとは以下です。

1. データ容量 (+更新量)
2. 総ファイル数
3. 回線速度

これで全てではないですが、
特に「ファイルサーバのデータを遠隔地に送る」という場合には
上記の3つは最低限確認をしておいてください。

レプリケーション開始前には同期処理を必ず行い、
マスタサーバ・レプリカサーバ間でデータが完全に一致している状態を
作ります。(ベースラインをあわせる処理)

同期処理を始める前にマスタ、レプリカサーバそれぞれが
その時点で持っているデータをスキャンして調べます。
ここで重要になるのが、「総ファイル数」です。
ファイル数が多いと、スキャンにも時間がかかるからです。

環境にも寄るため一概には言えませんが、 弊社内で行ったテストの結果では
300万ファイル程度であれば30分~40分くらいで終わりますが、
これが800万ファイル、1000万ファイル・・・と増えてくると
スキャンだけでも3時間近くかかる場合もあります。
(厳密にはフォルダ階層の深さなども関係するため、
  必ずこの時間になるとはいえませんが、参考までに)

総データ容量」はレプリカサーバに送らなければならない
データの総容量なので、回線を通じて送るのか
輸送するのかに関わらず把握しておくべき重要な情報です。
(と、改まって言うほどの話でもありませんが・・・汗)

更新量」や「回線速度」の情報も知っておくべき
重要情報であることは言うまでもありません。

ここで合わせて認識いただきたいことは
更新されたデータ量を、利用する予定の回線速度で送れるか否かは
単純に「割り算をする」だけ、ということなんです。

1つ例をあげてみましょう。

【質問】
毎日100GBのデータが新規に生成される環境で、
回線速度は10Mbps程度です。レプリケーションできますか?

10Mbpsの回線を利用していたとしても、実際出るスピードは
半分もないでしょう。その上、レプリケーションで利用できる
帯域を考えると、おそらく2Mbps程度になるかと思います。

では、この回線を使って100GB(=102400MB)のデータを
送るには・・・

【計算式】
2Mbps / 8bit = 0.22MB/s
0.22MB/s * 3600s/h = 792MB/h
102400MB / 792MB/h ≒ 129.3 h ≒ 5.39日

と、およそ5日と9時間半くらいかかる計算になります。
単純に割り算をしていくとかかる時間がざっくりと把握できます。

実際には一日100GBのデータが生成されるとなると
結構大変な量だと思いますが、例えば、
「ディスクにバックアップしたデータをレプリケーションしたい」とか
「リアルタイムではなくスケジュール同期で実施したい」
というご要望をいただくと このような話になることがあります。

【おさらい】 確認ポイント

1. データ容量 (+更新量)
2. 総ファイル数
3. 回線速度

参考になりましたでしょうか?
レプリケーションのご提案時や、利用を検討する際の
材料にしていただければ幸いです。

それでは、本日はここまで。

See you in next TT. . .

|

« アクセス権のレプリケーション | トップページ | 最新版への無償アップグレード-申し込み受付中!! »

よく聞かれる質問」カテゴリの記事

技術情報」カテゴリの記事

トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/553787/48865410

この記事へのトラックバック一覧です: 提案時に確認すべき3つのポイント:

« アクセス権のレプリケーション | トップページ | 最新版への無償アップグレード-申し込み受付中!! »