« Arcserve UDP Linux版のWebinarを紹介します。 | トップページ | Arcserve OneXafe の使用状況を把握!OneSystem レポートの使い方(1) »

2023年11月17日 (金)

Arcserve OneXafe クラスタがノード障害時にサービスを継続する仕組み(2)

先日の投稿で、Arcserve OneXafe の複数ノード クラスタでは一部のノードが障害でダウンしてもサービスを継続できること、ただし、スプリット ブレインを避けるため過半数のノードが生きている必要がある、ということをご説明しました。

では、2 ノード クラスタの場合はどうでしょうか?1 台で障害が起きてしまうと、残りの 1 台では過半数が取れないので、クラスタ全体がサービスを継続できないという事になってしまうのでしょうか?

 

## 2 ノード クラスタは疑似的な3ノード クラスタ

実は、2 ノード クラスタは例外的に、生存ノードが1 台だけで、過半数が取れていなくてもサービスを継続できることがあります。

2 ノード クラスタは 2 台のうちのいずれかのノードが 2 票を、もう 1 台が 1 票の合計 3 票を持った疑似的な 3 ノード クラスタとして扱われます。1 票を持った方のノードがダウンした場合、残されたノードは 2 票を持っているのでそのノード上でサービスが継続されます。逆に 2 票を持ったノードがダウンした場合は残されたノードはサービスを継続することはありません。

02_2nodes

Arcserve OneXafe ユーザ ガイド - 偶数台の OneXafe でのクラスタ構成のサポート より引用

2 ノード クラスタでは、3 ノード クラスタをエミュレートするために、ノードの 1 つが 2 票を持つようにクラスタ コンセンサスのロジックが変更されました。このロジックにより、ノード障害が発生した場合でもスプリット ブレインを回避できます。初回のクラスタ構成以外に管理者が行う必要のある設定はありません。2 ノード クラスタでは、2 票を持つノードがオフラインの場合、クラスタは使用できなくなります(論理的には、クラスタ内の 3 つのメンバのうち 1 つのみが使用可能なので、クラスタはコンセンサスを得られません)。

 

この仕組みにより、2 ノード クラスタでは 1 ノード クラスタと比べて容量を拡張しながら、スプリット ブレインを避け、かつ、可用性を下げないようにすることができます。

 

## 可用性を向上させたいのであれば、3ノード以上を推奨

以下、ノード数別にクラスタ全体の可用性を計算してみました(※1)。1 ノード クラスタと 2 ノード クラスタの計算上の可用性は同じであることが分かります。もし、Arcserve OneXafe の可用性を向上させたいという事であれば、3 台以上でクラスタを構成する必要があるという事も分かります。

07_availability

 

以上を踏まえ、ご予算次第ではありますが、Arcserve OneXafe で複数ノード クラスタを組むのであれば、3 ノード以上の構成をお勧めしています。

3 ノード以上のクラスタでは、クラスタ用ネットワークのためにスイッチをご用意いただく必要もあります。今は1-2台だけれど後からノードを増やすかも?という方は以下のガイドを読んでネットワークの要件も把握しておいてください。

Arcserve OneXafe 複数ノード クラスタ構成ガイド

 

## Arcserve OneXafe はノード障害だけではなく、HDD 障害にも強い!

ここまで、ノード全体がダウンする障害を想定してクラスタ全体の可用性についてご説明しました。クラスタ内のノード数が増えるとノード障害への耐性は高まりますが、一方でハード ディスク ドライブ(HDD)の本数が増えるので(※2)、HDD 障害が心配という方もいらっしゃるかもしれません。

その点もご安心ください。Arcserve OneXafe では1つのデータ ブロックを 3 つの HDD に書き込む仕様になっているため、同時に 2 つの HDD が故障してもデータは無くならず、利用し続けられます(※3)。

04_3copy

Arcserve OneXafe 4500 シリーズご紹介資料 - P.15 より引用

 

以上、ホテがお伝えしました。


※1 計算を単純にするために各ノードの可用性が 99% であると仮定して計算しています。2ノード クラスタの可用性は以下の方法で計算しています。長くなるので省略しますが、3ノード クラスタの可用性も同じ方法で計算しています。ネットワーク障害によるサービスの停止は考慮していません。

ノードとクラスタの状況 その確率
2 票を持つノード(ノードA):生存
1 票を持つノード(ノードB):生存
クラスタの状態:サービス稼働
0.99 × 0.99 = 0.9801
2 票を持つノード(ノードA):生存
1 票を持つノード(ノードB):停止
クラスタの状態:サービス稼働
0.99 × 0.01 = 0.0099
2 票を持つノード(ノードA):停止
1 票を持つノード(ノードB):生存
クラスタの状態:サービス停止
0.01 × 0.99 = 0.0099
2 票を持つノード(ノードA):停止
1 票を持つノード(ノードB):停止
クラスタの状態:サービス停止
0.01 × 0.01 = 0.0001
2 ノード クラスタの可用性 0.9801 + 0.0099 = 0.9900 = 99.00%

※2 Arcserve OneXafe 4512-240 1台には 12 本の HDD が搭載されています。3ノード クラスタだと HDD は合計 36 本、7ノード クラスタだと合計 84 本になります。

※3 とはいえ、3 本同時に壊れてしまうとデータは失われるので、HDD 障害が起きた場合はお早めに Arcserve テクニカル サポートにお問い合わせください。

« Arcserve UDP Linux版のWebinarを紹介します。 | トップページ | Arcserve OneXafe の使用状況を把握!OneSystem レポートの使い方(1) »

Arcserve OneXafe」カテゴリの記事

コメント

コメントを書く

コメントは記事投稿者が公開するまで表示されません。

(ウェブ上には掲載しません)

« Arcserve UDP Linux版のWebinarを紹介します。 | トップページ | Arcserve OneXafe の使用状況を把握!OneSystem レポートの使い方(1) »