2025/1/6 一部修正: 4ノードの記載修正と内容改善
=========================
この記事は Nutanixアドベントカレンダー2024 の「12/8」の記事です。
目次
- 目次
- AOS 7.0のリリース
- 今回の内容
- Replication Factor構成のアップデート
- 3ノード構成における1N/1Dと1N&1Dとの違いを考えてみる
- 1N&1D RF3クラスターを作成してみる
AOS 7.0のリリース
2024年10月に「AOS 6.10(LTS)」がリリースされたばかりですが、それに続けて12月4日に「AOS 7.0」なるものがリリースされました。
AOS 7.0からは、LTS/STSというサポート期間の考え方や区別が廃止されており、今後はリリースから15か月のメンテナンスと9か月のサポートで統一されるようです。
そのため、立て続けにLTSが出たのではなく、今後はどのメジャーバージョンも2年間のサポートがあるようです。これから情報が出てくると思いますので期待して待ちましょう。
今回の内容
AOS 7.0のアップデートで気になった「1N&1Dの耐障害性(3ノード RF3)」について、書いてみます。
Replication Factor構成のアップデート
Nutanixでは「RF」という冗長/複製係数によって、データが2重・3重で冗長化されますが、AOS 7.0のアップデートにて、新しく以下の構成が登場しました。
- RF3 : 最小・最大3ノード(1N&1D)
- 1ノードおよび1ディスクの同時障害に耐える
- 2つのディスクの同時障害に耐える
▽表にまとめるとこんな感じです。
「1Night & 1Day」ではなく「1Node & 1Disk」です!
1N&1Dでは、3ノードでデータを3重化するので、1ノード+1ディスクまでの耐障害性を可能としたようです。ただし、メタデータのコピーも3つとなるため、3ノード構成で2ノード停止した場合に起きるスプリットブレインなどの観点から、2ノードの同時障害には耐えられないという事になるかなと考えられます。(データは生きているかもしれませんが。)
参考:
Replication Factor
https://portal.nutanix.com/page/documents/details?targetId=Web-Console-Guide-Prism-v7_0:wc-replication-factor1-overview-c.html#nconcept_dg1_3w4_ypb__section_cdp_ylg_ldc
Cluster Fault Tolerance
https://portal.nutanix.com/page/documents/details?targetId=Web-Console-Guide-Prism-v7_0:wc-cluster-fault-tolerance-c.html
3ノード構成における1N/1Dと1N&1Dとの違いを考えてみる
ノード単体の障害の場合
1N&1Dはストレージ効率がRF2に比べて悪くなりそうですが、3ノード構成で単体ノード障害だけを考えた場合、実はストレージ容量はどちらも同じになりそうです。
1N&1Dの場合、はじめから3重コピーを持っているので、単体ノード障害が発生してもまだ2重コピーの冗長性があり、すぐにリビルドもかけない仕組みとなっているようです。はじめから3重で持つか、あとからリビルドをかけるかの違いですね。
ノードとディスクの同時障害の場合
3ノード構成でストレージのサイジングに違いが出てくるのは、ノードとディスクの同時障害を考えた場合です。1N&1Dでは、データを3重コピーしますので、単体ノードと単体ディスクの同時障害に耐えることができます。
そのため、従来のRF2に比べて、単一ディスクのリビルド分の容量を追加で見積もっておく必要があります。イメージとしては以下の通りです。
ただし、ノード数が5ノード以上になると、従来通りのRF3(2N/2D)を導入すればいいため、この「1N&1D RF3」は、Nutanix最小の3ノード構成において、従来のRF2よりも可用性を高めたいユーザー向けに導入できる設定 といえます。
なので、構成ノード数にあわせて 3ノード RF3 と呼んだらよさそうですね。
4ノードでは構成できないところが気になる方もいると思いますが、1N&1D(RF3)は、部品の配送や保守員の手配などに時間がかかる遠隔地の3ノードクラスターといった特定の環境下における障害リスクを軽減するために、特別に開発された構成のようです。そのため、3ノード→4ノードへの拡張性がない構成となりますので導入を検討される際はご注意ください。
ちなみに、ライセンスについては、まだ正確な情報が得られていないですが、RF3なのでNCI Proになる可能性があります。Nutanixさんに聞いてみたいですが...。
ストレージ容量などのサイジングに関する詳細はリンク先ドキュメントをご参照ください。
https://portal.nutanix.com/page/documents/details?targetId=Web-Console-Guide-Prism:wc-cluster-fault-tolerance-c.html
1N&1D RF3クラスターを作成してみる
Foundation 5.7以降、Foundationのパラメーター設定でAOS 7.0を選択すると、以下のように最小3ノードのRF3を選択する項目が出てきます。
また、3ノード RF3で構成した場合は、Prism Elementの画面で以下のように表示されます。
ホームダッシュボードでも、ノードとディスクの耐障害性が表示されていますね。
今回は以上となります。
3ノード構成の特定の環境下で可用性を高めたいというユーザーがいる場合は、ぜひこちらを紹介してみてはいかがでしょうか?