2021年7月16日金曜日

Nutanixのストレージ設定について~Erasure Coding / Compression / Deduplication~

みなさん、こんにちは

本日投稿の内容について、以前別サイトで私が投稿したブログの内容です。
サイトの閉鎖に伴い、こちらで再度掲載いたします。

今回はNutanixのストレージ設定(Erasure Coding/Compression/Deduplication)についてご紹介します。

Nutanix Enterprise Cloud Platformには、あらゆるワークロードで利⽤可能な容量を効率的に利⽤するために連携して機能する、幅広いストレージ最適化テクノロジが組み込まれています。 これらのテクノロジはインテリジェントでワークロードの特性に対応しているため、⼿動による設定や微調整が不要です。
以下のストレージ最適化⼿法を活⽤できます。

イレージャーコーディング(Erasure Coding)︓
クラスタの有効容量または使⽤可能容量を増やします。Erasure Codingを有効にした後に⽣じる容量削減は、圧縮および重複排除の容量削減に追加されます

圧縮(Compression)︓
2種類の圧縮のうちの1つを可能にするオプションのコンテナ設定・ポストプロセスの圧縮︓データは書き込まれた後に圧縮されます・インラインの圧縮︓データが書き込まれる際に圧縮されます

重複排除(Deduplication)︓
パフォーマンスを向上させるためのプレミアム層(RAMとフラッシュ)、またはストレージスペースの節約のための容量層(HDD)での同⼀のゲスト仮想マシンデータの共有。コンテナーまたはvDiskのプロパティによって有効になります

それでは、各設定についてイメージで説明したいと思います。

1. イレージャーコーディング
Erasure Codingを使用すると、クラスターの有効容量または使用可能容量が増えます。 Nutanixはデータ回復力のためにデータコピーを維持します。Redundancy Factor 2を設定した場合、2つのデータコピーが維持されます。 Redundancy Factor 3を設定した場合、3つのデータコピーが維持されます。

今回の構成は6ノードで4つのデータブロックをRF2の構成時のイレージャーコーディングの説明になります。⼀⾔で⾔いますと、ノードをディスクに⾒⽴ててRAIDを構成するイメージになります。通常はミラー構成なので容量は半分になりますが、イレージャーコーディングは約70%程度効率が上がります。ノード数が増えるほど、容量効率が上がるような仕組みになります。

例えば、4つのデータブロック(a b c d)を持つ6ノードのクラスタを考えます。 Redundancy Factor 2が設定されているため、データの2つのコピーが維持されます。 次の図では、赤色のテキストがデータコピーを表しています。

Redundancy Factor 2構成において単一ノード障害保護を保管するために、パリティ「P」およびデータブロックa、b、c、dが別々のノードに配置される。 パリティを使用して冗長性を実現すると、システム上の合計データが2 x(a + b + c + d)ではなくa + b + c + d + pになるため、データの再調整が行われます。 この例では、8つのデータブロックではなく5つのデータブロックがあります。 

データブロックcを含むノードが故障した場合、データブロックcは、ここに表示されているように、Erasure Codingされた部分の他のメンバー(a b dおよびp)を使用することによって回復される。 次にブロックcは、このErasure Codingされた部分の他のメンバを持たないノードに置かれる。 

2. 圧縮(Compression)
コンテナは圧縮を有効にできます。Snappy圧縮ライブラリを使⽤した書き込み操作中または 書き込み操作後にデータの圧縮が⾏われます。 Nutanixによるテストでは、ディスクスペース 使⽤量の約30%の削減が⽰されていますが、実際のディスクスペース使⽤量の削減は環境ごとに異なります。

次の種類の圧縮が利⽤可能です

ポストプロセスの圧縮︓
データは書き込まれた後に圧縮されます書き込みと圧縮の間の遅延時間は設定可能です。
ワークロードごとに異なるI/Oプロファイルが あるため、Nutanixに推奨される遅延値はありません。このタイプの圧縮は、ほとんどのワークロードにお勧めです

インラインの圧縮︓
データが書き込まれる際に圧縮されます
このタイプの圧縮は、バッチ処理を実⾏するほとんどのワークロードに推奨

圧縮は記憶容量の使用を最適化します。この容量を最大限に活用するには、どのユースケースとワークロードが圧縮から最もメリットを得て、どの内容がコンピュートへのオーバーヘッドが圧縮に対してメリットをもたらすかを理解することが重要です。 

3. 重複排除(Deduplication)
重複排除については、リードキャッシュ⽤の重複排除と容量削減⽤の重複排除の⼆つがあります。どちらの機能を利⽤するかは、購⼊するエディションにも依存するので注意してください。
さらに、重複排除が有効になっているクラスター内のコントローラーVMは、追加のRAMで構成する必要があります。
  • キャッシュ重複排除︓24GB RAM
  • 容量重複排除︓32GB RAM
重複排除についてもベストプラクティスがあります。データの特性やワークロードにより、使⽤しても意味がない場合がありますので、⼗分に注意して利⽤してください。

ストレージ機能としては当たり前のようにサポートしている機能ですが、どのようなもので利⽤するのかを含めて、最適なストレージの設定を⾏うようにして頂ければと思います。

以上、よろしくお願い致します。

0 件のコメント:

コメントを投稿

注: コメントを投稿できるのは、このブログのメンバーだけです。