InfiniBox®

革新的大容量
ストレージシステム
第四回記事:InfiniBoxのソフトウェア(その1:データ管理とInfiniRAID編)

はじめに

第四回目はINFINIDATのInfiniBox®((インフィニボックス)のソフトウェアデザインの中でも重要なデータ管理について説明いたします。
INFINIDATのInfiniBox®はSDS(ソフトウェア・デファインド・ストレージ)ではあるものの、主要部分が三重化された特徴的なハードウェアとの 組み合わせにより最大の能力を発揮します。
今回はソフトウェアの数多くの機能のうち、高い可用性と高速なリビルド性能を実現する特許技術である独自RAID機構のInfiniRAID(インフィニレイド)の 詳細とデータ管理について紹介をいたします。

InfiniBox®内部データフローの概要

InfiniBox®内部でのデータ管理は3階層のアドレス体系で管理され、全てのハードウェア資源を最小限のオーバーヘッドでバランス良く利用するように設計されています。

Virtual Unitアドレス・・・コントローラノードの資源(CPU+キャッシュ(SSD+DRAM))のバランス化
Virtual Diskアドレス・・・ソフトウェアRAIDグループのバランス化
Physical Diskアドレス・・・物理ディスクのバランス化

3階層のアドレス体系によるデータ管理はInfiniBox®内部のデータフローとして紐づいています。

図1.InfiniBox内部のデータフロー

Virtual Unit(VU)バランシングアーキテクチャ

InfiniBox®内部のストレージ領域は6つのVirtual Unit(VU)で管理されます。各ノード(コントローラ)には2つのVUが割り振られ対象のVUに対するIO処理を担当します。 また、ホストまたはクライアントがアクセスするデータセット(ボリュームまたはファイルシステム)は全てのVUにまたがるように配置されるため、ストレージにアクセスするだけで、 全てのノード(コントローラ)のリソース(CPUやキャッシュメモリ)が均等に利用されるように設計されています。
ユーザはストレージ上のデータ配置を気にすることなく、常にバランス化された最適な性能が得られるよう設計されています。

図2.Virtual Unit(VU)バランシングアーキテクチャ

InfiniBox®のデータ管理単位

InfiniBox®は書込みデータを100%DRAMキャッシュで処理し、キャッシュ上で64Kバイトのセクションに分割し管理します。
各セクションには4Kバイトのメタデータが付加され、チェックサム、タイムスタンプ、アクセス状況を示すヒートインデックス等を記録します。
チェックサムはセクション単位のサイレントデータ破壊の抑止に利用され、タイムスタンプはスナップショットで、ヒートインデックスはディスクにデステージする際のグルーピングに利用されます。
書込みデータは最長5分間(場合によっては5分以上)DRAMキャッシュに保持され、セクションに対するアクセスパターンが分析されます。

図3.InfiniBoxのデータ管理単位

InfiniRAID(インフィニレイド)によるデータ分散

InfiniRAIDとはペタバイトを超えるストレージシステムのために開発された、高い可用性と高速なリビルド処理を実現するソフトウェアRAID機構です。
データの保護は14個のデータセクションと2個のパリティーセクションで構成される仮想RAIDグループ(RAID6相当)単位に行われ、この仮想RAIDグループに 属する16個のセクションは必ず、異なる16台の物理ディスクに対して保存されます。
また、特定の物理ディスクにデータが集中しないよう全ての物理ディスクに対してストライプして書込みを行います。サーバやクライアントからのI/Oがランダム アクセスの場合でも、DRAM上で仮想RAIDグループにまとめられ、物理ディスクへの読み書きはシーケンシャルアクセスとなります。

図4.InfiniRAIDによるデータ管理と物理ディスクに対するデータレイアウト

InfiniRAIDの特徴

InfiniRAIDの特徴をまとめると以下の通りとなります。
1,088Kバイトの仮想RAIDグループ(14D+2P)
全ての物理ディスクにストライプしてセクションを書き込む
ディスクへの読み書きはシーケンシャルアクセスのみ
データの上書き時に読出し処理が行われない(Read-Modify-Writeを行わず、シーケンシャルライトのみ)
スペアディスク無し(全ての物理ディスクの一部の領域を仮想ホットスペアとして予約(InfiniSpare))
ディスク故障時は消失したデータのみ残る全ての物理ディスクからリビルド(再生成)
業界最速のリビルド時間(パリティー保護の状態まで最長15分間(F6000シリーズ、4Tバイトのディスク故障時))

まとめ

●Point
今回は、InfiniBox®のソフトウェアデザインのなかでも重要なデータ管理について紹介しました。 特にストレージメディアの配分とI/Oフローについても紹介しました。さらに最後にデータ管理方式についても触れました。


次回は、第五回:InfiniBox®のソフトウェア(その2:ニューラルキャッシュ編)
~InfiniBox®の常に学習して進化するキャッシュ制御、ニューラルキャッシュの紹介~をお届けします。

【著者紹介】
INFINIDAT製品技術責任者
遠藤秀喜(えんどうひでき)

【略歴】
最先端のエンタープライズ向けストレージ製品の技術を担当
SIerの立場から長年エンタープライズストレージの研究を続ける
エンタープライズストレージのエバンジェリスト

お問い合わせ・資料請求はお気軽に

SCSK株式会社
ITインフラ・ソフトウェア事業本部
サーバ・ストレージ部
INFINIDAT チーム

お問い合わせフォーム
page top