プライベート環境に最適なクラウドストレージとは?EMC ECSアプライアンス(前)

2015年6月3日(水)
平原 一雄

冒頭からいきなりですが、EMCと聞いてどんなイメージをお持ちですか? データベースやドキュメントファイルなど、企業の基幹業務データを格納するためのブロック(SAN)またはファイル(NAS)ストレージベンダーで、しかもどちらかというとハイエンド製品を扱っている。そんなイメージでしょうか...今回はそんな従来の製品とまったく異なり、新しいタイプのストレージ製品である、EMC ECS アプライアンス(以下、ECS)を紹介します。

製品名である「ECS」はElastic Cloud Storage(弾力・伸長性のあるクラウドストレージとでもいいましょうか)の略ですが、EMCの考え方を通して、このようなストレージが必要とされるに至った背景から説明したいと思います。

EMCのソフトウェアディファインドストレージ戦略とは?

EMCの戦略を考えるうえで、重要なキーワードに「第3のプラットフォーム」があります。この言葉は、調査会社の米IDCが提唱している新しいプラットフォームの概念で、モバイル、ソーシャル、ビッグデータ、クラウドの4つの要素を活用するところに、従来型の「第2のプラットフォーム」と大きな違いがあります。

第3のプラットフォームを活用した先進的なビジネス事例としては、米GE(General Electric)社が良く知られているところでしょう。GE社は、飛行機のエンジン1台当たりに搭載されている3000個ものセンサから、1時間あたり10TB近くのデータを集め、このデータをすばやく分析することで、故障の予兆検知、メンテナンスや燃料消費の効率化提案といった、顧客の課題解決につなげる新しいビジネスを展開しています。

では、この第3のプラットフォーム上の次世代アプリケーションが、第2のプラットフォーム上のアプリケーションと大きく異なるところは何でしょうか? それは、これまでの主としてデータベースに格納されている業務データから過去の洞察を得る「改善型」ではなく、モノから生成される大量の「素のデータ」をリアルタイムに分析、活用する「予測型」であるということです。

そして、この予測に使われるリアルタイム分析技術として良く知られているものにHadoopがありますが、実はHadoopは数式を駆使した高度な分析モデルではなく、集計をベースにした非常に単純な分析モデルを採用しています。したがって、Hadoopは高速処理ができる代わりに、複雑な分析は行いません。この仕組みで分析精度を高めるには、より多くのデータを処理する必要があります。

そのために、第3のプラットフォームのアプリケーションでは、これまでの業務データとは比較にならない大量の分析データを確実に格納する仕組みも併せて必要なのです。もちろん、これまでに蓄積してきた基幹業務のデータも、まったくなくなるわけではありません。むしろ、両者のデータを組み合わせて、並行活用する場面のほうが増えてくるでしょう。EMCのソフトウェアディファインドストレージ戦略は、ViPRを核として、第2および第3のプラットフォーム間で最適なストレージ環境を、ソフトウェア制御によって迅速かつ容易に提供できることを目指しています(図1)。しかし、このような仕組みを従来型のストレージのみで構築することは、コスト的に見合わないのが現実です。そこで、第3のプラットフォームに対応した経済性を「再定義(redefine)」するストレージが必要であり、そのストレージがまさにECSなのです。

EMCのソフトウェアデファインドストレージ体系

図1:EMCのソフトウェアデファインドストレージ体系

素朴な問いかけ...本当に大事なデータを外に置いてしまっていいの?

ECSは、利用形態から見たカテゴリではクラウドストレージと呼ばれるものに属する製品ですが、クラウドストレージと聞くと、普通はAmazon S3、Google Drive、 Microsoft OneDriveのような、パブリッククラウドのオンラインストレージを思い浮かべるでしょう。ともすると、このECSは、パブリッククラウドビジネスを展開している企業でしか使えない製品と考えられがちですが、はたしてそうでしょうか?

答えは「NO」です。ECSはクラウドサービスプロバイダにも最適な製品ではありますが、それ以上に我々はECSを一般企業のお客様に使っていただきたいのです。オンプレミスの世界にクラウドストレージの経済性と利便性を持ち込むこと、これこそがECSの目指すところであり、我々のソフトウェアディファインドストレージ戦略にも一致するところなのです。

では、なぜオンプレミスに対応したクラウドストレージが必要なのでしょうか? 大きな理由としては、ITガバナンスや企業コンプライアンスの観点です。パブリッククラウドは必要なときに必要なITリソースを瞬時に利用できるのが売りですが、実は一般企業の事業部門レベルでも、社内のIT申請プロセスの煩雑さから、パブリッククラウドサービスを使ってみようという動きが出ているのは想像に難くないと思います。

結果としてもたらされるのは、社内IT部門の統制が効かないところに生まれるシャドウITの出現です。以前から自部門内に勝手にサーバーを立てて運用するシャドウITは存在していたのですが、クラウドの時代になって、シャドウITが抱えるリスクは別の観点で高くなっているといえます。それは、これまでのシャドウITはどんなに統制が効いていなくても、少なくともデータは企業内部に留まっていたものが、クラウドベースのシャドウITとなった途端、重要なデータは企業の外に飛び出すことになるからです。

もちろん、クラウドサービス事業者もセキュリティに厳格なデータセンター運用や各種障害に対するデータ消失への保護策は講じているので、安易にデータが外部流出したり、消失したりということはないでしょう。しかし、有名なクラウドサービスともなれば、名誉税(?)ではありませんが、ハッカーからの攻撃の的にされる確率は格段に増えますし、置き場所を意識しないクラウドサービスでは、たまたまデータが保管されている地域や国の情報開示法に触れることもあり得ます。

すなわち、クラウドサービスを使うに当たっては、保管したいデータのリスクアセスメントを通して、対象とするデータ管理にそのサービスが適合するか否かの検討がしっかりとなされるべきなのですが、現実はそういった考慮もあまりされることはなくパブリッククラウドサービスは使われ、データ管理におけるビジネス上のリスクはむしろ増しているといえるでしょう。

では、パブリッククラウドのように安くて、企業コンプライアンスにもしっかり対処しながら、すぐに使えるソリューションってあるのでしょうか? そんな要望に応えるのがECSなのです。

ECSとはどんな製品?そして、その特徴は??

ECSは、これ1台で完全なクラウドストレージプラットフォーム機能を提供するアプライアンス製品です。導入に際して、ハードウェアのラックへのマウントや結線作業、ソフトウェア導入といった、ECSのセットアップに関する作業はほとんど不要です。ECSを使えば、大量データの保存や分析基盤との連携による保存データの有効活用が低コストで実現できます。また、海を隔てたジオ(地理的)スケールの基盤構築も可能で、マルチサイトでのアクティブ−アクティブアクセスとコンテンツ共有も容易に実現できます(図2)。では、ECSの特徴や優れている点を見ていきましょう。

完全なクラウドストレージプラットフォーム

図2:完全なクラウドストレージプラットフォーム

競争力のあるプライシング

なんといっても、パブリッククラウドとの比較において重要なのは価格です。ここが安くなければどんなに優れた機能、技術であっても社内に置いてもらうことはできないでしょう。では、どのようにしてECSは低価格を実現しているのでしょうか? 実は、ECSのハードウェアはどこででも手に入るx86サーバーや10Gbイーサネットスイッチなどの民生品を組み合わせて構成されているのです。これらのハードウェアは量産効果も高く、いわゆる「規模の経済」で安く調達できるため、低価格を実現できるというわけです。これは、必要とする機能から専用のハードウェアを設計してきた、これまでのEMCストレージ製品とは異なる考え方です。

ソフトウェアベースのインテリジェントなストレージ機能

次は機能面です。いくら低価格でも「安かろう、悪かろう」ではこれまた検討の対象となり得ません。これまでのEMC製ストレージは、特に高信頼性の確保のために専用のハードウェアを使うことも多かったのですが、ECSは信頼性確保も含め、ストレージ機能はすべてソフトウェアで実装されています。では、すべてをソフトウェアで処理することに対して性能面の問題はないのでしょうか? そこは心配無用です。皆さんのIT基盤でも、x86サーバーが企業の基幹業務で十分な処理能力を発揮していることは証明されてますよね? ECSは複数サーバーのクラスタでソフトウェアを実行し、必要であればラック単位でスケールアウトさせることで専用ストレージと遜色のない性能を実現しているのです。では、個々の機能の優位性を見てみましょう。

マルチワークロード(オブジェクト&HDFS)対応

ECSはワークロードに合わせた複数のアクセス方法に対応し、これ1台でモバイルやソーシャルから収集したデータをオブジェクト経由で格納し、Hadoop環境からはHDFS経由で直接格納したデータへのアクセス、分析の実行が可能となります。オブジェクトアクセスは、S3およびOpenStack Swiftなどデファクトスタンダードに準拠し、世の中で広く活躍する開発者スキルの活用が可能です。また、今年の後半にはNFSでのファイルアクセスにも対応します。

真のロケーションフリー、グローバルアクセスの実現

一般的なパブリッククラウドサービスは、リージョンと呼ばれる考え方により、データの格納先となるバケットを、日本~米国間など複数リージョンにまたいで構成できません。このため、リージョン間のデータ同期は技術的に可能でも、ユーザーがどこのバケットにデータを入れるかは常に意識する必要があります。ECSは地理的に離れたマルチサイトで構成されていても、サイト間で共通な単一のバケットを作成でき、また、データがどこに保存されているかの情報(ネームスペース)をサイト間で共有しているために、ユーザーは場所を意識せず、どこからでもデータの自由な読み書きが可能です。日本で書いたデータをアメリカで読み書きすることも当たり前です。ECSならグローバルにビジネス展開している企業データのコンテンツ共有も容易に実現できます。

パフォーマンスと容量効率の両立設計

他社製品の中には、RAIDパリティに似た保護コード(イレージャコーディングと呼ばれる)を付加したデータを、サイト間にまたいで分散配置させる仕組みのものもありますが、この場合、ハードウェア障害時のデータ復元はもちろんのこと、データの読み出しや書き込みといった一般的なデータ操作に対してもサイト間のWAN回線に大きな負担がかかるケースがあります。ECSではデータ復元や一般的なデータ操作に関してはできるだけローカルサイトで処理を閉じる設計をとっており、非同期のジオレプリケーション、リモートキャッシュアクセスを除いてはWAN回線にインパクトを与える操作を最小限にしています。

また、容量効率の観点では、ジオレプリケーションでデータを単純コピーするのではなく、3サイト以上の構成では、サイト数が増えるごとに容量効率が高まる仕組みを採用しています(図3)。正直に言うと、ECSの容量効率は他社の容量効率を売りにする製品と比較して劇的に高いわけではありません。しかし、ECSはマルチサイトでの一般的な利用ケースにおいて、性能や回線効率を犠牲にすることなく、最大限の容量効率を実現する絶妙な設計となっているのです。

ジオレプリケーションにおけるディスク容量の効率化

通常時の動き

図3:通常時の動き

サイト2はコピーデータA/Dをそのまま保持せずに、コピーデータはA/DからXOR計算されたデータEのみを保持(AとDは削除されるため容量効率が向上)。

被災時の動き

図4:被災時の動き

被災サイト1のデータが要求されたら、サイト3からコピーしたデータDとXOR計算されたデータEからデータAを復元。復元したデータはサイト3でもコピーを保持。

~次回に続く

EMCジャパン株式会社

EMCジャパン株式会社 システムズエンジニアリング本部 プロダクトソリューション統括部 アドバイザリーシステムズエンジニア

主に外資系ITベンダー、ソフトウェアディストリビューターで、ハードウェアの品質保証やカスタマーサポート、プロダクトスペシャリスト等を経て、2006年にEMCジャパン(株)に入社。以来、一貫してストレージ管理ソフトウェア製品を担当するSEとしてプリセールス活動に従事している。

連載バックナンバー

Think ITメルマガ会員登録受付中

Think ITでは、技術情報が詰まったメールマガジン「Think IT Weekly」の配信サービスを提供しています。メルマガ会員登録を済ませれば、メルマガだけでなく、さまざまな限定特典を入手できるようになります。

Think ITメルマガ会員のサービス内容を見る

他にもこの記事が読まれています