PR

Veritasが機械学習を応用した分類機能を持つSDS、Veritas Cloud Storageを発表

2017年12月27日(水)
松下 康之
情報管理ソリューションのVeritasが記者発表会を実施。機械学習を応用したソフトウェアデファインドストレージ(SDS)の新製品について解説を行った。

情報管理ソリューションのVeritasが、都内で記者発表会を実施し、ソフトウェアデファインドストレージ(SDS)の新製品について解説を行った。VeritasはSymantecの一部門から2016年に独立したストレージ及びバックアップで著名な企業だが、今回の新製品はソフトウェアをベースにしたオブジェクトストレージで「Veritas Cloud Storage」と呼ばれるものだ。出荷は2017年12月4日から開始される。

一般的なストレージは、ブロックストレージ、オブジェクトストレージ、そしてファイルストレージの3種類に大別される。今回発表されたCloud Storageはオブジェクトストレージだが、単にコモディティサーバーのストレージをオブジェクトストレージとして利用するだけではなく、Veritasならではの付加価値があるという。

発表会に登壇したのはデビッド・ノイ(David Noy)氏だ。ノイ氏は元DELL EMCでIsilonを担当していたというストレージのベテランだ。ノイ氏はDELL EMCからVeritasに移った理由のひとつとして「従来のハードウェアによるストレージではなく、ソフトウェアを使って違うことをしているのがVeritasだったから」とコメントし、Veritasが従来のアプライアンスベースのストレージベンダーとは違うことを強調した。

SDS及びアプライアンス製品担当バイスプレジデント、デビッド・ノイ氏

SDS及びアプライアンス製品担当バイスプレジデント、デビッド・ノイ氏

ノイ氏によれば、今後もデータの増加は続き、2020年には52ZB(ゼタバイト、1TBの10億倍)のデータが発生するというデータを示し、今後もストレージへのニーズは高まると説明した。52ZBというデータの量は、HDビデオの動画、1億5千万年分にも相当するという。後半に登壇したアーキテクトの星野隆義氏は、この膨大なデータを「1PBの5200万倍、スマートフォンの1兆台分」と表現し、今後生成される膨大なデータの管理が重要になるということを強調した。

ストレージに対する課題として、特に非構造化データが増えることから、「データからのインサイト獲得」「ストレージ管理の簡略化」の2点を挙げ、他にストレージが個別に隔離されてしまう「ストレージサイロの解消」、そして「パフォーマンス」を挙げた。この中でVeritasとして特徴的な部分は、最初の「データからインサイトの獲得」という部分だろう。

これはVeritasのデータガバナンス製品(Data Insight)やアーカイブ製品(Enterprise Vault)にすでに搭載している「Integrated Classification Engine」による分析と分類の機能だ。Integrated Classification Engineに搭載される機械学習を用いることによって、例えばデータに個人情報やクレジットカード情報を含むかどうかを判定し、必要なメタデータを付ける機能を実現しているという。このメタデータをカタログとしてCloud Storageが管理を行うことによって、膨大なデータを効率良く管理できるというのがポイントだ。またデータの中身からアクションを起動できるワークフローの機能によって、データを有効活用できるという。

Cloud Storageは特別なハードウェアを必要とせずに、コモディティハードウェア及びパブリッククラウドの上でも稼働させることができると言う。ただ、現時点ではレプリケーションを行う機能だけが実装されており、オンプレミスとパブリッククラウドを包括的に管理できる機能は、今後実装される予定だという。

ノイ氏は事例として医療機関における患者データの管理を挙げ、「大量なデータを分類することで人的エラーを抑制し、無駄なデータを削減することで管理が容易になる」と解説した。しかしこのユースケースそのものは、Cloud Storageの導入事例ではなく、あくまでVeritasが想定している利用例だという。

後半には日本法人であるベリタステクノロジーズ合同会社のインフォメーション・アベイラビリティアーキテクトである星野隆義氏が登壇。より詳しい解説が行われた。

ベリタステクノロジーズ合同会社のアーキテクト、星野氏

ベリタステクノロジーズ合同会社のアーキテクト、星野氏

星野氏はベリタスの次世代ストレージ戦略の5つの柱となる「Custom Metadata」「Classification」「Action for BI」「Geo Awareness」「Scalability」について解説を行った。ここでの注目は、分類を行うClassificationとGeo Awareness、そしてScalabilityだろう。

Classificationは、生のデータが格納される際に前述したIntegrated Classification Engineがメタデータを付与する部分だ。すでに約60種類の定型ポリシーと約100種類の検出パターンが用意されており、クレジットカード番号やソーシャルセキュリティーナンバーなどが含まれていることを検出できるという。この部分はカスタマイズを行うことで、各ユーザーの要求する仕様に合わせられるようだ。

Geo Awarenessに関してはもうすぐ施行されるGDPR(General Data Protection Regulation、一般データ保護規則)に対応した「データが生成された地域に合わせて保護を行う」機能を実装した部分だ。GDPRはすでに有効となっているEUにおけるデータ保護法を拡張した法令で、2018年5月の施行が予定されている。データをEU圏外に持ち出せないという制約を受けて、グローバルにビジネスを行っている企業にとっては「個人情報をいかに活用するか?」に際しては充分に留意すべきポイントだ。パブリッククラウドの発展に合わせて、データがオンプレミスのデータセンターとクラウドを行き来することを考えると必要な機能要件と言える。Veritasがソフトウェアデファインドストレージに地理情報を考慮した機能を盛り込んできたことは、注目に値するだろう。

またScalabilityに関しては「容量制限なし」「128ノードまで」と言う記載があったが、星野氏によれば「理論上はノードの上限はない。128はVeritasが現在確認している検証システムのサイズ」であるという。データセンターが拡大する状況では、より多くのノードでの検証が必要だろう。

質疑応答において、「メタデータを付与することで管理が容易になるのであれば、ニーズとしては検索機能が欲しいというのは時間の問題だ。全文検索の機能がないのはなぜ?」という質問には「メタデータの検索は現バージョンでも可能だが、全文検索は検討中」という回答を得た。またコモディティハードウェアを用いることでベンダーロックインを防ぐことができるという説明に対して「メタデータはVeritasのソフトウェアによって付与され管理されるのであれば、その部分においてはVeritasのソリューションにロックインされるのでは?」という質問に対しては「その見地からは確かにロックインと言える」とノイ氏は回答した。

パブリッククラウドとの連携がレプリケーションのみという最初のバージョンでは、どちらかと言えばオンプレミスでのユースケースを想定していると言えるVeritas Cloud Storageだが、「Veritasのソフトウェア開発のサイクルは非常に速いので、新しい機能は数ヶ月で実装されるだろう」というノイ氏のコメントを信用すれば、非構造化データのクラウドとの連携を考えている顧客は待つ価値はあるだろう。新機能の実装、特にパブリッククラウドとのより密接な連携と全文検索機能に期待したい。

Veritas Cloud Storageのアーキテクチャーを解説する星野氏

Veritas Cloud Storageのアーキテクチャーを解説する星野氏

フリーランスライター&マーケティングスペシャリスト。DEC、マイクロソフト、アドビ、レノボなどでのマーケティング、ビジネス誌の編集委員などを経てICT関連のトピックを追うライターに。オープンソースとセキュリティが最近の興味の中心。

連載バックナンバー

Think IT会員サービス無料登録受付中

Think ITでは、より付加価値の高いコンテンツを会員サービスとして提供しています。会員登録を済ませてThink ITのWebサイトにログインすることでさまざまな限定特典を入手できるようになります。

Think IT会員サービスの概要とメリットをチェック

他にもこの記事が読まれています