分散データベースに関する技術概要

2009年9月4日(金)
藤田 昭人

はじめに

 クラウドコンピューティングの代表的な事例であるGoogleやAmazonは、自社で大規模なデータセンターをいくつも建設し、そこで数百万台にものぼるコモディティ・ハードウエアを稼働させて自社サービスの運営を行っているといわれています。

 彼らのシステムは、Linuxなどの広く流通しているオープンソース・ソフトウエアをベースに構築されているようですが、それらを数百万台規模の大規模分散環境で稼働させるための技術の多くは非公開となっているため、多くの人々の関心を集めてきました。

 今日のクラウドコンピューティングのブームには、この大規模分散を支える技術にフォーカスを当てる側面もあります。GoogleやAmazon自身も、自社で開発したこれらの技術の概要を学術論文といった形で公表しており、最近ではそれをヒントに開発された商用ベースの技術やオープンソース・ソフトウエアが公開されるようになってきています。

 本連載ではこの大規模分散環境で稼働させるための技術のうち、特にデータの格納をつかさどる分散データベースに関する技術について紹介します。第1回はその概要を述べます。

クラウド技術の動向

 ここ数年間でクラウドコンピューティングへの商業的な注目度は格段に向上しました。それは、このところのクラウド技術の動向の変化と不可分の関係にあるのではないかと思います。

 実際にこのバズワードが語られ始めた2007年末の段階では、クラウド技術は、Googleに代表される巨大なデータセンターに設置されている数百万台にも及ぶコモディティ・ハードウエアの上で、サーチ・エンジンなどのアプリケーションをいかに効率よく稼働させるか?といった大規模分散システムを実現する方法として理解されていたように思います。

 このような命題を現実の課題ととらえられるのは、既に巨大なデータセンターを保有しているか、その必要に迫られている事業者に限られるので、クラウドコンピューティングのソリューションが一般に大きな影響を与えるとは考えられていませんでした。

 しかしながら、その後のAmazon EC2/S3の商業的な成功(と断言するのは時期尚早かもしれませんが)は事態を一変させるインパクトを持っていました。クラウドコンピューティングが前提とするインフラストラクチュアを一般の利用者も活用できる道が開かれたからです。

 このような展開になれば、クラウドコンピューティング環境でのアプリケーション構築方法により多くの方々が関心を寄せるのは当然の成り行きです。現時点でクラウドといえば、サーバー仮想化の技術をイメージする方々が多いでしょう。昨年当たりからクラウド技術は、利用の側面がよりフォーカスされるようになっています。

 では、クラウド技術の現在のトレンドはというと、プライベート・クラウドに集約されるのではないかと思います。その背景にはクラウド技術のサーバー仮想化によるコスト・メリットの恩恵を受けるのは、エンタープライズ分野であるという仮定があります。コスト・メリットだけでなく、セキュリティーなどにも配慮しなければならないエンタープライズ分野において、より利用しやすいクラウドの形態としてプライベート・クラウドが登場してきました。

株式会社IIJイノベーションインスティテュート
2006年大阪市立大学創造都市研究科修士課程修了(社会人大学院)。2008年 IIJ Innovation Institute の第1回技術開発公募によりIIJ-IIに参画。以降、構造化オーバーレイ技術による大規模分散システムの研究開発を行い、クラウド・コンピューティング分野での事業化を推進している。

Think ITメルマガ会員登録受付中

Think ITでは、技術情報が詰まったメールマガジン「Think IT Weekly」の配信サービスを提供しています。メルマガ会員登録を済ませれば、メルマガだけでなく、さまざまな限定特典を入手できるようになります。

Think ITメルマガ会員のサービス内容を見る

他にもこの記事が読まれています