クラウド環境のデータストレージを使い分ける
Windows Azure Queueストレージ
4回にわたる連載も今回が最終回です。まずは3回までの内容を簡単に振り返りながら、今回の解説を進めていきたいと思います。
1回目はWindows Azure Blob(http://thinkit.co.jp/article/1028/1/)。簡単に利用でき、地球上の人々が同じファイルを共有する仕組みが作れるかもしれないとさえ思わせてくれます。
Windows Azure Queueストレージ
4回にわたる連載も今回が最終回です。まずは3回までの内容を簡単に振り返りながら、今回の解説を進めていきたいと思います。
1回目はWindows Azure Blob(http://thinkit.co.jp/article/1028/1/)。簡単に利用でき、地球上の人々が同じファイルを共有する仕組みが作れるかもしれないとさえ思わせてくれます。
2回目のWindows Azure Table(http://thinkit.co.jp/article/1023/1/)はRDBMSと比べると、まだ使い勝手に難があるものの、低コストでスケーラビリティーに優れたものでした。
3回目のSQL Azure(http://thinkit.co.jp/article/1028/1/)はクラウドで利用できる本格的なRDBMSで、実際にこれを使ってPHPのオープンソースソフトを動かしてみることができました。
クラウドのストレージがRDBMSをサポートしたことで、既存の多くのオープンソースソフトがクラウドアプリケーションとして稼働していくことになりそうですが、これらを連携していくために用意されているのが「Windows Azure Queue」です。
図1-1では、一連の要求キューを介することでフロントのWebサーバーとバックエンド処理サーバーの処理を分離しています。[※1]
このWindows Azure Queueについても、CodePlexにて対応するPHPのライブラリPHPAzure CTP3がリリースされました。また今回のリリースから、今まで単に「Azure」とつづられていた個所が「Windows Azure」に変更されているため、以前のリリースで作成したプログラムは修正が必要になります。ご注意ください。
個々のキューのURIは以下のようなREST APIですが、ライブラリを利用することでPHPからの操作も容易になります。
http://アカウント名>.queue.core.windows.net/
図1-1のフローですと、フロントがQueueへPutしたメッセージをバックエンドがGetして処理します。
QueueはGetされると、Visibility Timeout(デフォルト30秒)の間、誰からも見えなくなります。また、メッセージはPut時に指定した有効期間(最大7日間)を過ぎると自動的に消去されます。
実際のPHPライブラリでの操作例については、CodeplexのGetting Stared[※2]のページが参考になります。
Queueの利用により非同期でのデータ処理が可能となり、いろいろな活用が考えられますが、4回目となる今回はクラウド環境でのストレージについて、これに何を求めるのか、問題点は何か、またその可能性を考えていきたいと思います。
クラウドのストレージに何を求めるのか
~スケールよりまずRDBMSの運用代行~
インストールマニアックス2009では、MySQL用のオープンソースアプリケーションをSQL Serverで稼働させる課題もあり、その際にインストールしたSQL Server2008で最初に筆者が確認したポイントは、「データベースの復旧モデルのデフォルト値(図1-2参照)がどうなっているか」でした。
その理由は、以前のSQL Serverのデフォルト値は復旧モデルが「完全」で、この設定のデータベースに対してデータ更新を頻繁に行うと、大量のログファイルが作成されてしまうからです。データ本体よりログファイルの方が大きくなったまま運用されているシステムが今でもあるかも知れません。
テスト環境であればこれらのログファイルは特に必要ありません。しかし、本番環境では万一データベースが壊れた場合に、「壊れる直前」までの状態に復旧するためのファイルが重要になります。
この運用が大変なことは実際に経験してみるとよくわかります。以前、データテープの利用回数をチェックし、いざとなった時に本当にこのテープに保管したファイルが役に立つのか、一抹の不安を感じながらも毎日の作業を繰り返したのを思いだします。
また、実際にある会社の会計システムのデータベースが破損し、「バックアップテープからファイルを取り出そうとしたら読み取りエラーで取り出せない。どうしたらよいでしょう」という連絡を受けたこともありました。
この時には事なきを得ましたが、「テープの利用回数は管理していましたか?」という質問に回答をもらうことはできませんでした。ディスクを多重化しておけばデータベースは大丈夫なのではないか、と思われがちですが、それで済まないことがあるから大変なのだそうです。
仮にデータベースやOSなどソフト側に問題がなくても、万一ディスクのコントローラに不具合があると、幻のようにファイルが見え隠れします。データベースからはもっと不思議に見えます。
データベースの運用を依頼できるのであれば助かりますし、こうした理由でクラウドを選択するユーザーも少なくないはずです。
[※1]Windows Azure キュー - キュー ストレージのプログラミング(http://download.microsoft.com/download/C/9/6/C96BA437-C98D-4048-B67F-D0656C891B49/Windows%20Azure%20Queue%20-%20Dec%202008.pdf)(アクセス:2009.09)
[※2]Codeplex Getting Stated(http://phpazure.codeplex.com/Wiki/View.aspx?title=Getting%20Started)(アクセス:2009.09)