TOP書籍連動> WebアプリケーションからHTTPキャッシュを制御する
まるごと PostgreSQL!
商用データベースに匹敵するWebシステム構築手法

第6回:HTTPキャッシュと出力キャッシュ

著者:大垣靖男(OHGAKI, Yasuo)   2005/5/9
前のページ  1  2
WebアプリケーションからHTTPキャッシュを制御する

   WebアプリケーションからHTTPキャッシュを制御するには、キャッシュ制御を行うHTTPヘッダを出力します。Apacheの場合、expiresモジュールを利用して、ディレクトリ、ファイル種別単位で有効期限を設定できます(リスト7)。
リスト7:有効期限を設定するhttpd.confの例
LoadModule expires_module modules/mod_expires.so
ExpiresActive On
ExpiresByType text/html "access plus 1 minutes"
ExpiresByType image/gif "access plus 1 month"
ExpiresByType image/jpeg "access plus 1 month"

   PHPの場合は、header関数で出力します。HTTPセッションを利用している場合は、session_cache_limitter関数を利用する際に、自動的にキャッシュ制御ヘッダが送信されます。PHPでキャッシュを利用可能にして、3600秒の有効期限をつける場合には、次のようにします。

header('Cache-Control: public, max-age=3600');

   すべてのユーザーに同じコンテンツを配信するサービスの場合に、リバースプロキシは大きな効果を発揮する可能性が高くなります。キャッシュのヒット率が高い場合、数分間ページをキャッシュさせるだけでも大幅な性能向上が可能なこともあります。しかし、キャッシュミスが多いとパフォーマンスに悪影響を与える場合もあり、データベースの更新頻度、ページのリアルタイム性、キャッシュヒット率などを考慮し導入を検討するとよいでしょう。


出力キャッシュ

   データベースを利用したWebシステムでは、ユーザーごとにカスタマイズされたページや、データベースへの更新をリアルタイムに反映したページを出力しなければならない場合があります。このような場合、HTTPキャッシュを利用したリバースプロキシは利用できません。代わりに出力キャッシュを利用します(図20)。

出力キャッシュ
図20:出力キャッシュ


   出力キャッシュとは、プログラムなどで生成したHTML/XML出力をファイルに保存し、同じリクエストがあった場合に、HTML/XMLを新たに生成するのではなく、キャッシュされたデータを返すしくみです。

   出力キャッシュを更新するときは、データベースに保存された情報自体が更新されているかどうかを確認しなければなりません。PostgreSQLは「ルール」をサポートしているため、データベースを利用して更新の確認が非常に簡単に行えます。リスト8のSQL文は、aテーブルへレコードが挿入/更新/削除された場合に、ctrlテーブルのtable_aのタイムスタンプを自動的に更新します。

リスト8:PostgreSQLのルールの利用例
REATE TABLE ctrl (
table_a TIMESTAMP
);

CREATE TABLE a (
var text
);

CREATE RULE table_a_upd AS ON UPDATE TO a
DO UPDATE ctrl SET table_a = CURRENT_TIMESTAMP;

CREATE RULE table_a_ins AS ON INSERT TO a
DO UPDATE ctrl SET table_a = CURRENT_TIMESTAMP;

CREATE RULE table_a_del AS ON DELETE TO a
DO UPDATE ctrl SET table_a = CURRENT_TIMESTAMP;

   ルールをサポートしてないデータベースサーバーでは、ストアドプロシージャで記述するかアプリケーションで実装しなければなりませんが、PostgreSQLではたった数行のSQL文で、テーブルの更新時間を確実に記録することができます。

   Webアプリケーションは、データベースの更新時間と出力キャッシュの更新時間を比較し、出力を再生成しなければならない場合のみ出力を作成するコードを実行し、それ以外はキャッシュされた出力を利用します。プログラムによるHTML/XML出力の作成は、意外に多くのCPU時間を必要とします。キャッシュする出力が、ページ全体であってもページの一部であっても効果的です。

   次回はもう一つのキャッシュであるクエリキャッシュについて解説します。

前のページ  1  2


大垣 靖男
著者プロフィール
大垣靖男(OHGAKI, Yasuo)
University of Denver卒。同校にてコンピュータサイエンスとビジネスを学ぶ。株式会社シーエーシーを経て、エレクトロニック・サービス・イニシアチブ有限会社を設立。Linuxはバージョン0.9xの黎明期から利用してるが、オープンソースシステム開発やコミュニティへの参加はエレクトロニック・サービス・イニシアチブ設立後から。PHPプロジェクトのPostgreSQLモジュールのメンテナ、日本PostgreSQLユーザ会の四国地域での活動等を担当している。


INDEX
第6回:HTTPキャッシュと出力キャッシュ
  Webシステムの高性能化とキャッシュ
WebアプリケーションからHTTPキャッシュを制御する