第4回：データベースレプリケーション (1/4)

近未来データベース

第４回：データベースレプリケーション
著者：NTTデータ先端技術鈴木幸市 2005/9/9

はじめに

第2回と第3回に渡り、サーバクラスタを使ってデータを分散配置し、全体として大きなデータベースを構築する方法について解説しました。今回は、サーバクラスタを使ってデータベースの二重化、三重化を行う方法について解説します。

データベース全体のコピーを作ったり、そのコピーのことをレプリケーションと呼びます。

データベースのコピーが必要なわけ

データベースのテーブル設計をする上で「データの正規化」が重要だと聞いたことがある人は多いと思います。「データの正規化」で重要なことの1つに「同じデータは複数テーブルで重複させない」という考えがあります。

図1に示すように、「住所」を「顧客テーブル」と「注文テーブル」の2ヶ所に重複させておくと、お客様の住所を変更するアプリケーションは「すべて」「例外なく」この2つのテーブルの情報を「同じ」に保っておかなければならなくなります。

図1：重複のあるデータベース設計
（画像をクリックすると別ウィンドウに拡大図を表示します）

これは、ディスクの無駄遣いもさることながら、万が一、2つのテーブルのデータが違った場合、どちらが正しいのかを調べて、どちらかのデータを直さなければならなくなってしまいます。

このようなことを避けるために、例えば「住所」は「顧客テーブル」だけに格納して、「注文テーブル」にはお客様の「顧客番号」を格納しておき、この顧客番号からお客様の住所を調べるようにします（図2）。

図2：テーブル間で重複する情報をなくす設計
（画像をクリックすると別ウィンドウに拡大図を表示します）

このようにデータベースの世界では、同じデータを複数テーブルで重複させないのが原則になっています（複数テーブルを結合するために使う種々のIDは例外です）。

一方「レプリケーション」は、データベースのデータを二重にも三重にもコピーしておく方法です。上記のテーブル設計の原則とは矛盾するようですが、「レプリケーション」はSQL文の処理系の内側で実行されるので、アプリケーションレベルでは見えないのが、「正規化」とは違うところなのです。このようにあえてデータベースのコピーを持っておくことが必要な理由には、次のようなものがあります。

データベースの最新のコピーを常に別のサーバにコピーしておいて、データベースサーバがクラッシュしても即座に別のデータベースサーバを使って処理を再開したい（可用性の向上）
たくさんのサーバで同じコピーを持っていれば、データの検索が同時にたくさん実行されるような場合でも、それぞれのサーバで分担して処理することができる（性能向上）

どちらもデータベースレプリケーションでは重要な機能です。

1 2 3 4 次のページ

著者プロフィール
NTTデータ先端技術株式会社鈴木幸市
Unixにおける日本語ハンドリング、Oracleの移植、オブジェクトリレーショナルデータベースのエンジンの開発などに携わる。現在、NTTデータ先端技術にてLinux、PostgreSQLなどのオープンソースソフトウェアに関する技術を統括している。著書に「RDBMS解剖学」(翔泳社)、訳書に「オブジェクト指向データベース入門」(共立出版)など。

INDEX
第4回：データベースレプリケーション
	はじめに
	データベースレプリケーションの方式
	データベースのレプリケーションを考えるために
	グループコミュニケーション

近未来データベース
第1回	データベースを取り巻く状況
第2回	データベースのスケールアウト（前半）
第3回	データベースのスケールアウト（後半）
第4回	データベースレプリケーション
第5回	データベース技術者を育むために