TOPシステムトレンド> はじめに
近未来データベース
近未来データベース

第4回:データベースレプリケーション
著者:NTTデータ先端技術  鈴木 幸市   2005/9/9
1   2  3  4  次のページ
はじめに

   第2回と第3回に渡り、サーバクラスタを使ってデータを分散配置し、全体として大きなデータベースを構築する方法について解説しました。今回は、サーバクラスタを使ってデータベースの二重化、三重化を行う方法について解説します。

   データベース全体のコピーを作ったり、そのコピーのことをレプリケーションと呼びます。


データベースのコピーが必要なわけ

   データベースのテーブル設計をする上で「データの正規化」が重要だと聞いたことがある人は多いと思います。「データの正規化」で重要なことの1つに「同じデータは複数テーブルで重複させない」という考えがあります。

   図1に示すように、「住所」を「顧客テーブル」と「注文テーブル」の2ヶ所に重複させておくと、お客様の住所を変更するアプリケーションは「すべて」「例外なく」この2つのテーブルの情報を「同じ」に保っておかなければならなくなります。

重複のあるデータベース設計
図1:重複のあるデータベース設計
(画像をクリックすると別ウィンドウに拡大図を表示します)

   これは、ディスクの無駄遣いもさることながら、万が一、2つのテーブルのデータが違った場合、どちらが正しいのかを調べて、どちらかのデータを直さなければならなくなってしまいます。

   このようなことを避けるために、例えば「住所」は「顧客テーブル」だけに格納して、「注文テーブル」にはお客様の「顧客番号」を格納しておき、この顧客番号からお客様の住所を調べるようにします(図2)。

テーブル間で重複する情報をなくす設計
図2:テーブル間で重複する情報をなくす設計
(画像をクリックすると別ウィンドウに拡大図を表示します)

   このようにデータベースの世界では、同じデータを複数テーブルで重複させないのが原則になっています(複数テーブルを結合するために使う種々のIDは例外です)。

   一方「レプリケーション」は、データベースのデータを二重にも三重にもコピーしておく方法です。上記のテーブル設計の原則とは矛盾するようですが、「レプリケーション」はSQL文の処理系の内側で実行されるので、アプリケーションレベルでは見えないのが、「正規化」とは違うところなのです。このようにあえてデータベースのコピーを持っておくことが必要な理由には、次のようなものがあります。

  1. データベースの最新のコピーを常に別のサーバにコピーしておいて、データベースサーバがクラッシュしても即座に別のデータベースサーバを使って処理を再開したい(可用性の向上)
  2. たくさんのサーバで同じコピーを持っていれば、データの検索が同時にたくさん実行されるような場合でも、それぞれのサーバで分担して処理することができる(性能向上)
   どちらもデータベースレプリケーションでは重要な機能です。

1   2  3  4  次のページ


NTTデータ先端技術株式会社 鈴木 幸市
著者プロフィール
NTTデータ先端技術株式会社  鈴木 幸市
Unixにおける日本語ハンドリング、Oracleの移植、オブジェクトリレーショナルデータベースのエンジンの開発などに携わる。現在、NTTデータ先端技術にてLinux、PostgreSQLなどのオープンソースソフトウェアに関する技術を統括している。著書に「RDBMS解剖学」(翔泳社)、訳書に「オブジェクト指向データベース入門」(共立出版)など。


INDEX
第4回:データベースレプリケーション
はじめに
  データベースレプリケーションの方式
  データベースのレプリケーションを考えるために
  グループコミュニケーション