 |
|
1 2 3 4 次のページ
|
 |
はじめに
|
第2回と第3回に渡り、サーバクラスタを使ってデータを分散配置し、全体として大きなデータベースを構築する方法について解説しました。今回は、サーバクラスタを使ってデータベースの二重化、三重化を行う方法について解説します。
データベース全体のコピーを作ったり、そのコピーのことをレプリケーションと呼びます。
|
データベースのコピーが必要なわけ
|
データベースのテーブル設計をする上で「データの正規化」が重要だと聞いたことがある人は多いと思います。「データの正規化」で重要なことの1つに「同じデータは複数テーブルで重複させない」という考えがあります。
図1に示すように、「住所」を「顧客テーブル」と「注文テーブル」の2ヶ所に重複させておくと、お客様の住所を変更するアプリケーションは「すべて」「例外なく」この2つのテーブルの情報を「同じ」に保っておかなければならなくなります。
図1:重複のあるデータベース設計 (画像をクリックすると別ウィンドウに拡大図を表示します)
これは、ディスクの無駄遣いもさることながら、万が一、2つのテーブルのデータが違った場合、どちらが正しいのかを調べて、どちらかのデータを直さなければならなくなってしまいます。
このようなことを避けるために、例えば「住所」は「顧客テーブル」だけに格納して、「注文テーブル」にはお客様の「顧客番号」を格納しておき、この顧客番号からお客様の住所を調べるようにします(図2)。
図2:テーブル間で重複する情報をなくす設計 (画像をクリックすると別ウィンドウに拡大図を表示します)
このようにデータベースの世界では、同じデータを複数テーブルで重複させないのが原則になっています(複数テーブルを結合するために使う種々のIDは例外です)。
一方「レプリケーション」は、データベースのデータを二重にも三重にもコピーしておく方法です。上記のテーブル設計の原則とは矛盾するようですが、「レプリケーション」はSQL文の処理系の内側で実行されるので、アプリケーションレベルでは見えないのが、「正規化」とは違うところなのです。このようにあえてデータベースのコピーを持っておくことが必要な理由には、次のようなものがあります。
- データベースの最新のコピーを常に別のサーバにコピーしておいて、データベースサーバがクラッシュしても即座に別のデータベースサーバを使って処理を再開したい(可用性の向上)
- たくさんのサーバで同じコピーを持っていれば、データの検索が同時にたくさん実行されるような場合でも、それぞれのサーバで分担して処理することができる(性能向上)
|
 |
どちらもデータベースレプリケーションでは重要な機能です。
|
1 2 3 4 次のページ
|

|
|

|
著者プロフィール
NTTデータ先端技術株式会社 鈴木 幸市
Unixにおける日本語ハンドリング、Oracleの移植、オブジェクトリレーショナルデータベースのエンジンの開発などに携わる。現在、NTTデータ先端技術にてLinux、PostgreSQLなどのオープンソースソフトウェアに関する技術を統括している。著書に「RDBMS解剖学」(翔泳社)、訳書に「オブジェクト指向データベース入門」(共立出版)など。
|
|
|
|