リレーショナルデータベースの基本
データを「表(テーブル)」で扱う
リレーショナルデータベースの特徴は、データを「表(テーブル)」に分類して扱うことです。テーブルは行(row)と列(column)から構成されますが、個々の行を1件分のデータとします。そして、データを構成する個々の項目を、テーブルの列として扱います。列は「フィールド(field)」とも呼びます。また、行は「レコード(record)」とも呼びます(図2-1参照)。
例えば、住所録のデータを管理することを考えてみましょう。住所録には「名前」「住所」「電話番号」といった項目のデータを入れます。これらの項目が、テーブルの列に相当します。また、一人ひとりのデータが、テーブル内の個々の行に相当します。
住所録のようなシンプルな構造のデータなら、1つのテーブルだけで表すことができます。しかし、販売管理や在庫管理などの複雑なデータは、1つのテーブルだけで表すのは困難です。そこで、リレーショナルデータベースでは、複雑なデータ構造を多数のテーブルに分解して、それらを「結合」という仕組みで組み合わせて利用します(結合については後述)。
「射影」「選択」「結合」の基本操作
リレーショナルデータベースの特徴は、テーブルに対して「射影」「選択」「結合」という3つの操作を行って、さまざまな形でデータを扱えることです。
「射影」は、テーブルの中から一部の列だけを取り出す操作のことを指します。例えば、住所録のテーブルを元に、「名前」と「電話番号」の列だけを取り出すことが射影にあたります(図2-2参照)。
「選択」は、条件を指定して、それにマッチする行だけを取り出す操作を指します。例えば、住所録のテーブルを元に、東京に住んでいる人(「住所」列の値に「東京都」を含む人)だけを取り出すことが選択にあたります(図2-3参照)。
最後に「結合」は、2つのテーブルを結び付けて、1つの仮想的なテーブルを作りだす操作です。「テーブルAの列Xと、テーブルBの列Yの値が等しい」というような条件で、テーブルを結合します(図2-4参照)。
例えば、図2-4の上半分のように、「商品」と「メーカー」の2つのテーブルがあるとします。ここで、「『商品』テーブルの『メーカーID』列と、『メーカー』テーブルの『メーカーID』列の値が等しい」という条件で2つのテーブルを結合すると、図2-4の下半分のように、商品とメーカーの情報を一体化した結果を得ることができます。
ここまでの例では、射影/選択/結合を単独で行いました。しかし実際には、射影/選択/結合を組み合わせて、テーブルから必要なだけのデータを取り出し処理を進めていきます。
例えば、図2-4のように「商品」と「メーカー」の2つのテーブルを結合し、「メーカーID」が1001の行を抜き出し(選択)、その結果の中から「商品名」と「メーカー名」の列だけを取り出す(射影)、といったこともできます。
なお、リレーショナルデータベースは、もともとは数学の集合論をベースにしています。そのため、「和」「差」「積」といった集合演算を行うこともできます。ただ、実際にデータベースを運用する上では、射影/選択/結合を行うことがほとんどで、和などの集合演算を使う機会はあまり多くありません。