PostgreSQLの概要とアーキテクチャ

2009年10月2日(金)
高塚 遙(たかつか はるか)

PostgreSQLのアーキテクチャ

 さて、ここからはPostgreSQLのアーキテクチャ、すなわち、内部的な構造や仕組みについて解説します。

 既にほかのデータベース製品を知っている方には、アーキテクチャを説明することで、何が同じで何が違うのかを把握しやすいと思います。なお、SQLの問い合わせ機能として現在どんなことができるのかは次回以降に解説します。

 PostgreSQLはクライアント/サーバー型のリレーショナルデータベース管理システム(RDBMS)です。ほかの製品ではライブラリ型の動作をサポートするものもありますが、PostgreSQLではクライアント/サーバー型のみに対応しています。

 また、クライアント側ではSQLを送って結果を取得する以外にあまり処理を行いません。標準で配布されるC言語による接続ライブラリとその各種言語におけるラッパー(PHP、Perl、Python、Ruby、Scheme、Tcl、Luaなどの多くの言語から接続できます)のほか、JDBC、ODBC、.NET Data Provider、などの接続インターフェースが使用できます。

 なお、PostgreSQLは1つのサーバープロセス(インスタンス)で複数のデータベースを扱うことができます。この点は、SQL ServerやDB2と似ています。

 PostgreSQLはクライアントからの接続を受け付けるのにプロセスモデルを採用しています。同時に100接続を受け付けている間、サーバーには100の子プロセスが動作します。

 スレッドモデルを採用している製品と比べるとシステムにおけるプロセス生成の処理コストが負担となり、コネクションプーリングの利用が望まれます。

 ただし、プロセスモデルにもメリットはあります。それはスレッド対応の悪いOSでもそれなりに動作し、壊滅的な被害を生むバグが埋め込まれにくいという点です。また、各接続を処理するプロセスをOSの管理コマンドである程度操作できます。

 図2-1はPostgreSQLで稼働するプロセスと使われるメモリについてまとめたものです。PostgreSQLはRDBMSですので、テーブル(表)に格納されたユーザーデータをディスクとメモリ上で管理します。メモリ上だけで管理する製品もありますが、PostgreSQLはディスク上にデータを置いて、メモリ上のそのバッファを置くという伝統的な構成です。

 バッファはOSの共有メモリ機能を使っていて(UNIX系ならSysV共有メモリ)、文字通り各プロセスから共有して使われます。共有メモリ上にはテーブル内容などのバッファ(図2-1では「共有バッファ」)のほかに「フリースペースマップ」「ビジビリティマップ」が置かれます。これらはテーブルに対応したファイルの状態を管理するものです。「WALバッファ」は、後述するWALファイルの書き出しのためのバッファです。

 各プロセスでも個別にメモリ確保は行われます。特にバックエンドプロセスが確保するメモリ量は同時接続数だけ必要ですので、総計としては大きな割合を占めます。

マスタープロセスと子プロセス

 稼働中のPostgreSQLは1つのマスタープロセス(postmasterとも呼ばれます)と、接続ごとに生成される子プロセス(バックエンドプロセスと呼びます)、各機能ごとの子プロセスとで構成されます。

 各機能ごとの子プロセスは全部で6つあります。

1)writerプロセス:バッファメモリ上のデータをディスクに書き込みます。
2)wal writerプロセス:WALファイルの書き込みを行います。
3)stats collector:「これまでこのテーブルに何回SELECTした?」などの情報をカウントします。
4)archiverプロセス:アーカイブロギングを行うときに使われます。
5)logger:エラーメッセージのログをPostgreSQL自身に管理させるときに使われます。
6)autovacuum launcher:VACUUMと呼ばれる管理操作を自動で行います。VACUUMについては、次のページで解説します。

 1つのPostgreSQLマスタープロセスが管理するディスク上のデータ一式をデータベースクラスタと呼びます。データベースクラスタは基本的には1つのディレクトリで構成され、図2-2のような要素があります。

 データベースクラスタの要素について簡単に紹介します。データベースごとに一つのディレクトリが在り、テーブルやインデックスがファイルとして格納されます。基本的には1テーブルが1ファイルです。メモリ上に登場したフリースペースマップやビジビリティマップは対象となるテーブルごとにファイルとしても格納されます。このほかにデータベースに属さない要素として、WALファイルや各種の状態管理ファイル、ユーザー情報などを管理するグローバルデータ、設定ファイルなどが格納されます。

著者
高塚 遙(たかつか はるか)
2003年ごろより一貫して PostgreSQL関連の業務に携わる。SRA OSS, Inc. 日本支社にて、PostgreSQLサポートサービス、PowerGres製品の開発などを担当する。また、PostgreSQLトレーニングで講師を務めることも。

Think ITメルマガ会員登録受付中

Think ITでは、技術情報が詰まったメールマガジン「Think IT Weekly」の配信サービスを提供しています。メルマガ会員登録を済ませれば、メルマガだけでなく、さまざまな限定特典を入手できるようになります。

Think ITメルマガ会員のサービス内容を見る

他にもこの記事が読まれています