DBは習うより慣れよ!

2008年7月2日(水)
田中 宏昌

並列処理を体験するための準備

 では実際にパラレル・クエリを体験してみましょう。今回は話をシンプルにするため、1台のマシンでやってみます。MySQLのデフォルト設定では1台のマシンでもパラレルクエリの効果を感じることができます。

 試すことは次のようなものです。200万レコードからなるテーブルへのクエリを、「通常のクエリ」と「パラレルクエリ」の2通り行い、それぞれの時間を比較してみます。パラレルクエリでは、プロセスを2分割してみます。

 まずはサンプルテーブルを構築します。本論とはまったく関係ないのですが、これが無いことにはテストできません。ここでの解説は必要最低限としますが、わからなくても支障はありません。なお、大きなデータベースが利用可能なようでしたら、それを使っていただいても構いません。

 まずは、図3リスト1に示したmysqlのコマンドラインから、データベースやテーブル(データの入れ物)を作成します。

 サンプルデータをtest1およびtest2のテーブルにそれぞれ100万レコードずつ挿入します(図3リスト2)。これらはパラレルクエリで用いる、分割されたテーブルとなります。DB接続時の、ユーザ名、パスワードは適宜変更してください。ホストはローカルホストを設定します。

 図3リスト3のようにtest1とtest2を結合して、200万レコードのテーブルtest0を構築します。test0は、通常のクエリの検索に用いるテーブルです。これで準備完了です。

 なお、テーブルtest0はMERGEテーブルです。上手に使うとパラレルクエリのようなパフォーマンスがでます。こちらは最終回に触れる予定です。

並列処理を実行する

 さて、実際にクエリを実行してみましょう。

 まずは、単純に200万レコードを検索する通常のクエリの場合です。MySQLのコマンドラインからクエリを実行します(図3リスト4)。クエリにかかる時間は2.28秒でした。

 次に、簡単なパラレルクエリのコードを図3のリスト5に示します。詳細な解説は次回に行いますが、11行目がパラレルクエリの本体です。

 これを動かしてみます。コマンドラインから動かすと、図3のリスト6のようになります。およそ1.6秒ですから、並列処理にすることでおよそ3割パフォーマンスが向上したことになります。

 かなりシンプルではありますが、比較的簡単にパラレルクエリができるということを感じていただけたのではないかと思います。

株式会社メディカルアーキテクツ
株式会社メディカルアーキテクツ、共同経営者。NTTデータ、NTTデータ経営研究所(出向)にてITプロジェクトの企画や企業の戦略系コンサルティングを数多く経験。その後、外資系医療コンサルティング企業のCIOとして伝説のシステムを数多く作り上げ、2年前に起業。東京大学工学部航空宇宙工学科卒。http://www.mediarc.jp/

Think ITメルマガ会員登録受付中

Think ITでは、技術情報が詰まったメールマガジン「Think IT Weekly」の配信サービスを提供しています。メルマガ会員登録を済ませれば、メルマガだけでなく、さまざまな限定特典を入手できるようになります。

Think ITメルマガ会員のサービス内容を見る

他にもこの記事が読まれています