DBは習うより慣れよ!
並列処理を体験するための準備
では実際にパラレル・クエリを体験してみましょう。今回は話をシンプルにするため、1台のマシンでやってみます。MySQLのデフォルト設定では1台のマシンでもパラレルクエリの効果を感じることができます。
試すことは次のようなものです。200万レコードからなるテーブルへのクエリを、「通常のクエリ」と「パラレルクエリ」の2通り行い、それぞれの時間を比較してみます。パラレルクエリでは、プロセスを2分割してみます。
まずはサンプルテーブルを構築します。本論とはまったく関係ないのですが、これが無いことにはテストできません。ここでの解説は必要最低限としますが、わからなくても支障はありません。なお、大きなデータベースが利用可能なようでしたら、それを使っていただいても構いません。
まずは、図3リスト1に示したmysqlのコマンドラインから、データベースやテーブル(データの入れ物)を作成します。
サンプルデータをtest1およびtest2のテーブルにそれぞれ100万レコードずつ挿入します(図3リスト2)。これらはパラレルクエリで用いる、分割されたテーブルとなります。DB接続時の、ユーザ名、パスワードは適宜変更してください。ホストはローカルホストを設定します。
図3リスト3のようにtest1とtest2を結合して、200万レコードのテーブルtest0を構築します。test0は、通常のクエリの検索に用いるテーブルです。これで準備完了です。
なお、テーブルtest0はMERGEテーブルです。上手に使うとパラレルクエリのようなパフォーマンスがでます。こちらは最終回に触れる予定です。
並列処理を実行する
さて、実際にクエリを実行してみましょう。
まずは、単純に200万レコードを検索する通常のクエリの場合です。MySQLのコマンドラインからクエリを実行します(図3リスト4)。クエリにかかる時間は2.28秒でした。
次に、簡単なパラレルクエリのコードを図3のリスト5に示します。詳細な解説は次回に行いますが、11行目がパラレルクエリの本体です。
これを動かしてみます。コマンドラインから動かすと、図3のリスト6のようになります。およそ1.6秒ですから、並列処理にすることでおよそ3割パフォーマンスが向上したことになります。
かなりシンプルではありますが、比較的簡単にパラレルクエリができるということを感じていただけたのではないかと思います。