高可用性とデータ・シャーディングを実現できるMySQL Fabricとは?

2014年9月17日(水)
山﨑 由章

MySQL Fabricの特徴/利点

前述の通りMySQL Fabricを使うと、自動フェイルオーバーによる高可用性と、参照/更新処理に対する負荷分散による拡張性を実現できます。そしてこれらをアプリケーションから意識することなく実現できる、という大きな利点があります。MySQL Fabricを使うと、MySQLサーバーの構成が変わってもアプリケーションからの接続先を変更する必要がありません。また後述しますが、アプリケーションからMySQLサーバーへは直接接続できるため、MySQL Fabricを使うことによるオーバーヘッド(性能低下)もありません。

更にMySQL Fabricの機能は、MySQLのレプリケーション機能を基盤として実装していますので、今まで培ってきたMySQLのスキルもそのまま活用できます。MySQLのレプリケーション構成に慣れている方は、すぐにMySQL Fabricを活用できるでしょう。

MySQL Fabricの特徴と利点は、こちらのページでもご紹介しています。

MySQL Fabricのアーキテクチャ

概要

MySQL Fabricは、MySQLサーバー群の構成情報を管理しているMySQL Fabricサーバーと、MySQL Fabricに対応したコネクタから構成されます。MySQL Fabricサーバーは、Pythonで動作する小さなサーバーですが、構成情報を格納するためのリポジトリとしてMySQLデータベースを利用しています。このリポジトリは、Backing Storeと呼ばれています。

マニュアルでも解説されていますが、Backing Storeのテーブル構成は通常のMySQLデータベースであるため、mysqldump等の手段でバックアップできます。Backing Storeに格納されている構成情報は、MySQL Fabricにとって非常に重要であるため、バックアップ取得が推奨されています。

MySQL Fabricを使用する場合、アプリケーションからの接続先にはMySQL Fabricサーバーを指定します。またMySQL Fabricに対応したコネクタは、MySQLサーバー群の構成情報を受け取り、コネクタ自身にキャッシュします。そのためアプリケーションからMySQLサーバーへ接続する際には、直接MySQLサーバーへ接続できます。MySQL Fabricサーバーを経由する必要が無いため、アプリケーションに対するオーバーヘッドはありません。

高可用性を実現する仕組み

MySQL Fabricは、MySQLサーバー群を「高可用性グループ」という単位で管理します。高可用性グループに2台以上のMySQLサーバーを所属させることで、MySQLのレプリケーション機能を使ったマスター/スレーブ構成の高可用性が実現されます。高可用性グループ内のマスターサーバーに障害が発生すると、MySQL Fabricは自動的にフェイルオーバーを実行し、スレーブサーバーの中から1台を新しいマスターに昇格させます。そして、MySQL Fabricサーバーで管理している構成情報を変更し、コネクタに構成情報が変わったことを通知します。構成情報が変わったことを認識したコネクタは、次回接続時に適切なMySQLサーバーに接続しなおして処理を実行できます。

図2: MySQL Fabricの構成

障害が発生するとフェイルオーバーが実行され、MySQLサーバー群のマスター/スレーブの構成が変更されますが、その際にアプリケーションからの接続先を変更したり、VIP(仮想IP)を切り替えて接続先を制御したりする必要が無いというのがポイントです。ただ障害が発生したサーバーで実行中であった処理はエラーになるため、再実行の仕組みはアプリケーション側に実装しておく必要があります。接続しなおして処理を再実行することで、適切なMySQLサーバーに接続して処理を再開できます。

更新/参照での負荷分散、参照処理の負荷分散を実現する仕組み

「高可用性グループ」は通常1台のマスターサーバーと1台以上のスレーブサーバーで構成されますが、更新処理をマスターのサーバーで実行し、参照処理をスレーブのサーバーで実行することで更新処理/参照処理の負荷分散を実現できます。また、複数台のスレーブサーバーを所属させることで、参照処理を複数のサーバーで処理し、参照処理の負荷分散も実現できます。スレーブとサーバー間のロードバランシングは、自動的に行われます。

更新処理を実行する際はアプリケーションからの接続時に「READWRITEモード」を、参照処理の実行時にはアプリケーションからの接続時に「READONLY」モードをそれぞれ指定することで、自動的に適切なMySQLサーバーに接続して処理を実行できます。

以下の図中では、Pythonで更新処理を実行する例を紹介しています。事前にMySQL Fabric で複数台のMySQLサーバーを使って高可用性グループを定義している前提です。接続先のサーバーに MySQL Fabricサーバーを指定し、プロパティで「READWRITE」モードを指定するだけで、どのサー バーがマスターなのかを意識することなく、 INSERT文を実行できます。

※MySQL Fabricサーバーが"localhost:32274"で動作している場合の例です。また、MySQL Fabricで高可用性グループを定義する具体的な方法は、今後の連載で紹介予定です。

図3: 更新処理の例

更新処理の負荷分散を実現する仕組み(データ・シャーディング)

高可用性グループを複数作ることで、データ・シャーディング(分割)による更新処理の負荷分散を実現できます。データ分割の方法は、RANGE(範囲)、HASHの2種類があります。またシャーディングのキーに指定する列は、現時点では数値型のみの対応となります。

シャーディング手法や、RANGEでのシャーディング時のマッピング定義(どのシャードにどの範囲のデータを格納するのかの指定)はMySQL Fabricによって行いますが、アプリケーションから意識する必要があるのは、「シャーディングされているテーブルが、どの列をキーにしてシャーディングされているか」のみです。どのような手法や範囲でデータがシャーディングされているのかは、意識する必要がありません。そのため、データ量の増加や同時実行処理数の増加等によりシャードを追加し、シャーディングを再構成した場合でも、その構成変更はアプリケーションから透過的になります(アプリケーションは変更する必要がありません)。

以下の図中では、testデータベースのempテーブルがemp_no列でシャーディングされている場合のINSERT処理の例を紹介しています(先ほどと同様に、Pythonによる処理の例です。シャーディングの定義は既に実施している前提です)。プロパティでシャーディングキーを指定するだけで、INSERT文はシャーディングしていない場合と同様に実行できます。

※MySQL Fabricでシャーディングを定義する具体的な方法は、今後の連載で紹介予定です。

図4: シャーディングの例

日本オラクル株式会社

MySQLのセールスコンサルタント。元々はOracleデータベースのコンサルティング、サポート等に従事していたが、オープンソースとフリーソフトウェア(自由なソフトウェア)の世界に興味を持ち、MySQLの仕事を始める。趣味は旅行と美味しいものを食べること。

連載バックナンバー

Think ITメルマガ会員登録受付中

Think ITでは、技術情報が詰まったメールマガジン「Think IT Weekly」の配信サービスを提供しています。メルマガ会員登録を済ませれば、メルマガだけでなく、さまざまな限定特典を入手できるようになります。

Think ITメルマガ会員のサービス内容を見る

他にもこの記事が読まれています