高可用性とデータ・シャーディングを実現できるMySQL Fabricとは?
MySQL Fabricの特徴/利点
前述の通りMySQL Fabricを使うと、自動フェイルオーバーによる高可用性と、参照/更新処理に対する負荷分散による拡張性を実現できます。そしてこれらをアプリケーションから意識することなく実現できる、という大きな利点があります。MySQL Fabricを使うと、MySQLサーバーの構成が変わってもアプリケーションからの接続先を変更する必要がありません。また後述しますが、アプリケーションからMySQLサーバーへは直接接続できるため、MySQL Fabricを使うことによるオーバーヘッド(性能低下)もありません。
更にMySQL Fabricの機能は、MySQLのレプリケーション機能を基盤として実装していますので、今まで培ってきたMySQLのスキルもそのまま活用できます。MySQLのレプリケーション構成に慣れている方は、すぐにMySQL Fabricを活用できるでしょう。
MySQL Fabricの特徴と利点は、こちらのページでもご紹介しています。
MySQL Fabricのアーキテクチャ
概要
MySQL Fabricは、MySQLサーバー群の構成情報を管理しているMySQL Fabricサーバーと、MySQL Fabricに対応したコネクタから構成されます。MySQL Fabricサーバーは、Pythonで動作する小さなサーバーですが、構成情報を格納するためのリポジトリとしてMySQLデータベースを利用しています。このリポジトリは、Backing Storeと呼ばれています。
マニュアルでも解説されていますが、Backing Storeのテーブル構成は通常のMySQLデータベースであるため、mysqldump等の手段でバックアップできます。Backing Storeに格納されている構成情報は、MySQL Fabricにとって非常に重要であるため、バックアップ取得が推奨されています。
MySQL Fabricを使用する場合、アプリケーションからの接続先にはMySQL Fabricサーバーを指定します。またMySQL Fabricに対応したコネクタは、MySQLサーバー群の構成情報を受け取り、コネクタ自身にキャッシュします。そのためアプリケーションからMySQLサーバーへ接続する際には、直接MySQLサーバーへ接続できます。MySQL Fabricサーバーを経由する必要が無いため、アプリケーションに対するオーバーヘッドはありません。
高可用性を実現する仕組み
MySQL Fabricは、MySQLサーバー群を「高可用性グループ」という単位で管理します。高可用性グループに2台以上のMySQLサーバーを所属させることで、MySQLのレプリケーション機能を使ったマスター/スレーブ構成の高可用性が実現されます。高可用性グループ内のマスターサーバーに障害が発生すると、MySQL Fabricは自動的にフェイルオーバーを実行し、スレーブサーバーの中から1台を新しいマスターに昇格させます。そして、MySQL Fabricサーバーで管理している構成情報を変更し、コネクタに構成情報が変わったことを通知します。構成情報が変わったことを認識したコネクタは、次回接続時に適切なMySQLサーバーに接続しなおして処理を実行できます。
障害が発生するとフェイルオーバーが実行され、MySQLサーバー群のマスター/スレーブの構成が変更されますが、その際にアプリケーションからの接続先を変更したり、VIP(仮想IP)を切り替えて接続先を制御したりする必要が無いというのがポイントです。ただ障害が発生したサーバーで実行中であった処理はエラーになるため、再実行の仕組みはアプリケーション側に実装しておく必要があります。接続しなおして処理を再実行することで、適切なMySQLサーバーに接続して処理を再開できます。
更新/参照での負荷分散、参照処理の負荷分散を実現する仕組み
「高可用性グループ」は通常1台のマスターサーバーと1台以上のスレーブサーバーで構成されますが、更新処理をマスターのサーバーで実行し、参照処理をスレーブのサーバーで実行することで更新処理/参照処理の負荷分散を実現できます。また、複数台のスレーブサーバーを所属させることで、参照処理を複数のサーバーで処理し、参照処理の負荷分散も実現できます。スレーブとサーバー間のロードバランシングは、自動的に行われます。
更新処理を実行する際はアプリケーションからの接続時に「READWRITEモード」を、参照処理の実行時にはアプリケーションからの接続時に「READONLY」モードをそれぞれ指定することで、自動的に適切なMySQLサーバーに接続して処理を実行できます。
以下の図中では、Pythonで更新処理を実行する例を紹介しています。事前にMySQL Fabric で複数台のMySQLサーバーを使って高可用性グループを定義している前提です。接続先のサーバーに MySQL Fabricサーバーを指定し、プロパティで「READWRITE」モードを指定するだけで、どのサー バーがマスターなのかを意識することなく、 INSERT文を実行できます。
※MySQL Fabricサーバーが"localhost:32274"で動作している場合の例です。また、MySQL Fabricで高可用性グループを定義する具体的な方法は、今後の連載で紹介予定です。
更新処理の負荷分散を実現する仕組み(データ・シャーディング)
高可用性グループを複数作ることで、データ・シャーディング(分割)による更新処理の負荷分散を実現できます。データ分割の方法は、RANGE(範囲)、HASHの2種類があります。またシャーディングのキーに指定する列は、現時点では数値型のみの対応となります。
シャーディング手法や、RANGEでのシャーディング時のマッピング定義(どのシャードにどの範囲のデータを格納するのかの指定)はMySQL Fabricによって行いますが、アプリケーションから意識する必要があるのは、「シャーディングされているテーブルが、どの列をキーにしてシャーディングされているか」のみです。どのような手法や範囲でデータがシャーディングされているのかは、意識する必要がありません。そのため、データ量の増加や同時実行処理数の増加等によりシャードを追加し、シャーディングを再構成した場合でも、その構成変更はアプリケーションから透過的になります(アプリケーションは変更する必要がありません)。
以下の図中では、testデータベースのempテーブルがemp_no列でシャーディングされている場合のINSERT処理の例を紹介しています(先ほどと同様に、Pythonによる処理の例です。シャーディングの定義は既に実施している前提です)。プロパティでシャーディングキーを指定するだけで、INSERT文はシャーディングしていない場合と同様に実行できます。
※MySQL Fabricでシャーディングを定義する具体的な方法は、今後の連載で紹介予定です。
連載バックナンバー
Think ITメルマガ会員登録受付中
全文検索エンジンによるおすすめ記事
- オラクル、可用性と拡張性の高いMySQL構成の管理を簡素化する「MySQL Fabric」を発表
- MySQL 5.6での機能強化点(その3)- 人気のレプリケーションが更に機能強化
- オラクル、「MySQL 5.7 Development Milestone Release(DMR)」をリリース
- DBドキュメント出力とMEBのためのGUI、次期版6.1の新機能を紹介
- MongoDB Tokyo 2013で語られた、NoSQLを上手に使うためのポイントとは
- オラクル、データベース性能を向上させた最新の「MySQL 5.7 Development Milestone Release」を発表
- Pythonで作られた便利なコマンドラインツール MySQL Utilities
- MySQL5.5- 性能改善と可用性向上
- 非同期レプリケーション!
- PostgreSQL9.0の安定性と高い可用性を実証 アシストによるPostgreSQL検証セミナーレポート