MongoDB Tokyo 2013で語られた、NoSQLを上手に使うためのポイントとは

2013年12月28日(土)
Think IT編集部

オープンソースのNoSQLデータベースであるMongoDBのイベント「MongoDB Tokyo 2013」が12月12日、秋葉原にある富士ソフトアキバプラザにて開催された。

10月には1億5000万ドルもの資金調達を受け、NRIによるサポートサービスが12月から開始されるなど、活発な活動を続けるMongoDB。来日したスタッフによるセッションや、国内企業で使用しているヘビーユーザーからの利用事例の紹介など、充実した内容で行われた。

会場の様子(クリックで拡大)

Ian Daniel氏によるキーノート

MongoDB社のテクニカルサポートマネージャーであるIan Daniel氏によるキーノートでは、はじめに日本での活動として、ユーザーコミュニティの「MongoDB JP」に750人以上が登録していることや、「丸の内MongoDB勉強会」で約50名のエンジニアが日々研究していること、2014年にはオープンソースカンファレンス(OSC)への参加を予定していると話した。また、ワールドワイドではダウンロード数が500万を超えており、MongoDB Universityというオンライントレーニングには10万人強が登録、ユーザーコミュニティには2万人以上が参加していることも紹介された。

MongoDB社のIan Daniel氏(クリックで拡大)

NoSQLデータベースとMongoDBの動き

これまで、40年間にわたって使われているリレーショナル・データベースは過去50年間で最も成功したソフトウェアテクノロジーとDaniel氏は語る。これまで長きにわたってRDBは発展してきたが、ここ5年くらいでそれに対抗できるようなものが出てきた。

こうしたデータベースの歴史や、携帯電話など進化の著しい機器を紹介しながら、いつまでも古いツールを使い続けているのではなく、時代に合わせた新しいツールを使うことが重要だとDaniel氏は述べ、MongoDBの可能性をアピールした。

また、MongoDBの成功事例を2つ紹介。スケジューラのような機能を持つメールアプリの「Mailbox」では、プロトタイプの開発時より、MongoDBをデータストアとして利用している。このアプリはリード&ライトの負荷が高く、ダウンタイムも許されないものだが、MongoDBを使うことでスムーズな動作を実現している。
有名な大手保険会社のMetLifeでは、社内システムでMongoDBを使用している。RDBでデータを一元管理しようと苦労していたが、MongoDBを使うことで柔軟なデータモデルを構築することができたため、90日という短期間でプロトタイプを完成させることができ、本番環境に移行したという。

MetLifeの事例について語るDaniel氏(クリックで拡大)

Webサイト上でも、かなりの数のコンテンツが日本語に翻訳されている他、前述したMongoDB UNIVERSITYでは、「M101P」というPython向けのトレーニングコースを全て日本語で受けることができる。Daniel氏は積極的にコミュニティに参加したり、質問してほしいと話した。

会場には米国のスタッフも数多く参加しており、会場内で参加者の質問に答えるなど対応していた。

Yutaro Mori氏によるMongoDBの概要とアプリ作成のポイント

アメリカで生まれ育ち、ミシガン大学でコンピュータ・サイエンスを専攻したYutaro Mori氏は前職でMongoDBに触れ、その使いやすさとパフォーマンスに魅力を感じて同社に入社したという。普段はMongoDB社のNYオフィスで働いている。日本で過ごした期間は短いと言いながらも、丁寧な日本語でMongoDBとはどんなデータベースなのかということからセッションをスタートさせた。

MongoDB社のYutaro Mori氏(クリックで拡大)

MongoDBを使ったデータは、ほとんどの場合ドキュメントとして作成する。JSONによく似たデータ構造で ディスクに保存される前に二元復号化され、BSON(バイナリ型JSONの略)と呼ばれる。
エンジニアが好むプログラミング言語でのデータ構造に変換することが可能で、Java Scriptの場合はBSONを複合化するのみ、PHPのArray、PythonのDict、RubyのHashに変換できる。

次に、MongoDBの基本機能である、レプリケーションとシャーディングを紹介。レプリケーションは、冗長性を得るために多くのプロダクション環境で導入されている。マスターノードがスレーブノードと同期しているため、マスターノードにダメージが起きてもデータロスを防ぎ、サービス停止時間を最小限にすることができる。その上、レプリケーションを使用することで読み取りの負荷をノード間で分散させることができる。負荷のほとんどが読み取りで占められるアプリケーションの場合、その負荷をスレーブに分担させることでシステムのスケールが可能になる。
シャーディングは、MongoDBを水平スケーリングさせる。データを複数のサーバーに分散させることで、CPUはI/Oの負荷を分散させることができる。性能に直結するため十分なサイズのメモリが必要だが、メモリやディスクモジュールが大きいほど価格の上昇幅が大きくなるため、高コスト、高機能なサーバー1台より、複数のサーバーにデータを分散させる方がコストパフォーマンス向上につながる。

RDB的な使い勝手を持ちつつ、高速パフォーマンスを実現する

ここ数年CPUとメモリの値段が下がっている一方、データとWebのアクセス量が増加している。処理能力が高く、大量のデータを扱うには、RDBでは性能に限界があり、NoSQLを使うことでシステムを補おうという考えがある。

中でも代表的なmemchachedは、KeyとValueのハッシュ形式でデータを持ち、基本的なKeyでの検索に限られた高速なデータストアだが、MongoDBではこういった高速パフォーマンスを保持しつつ、RDBのような機能をバランス良く組み込むデータベースを目指している。
そのため、JoinのようにRDBには存在するがMongoDBが採用を見送った機能もある。この機能は場合によってコスト高やパフォーマンス劣化を招く原因と判断されたが、embeddedを使うなどして、RDBと同じように扱うことができる。

MongoDBでは、RDBのように検索クエリでCRUD操作が可能となっている。一般的なNoSQLのデータベースでは、SQLでいうGROUP BYやSumなどの集計機能がないが、MongoDBでは、NoSQLのパフォーマンスを維持しつつ、こういったSQLが持つような機能を開発している。集計フレームワーク(Aggregation Framework)はその1つで、クエリと同様にGROUP BYやSumが使用できる。

MongoDBの特徴的な機能を紹介(クリックで拡大)

一貫性を保ち、レプリケーションやシャーディングを使用していても、いつでも正確なデータを返すことができる他、ドキュメント指向データベースのため、スキーマを定義しなくても良いといったMongoDBの特長をひと通り説明。後半ではMongoDBを使ったアプリ開発のポイントをスライドで紹介した。

“オープンソース技術の実践活用メディア” をスローガンに、インプレスグループが運営するエンジニアのための技術解説サイト。開発の現場で役立つノウハウ記事を毎日公開しています。

2004年の開設当初からOSS(オープンソースソフトウェア)に着目、近年は特にクラウドを取り巻く技術動向に注力し、ビジネスシーンでOSSを有効活用するための情報発信を続けています。クラウドネイティブ技術に特化したビジネスセミナー「CloudNative Days」や、Think ITと読者、著者の3者をつなぐコミュニティづくりのための勉強会「Think IT+α勉強会」、Web連載記事の書籍化など、Webサイトにとどまらない統合的なメディア展開に挑戦しています。

また、エンジニアの独立・起業、移住など多様化する「働き方」「学び方」「生き方」や「ITで社会課題を解決する」等をテーマに、世の中のさまざまな取り組みにも注目し、解説記事や取材記事も積極的に公開しています。

連載バックナンバー

Think ITメルマガ会員登録受付中

Think ITでは、技術情報が詰まったメールマガジン「Think IT Weekly」の配信サービスを提供しています。メルマガ会員登録を済ませれば、メルマガだけでなく、さまざまな限定特典を入手できるようになります。

Think ITメルマガ会員のサービス内容を見る

他にもこの記事が読まれています