TopHatenarとHatenarMapsのDB!
TopHatenarとHatenarMapsとは
本連載では、さまざまなサービスで利用されているデータベースやその仕組みについて紹介していきます。第1回は、Webアプリケーションである「TopHatenar(http://tophatenar.com/)」と「HatenarMaps(http://hatenarmaps.com/)」を取り上げ、そのデータベース構造とデータアクセス手法を中心に、アプリケーションの裏側について解説を行います。
まずTopHatenarとHatenarMapsとは何かを紹介します。この2つのWebアプリケーションは、ともに大手ブログサービス「はてなダイアリー」のユーザー動向を把握するツールとして、筆者が開発したものです。
TopHatenarは、はてなダイアリーの全ブロガーを、「RSSフィード購読者数」と「ソーシャルブックマーク獲得数」の2つの指標に基づいて順位付けしたランキングサイトです。TopHatenarを使うと、はてなダイアリーで強い影響力を持つブロガーが誰かを、グラフ表示によって一目で把握することができます。
また、HatenarMapsは、はてなダイアリーの人気ブロガーとその記事を、二次元平面上に「領土」としてマッピングし、勢力地図化したサイトです。HatenarMapsの特徴は、似た記事テーマを持つブロガー同士の領土が近くに集まり、「Perl地方」や「ニコニコ動画地方」など、テーマに沿った地域を形成することです。さらに、ズームインすることで個別の記事にアクセスできたり、ズームアウトで全体像を一望できたりと、視点レベルを切り替えられる点も、地図という表現手法ならではの特徴といえます。
アプリケーションのシステム構成
TopHatenarとHatenarMapsは、ともにJavaで開発されたアプリケーションです。開発にあたっては、WebアプリケーションフレームワークとしてCubby(http://cubby.seasar.org/)を、テンプレートエンジンとしてMayaa(http: //mayaa.seasar.org/)を、O/RマッピングツールとしてS2JDBC(http://s2container.seasar.org /2.4/ja/s2jdbc.html)を利用しています。
また、TopHatenarとHatenarMapsの間でデータ通信を行う目的で、S2RMI(http://s2rmi.seasar.org/ja/)を使用しています。これらはいずれも、Seasarプロジェクト(http://www.seasar.org/)傘下のオープンソースフレームワークです。
TopHatenarとHatenarMapsは、J2EEアプリケーションサーバーのGlassFish上で稼働しています。フロントエンドWebサーバーのApache HTTP ServerがHTTPリクエストを受け取り、プロキシモジュールのmod_proxyを通じてGlassFishに転送する方式で、閲覧者のリクエストが処理されています。
アプリケーションのバックグラウンドでは、ランキング情報や地図情報を更新するためのクローラが常時動作しています。クローラは、はてなダイアリーとはてなブックマーク、およびlivedoor Readerが提供する各種Web APIに定期的にアクセスし、APIから取得した情報に基づいて、データベースを逐次更新しています。
続いて両サービスのデータベース構造について説明しましょう。