TopHatenarとHatenarMapsのDB!

2008年7月4日(金)
浜本 階生

TopHatenarとHatenarMapsとは

 本連載では、さまざまなサービスで利用されているデータベースやその仕組みについて紹介していきます。第1回は、Webアプリケーションである「TopHatenar(http://tophatenar.com/)」と「HatenarMaps(http://hatenarmaps.com/)」を取り上げ、そのデータベース構造とデータアクセス手法を中心に、アプリケーションの裏側について解説を行います。

 まずTopHatenarとHatenarMapsとは何かを紹介します。この2つのWebアプリケーションは、ともに大手ブログサービス「はてなダイアリー」のユーザー動向を把握するツールとして、筆者が開発したものです。

 TopHatenarは、はてなダイアリーの全ブロガーを、「RSSフィード購読者数」と「ソーシャルブックマーク獲得数」の2つの指標に基づいて順位付けしたランキングサイトです。TopHatenarを使うと、はてなダイアリーで強い影響力を持つブロガーが誰かを、グラフ表示によって一目で把握することができます。

 また、HatenarMapsは、はてなダイアリーの人気ブロガーとその記事を、二次元平面上に「領土」としてマッピングし、勢力地図化したサイトです。HatenarMapsの特徴は、似た記事テーマを持つブロガー同士の領土が近くに集まり、「Perl地方」や「ニコニコ動画地方」など、テーマに沿った地域を形成することです。さらに、ズームインすることで個別の記事にアクセスできたり、ズームアウトで全体像を一望できたりと、視点レベルを切り替えられる点も、地図という表現手法ならではの特徴といえます。

アプリケーションのシステム構成

 TopHatenarとHatenarMapsは、ともにJavaで開発されたアプリケーションです。開発にあたっては、WebアプリケーションフレームワークとしてCubby(http://cubby.seasar.org/)を、テンプレートエンジンとしてMayaa(http: //mayaa.seasar.org/)を、O/RマッピングツールとしてS2JDBC(http://s2container.seasar.org /2.4/ja/s2jdbc.html)を利用しています。

 また、TopHatenarとHatenarMapsの間でデータ通信を行う目的で、S2RMI(http://s2rmi.seasar.org/ja/)を使用しています。これらはいずれも、Seasarプロジェクト(http://www.seasar.org/)傘下のオープンソースフレームワークです。

 TopHatenarとHatenarMapsは、J2EEアプリケーションサーバーのGlassFish上で稼働しています。フロントエンドWebサーバーのApache HTTP ServerがHTTPリクエストを受け取り、プロキシモジュールのmod_proxyを通じてGlassFishに転送する方式で、閲覧者のリクエストが処理されています。

 アプリケーションのバックグラウンドでは、ランキング情報や地図情報を更新するためのクローラが常時動作しています。クローラは、はてなダイアリーとはてなブックマーク、およびlivedoor Readerが提供する各種Web APIに定期的にアクセスし、APIから取得した情報に基づいて、データベースを逐次更新しています。

 続いて両サービスのデータベース構造について説明しましょう。

株式会社オープンナレッジ
1981年生まれ。栃木県出身。東京工業大学情報工学科を卒業後、2005年4月より株式会社オープンナレッジに勤務。システムの設計、開発から運用までを幅広く担当している。現在、Seasar Sandboxプロジェクトの下で、JavaのGUI開発向けフレームワーク「S2Swing」を開発中。

Think ITメルマガ会員登録受付中

Think ITでは、技術情報が詰まったメールマガジン「Think IT Weekly」の配信サービスを提供しています。メルマガ会員登録を済ませれば、メルマガだけでなく、さまざまな限定特典を入手できるようになります。

Think ITメルマガ会員のサービス内容を見る

他にもこの記事が読まれています