TOP業務システム> マイクロフォーマット
セマンティックWebによる情報統合 〜Web 2.0と情報活用を支えるメタデータ
セマンティックWebによる情報統合 〜Web 2.0と情報活用を支えるメタデータ

第2回:Web 2.0世界におけるセマンティックWeb
著者:野村総合研究所   田中 達雄   2006/8/16
前のページ  1  2  3
マイクロフォーマット

   マクロフォーマットは、WebページのHTMLタグに定められた属性を付与することで、そのHTMLタグの開始タグと終了タグの間に記載されているデータに意味を付与するための技術である。

   まずは図1を見てほしい。これはワールドカップサッカーの対戦カードのスケジュールを閲覧できるサイト「WORLD CUP'06 KICKOFF」でhCalendarが使われていた例である(HTMLの記述を読みやすくするために余計な属性は省いている)。
WORLD CUP'06 KICKOFFでの適用事例 出典:野村総合研究所
図1:WORLD CUP'06 KICKOFFでの適用事例
出典:野村総合研究所
(画像をクリックすると別ウィンドウに拡大図を表示します)

   次に図2を見てほしい。「WORLD CUP'06 KICKOFF」上のスケジュールを自動的にGoogle Calendarに転記している例である。

Google Calendarへの自動転記の例 出典:野村総合研究所
図2:Google Calendarへの自動転記の例
出典:野村総合研究所
(画像をクリックすると別ウィンドウに拡大図を表示します)

   この例では、通常は人が目で見て理解できればよいHTMLページにhCalendarを付与することでプログラムにも記述された情報リソースの意味を理解させ、自動転記可能にしている(注2)。

注2: 図2の例では、FirefoxのプラグインであるGreaseMonkey上でhCalendarのデータをGoogle Calendarに転記するプログラムを実行して実現しているが、hCalendarが付与されていれば他のプログラムでも同様のことが可能である。

   このようにHTMLページという情報リソースに、マイクロフォーマットのようなメタデータを付与することは、タギング/フォークソノミーであげたような検索性の向上だけでなく、プログラムによる自動処理の実現にも貢献する。


マイクロフォーマットの問題点

   しかし、同時にタギング/フォークソノミーと同じ問題も潜在的に抱えている。

   hCalendarで使われている属性名「dtstart」「dtend」「summary」などは「http://microformats.org/」が恣意的に付けた語彙であり、すべてのWebサイトで採用するとは限らない。

   図2で見たような自動転記を実現する場合、hCalendarを採用したサイト同士であれば容易に実現できるが、そうでなければ第1回で解説したように多くの時間と手間を必要とする可能性が高くなる。

   イベント情報に関するメタデータをhCalendarだけに統制させるのであれば、こういった問題は起きないが、自由なインターネットの世界でこれは不可能なことであり、他の複数のメタデータを許容しながらも自動転記を容易に実現できる仕組みを考えた方が良い。

   ここでもやはり「セマンティックWeb」が有効な解決策となると筆者は考えている。hCalendarで使われている語彙と、他のメタデータで使われている語彙の関係をオントロジーとして定義しておけば、例え異なるメタデータを使用していたとしても1つのプログラムで自動転記可能となるだろう(図3)。

hCalendarと異なるメタデータを必要とする自動転記プログラム 出典:野村総合研究所
図3:hCalendarと異なるメタデータを必要とする自動転記プログラム
出典:野村総合研究所
(画像をクリックすると別ウィンドウに拡大図を表示します)

   現在、Web 2.0で話題となっている「タギング」「フォークソノミー」「マイクロフォーマット」であるが、まだ広く普及している段階ではない。そのため、今回取り上げたような問題が顕在化するのは、もう少し後になるだろうが、いずれも人間が恣意的に付与したタグ(メタデータ)に共通する問題は顕在化してくるはずだ。

   日々増大するインターネット世界の情報を有効活用するために、人間の能力を超えた部分はコンピュータに代替させてきた訳だが、もっとコンピュータにさせる仕事を増やさなくては(もっとコンピュータに賢くなってもらわなくては)、日々増大する情報に追いつかない。

   そんな中、今話題となっているWeb 2.0世界の技術は、あくまでもメタデータレベルの話であり、今後はオントロジーレベルでの問題解決を必要とする時期がいずれ訪れるだろう。

前のページ  1  2  3


野村総合研究所 田中 達雄
著者プロフィール
株式会社野村総合研究所  田中 達雄
1989年4月に富士通株式会社に入社。ソフトウェア工学を専門分野とし「UMLによるオブジェクト指向開発実践ガイド(技術評論社出版)」を共著。2001年2月に野村総合研究所に入社。現在、情報技術本部にてIT動向の調査と分析を行うITアナリスト集団に所属。Webサービス/BPMなどの統合技術、エンタープライズ・アーキテクチャなどが専門。


INDEX
第2回:Web 2.0世界におけるセマンティックWeb
  はじめに
  タギング/フォークソノミーの問題点
マイクロフォーマット