TOP業務システム> 情報の三様態:定型・半定型・非定型
Office&XML
CMSの可能性を飛躍させるOfficeXMLの適用

第1回:ドキュメント管理が変わる〜Office2007がもたらす変化〜

著者:インディゴ  高橋 陽一   2006/8/2
前のページ  1  2  3  次のページ
情報の三様態:定型・半定型・非定型

   問題はドキュメントがデータベースに格納されない結果、「情報が探し出せない」ことに起因する訳ではない。作成されるドキュメントそのものにも、容易な検索/再利用を阻む大きな問題が存在する。つまり、既存のドキュメントは、再利用されることを前提にした形式で作成/保存されていないのである。

   そこで、ドキュメント/情報の再利用を行うために必要な要素を説明するために、ここでは企業内部における情報の存在様態を大まかに「定型・半定型・非定型」の三様態に分類してみたい。
定型 予め定義された「厳密な構造」を有する一意の表形式/データ型の情報
  • 特長:個々のデータに一意のラベルが定義されている故に、機械(プログラム)による意味解釈が容易に可能となり、検索性/再利用性が非常に高い
  • 用途:基幹系等の業務システムの情報フォーマットとして
半定型 章/項/節のような階層型の構造を有するドキュメント型の情報
  • 特長:意味構造と書式定義(レイアウト情報)を分離し個別に管理可能なため、ドキュメント中の個々の要素単位での再利用が可能
  • 用途:規定集/契約書/マニュアル等の再利用性の高いドキュメントの情報フォーマットとして
非定型 特に構造を有しない、プレーンなテクスト情報
  • 特長:構造的な制約が一切ないため、手軽かつ自由に作成可能な反面、再利用性が低い
  • 用途:メール等に代表的な、再利用性が低いテンポラリーな情報のフォーマットとして

表1:企業情報の三様態

   表1からは、ドキュメントと呼ばれる情報が基本的には「非定型」と「半定型」のどれかに分類されること、積極的に「再利用を行う」ためには意味構造と書式定義を分離管理可能な「半定型」のフォーマットでの作成/管理が必要なことの2点が読み取れるだろう。

   ところが既存のドキュメントの大半は「潜在的には半定型」として作成/管理されるべきでありながら、斯様な「半定型」のフォーマットにてドキュメントを作成するツールおよびファイル形式が普及していないために「非定型」の状態で作成され、結果的にそれらのドキュメントは再利用されることなく「死蔵/放置」されているのである。

   このように情報が再利用されない問題の原因として、情報の管理に関する先述の「グレート・デバイド」とは別に、ドキュメントのフォーマットに起因する新たな問題が存在するのである。

   ところで、斯様な「半定型」のフォーマットにてドキュメントを作成するツールおよびファイル形式は、今後も一般的にならないのかといえば、その答えは「否」である。何故ならば、斯様な目的のためにはXMLというドキュメントフォーマットが存在し、このXMLを作成/管理するためのツールとして「the 2007 Microsoft Office system(Office 2007)」が登場しようとしているのである。

   そこで次項からは、XMLとOffice 2007がドキュメント管理にもたらす効果について説明したい。


the 2007 Microsoft Office system(Office 2007)によりXMLドキュメントを容易に作成

   XMLとはそもそも「汎用的なデータ記述のための仕様」としてW3C(Webで利用される技術の標準化をすすめるグローバルな団体)で策定されたデータフォーマットである。XMLには、ドキュメント自身に「情報としての意味構造」と「コンテクスト」が内包されているために、人間と機械の双方が理解可能な状態にて「情報」を保持/流通することが可能である。

   ところで、XMLを利用することで「一体何が実現でき、どのようなブレイクスルーがあるのか」という点について「具体的なイメージがわかない」、という声を一般的によく耳にする。特に情報生産の現場であるデスクトップアプリケーションの世界では、具体的な活用イメージがなかなか見出されていないのが現状ではないだろうか。

   そうした流れの中で、マイクロソフト社はMicrosoft Office 2003にてまず部分的にXMLをサポートし、さらに2006年末に発売が予定されている次期バージョンOffice 2007にて、Officeの標準ファイルフォーマットとしてXMLをフルサポートすることを明らかにしている。

   Microsoft Officeはビジネスや一般用途でのドキュメント作成用デスクトップアプリケーションとして、既にゆるぎない地位を獲得している。そうしたメインストリームのデスクトップアプリケーションがXMLをフルサポートしたことの意味はとてつもなく大きいといえる。

   つまり先述した「ドキュメントの再利用」に必要な「半定型」フォーマットのドキュメントが、使い慣れたMicrosoft Officeで簡単に作成できるようになるからである。

前のページ  1  2  3  次のページ


インディゴ株式会社 高橋 陽一
著者プロフィール
インディゴ株式会社  高橋 陽一
システム・インテグレーション事業部 ソリューション開発部 マネージャー/インフォメーション・アーキテクト

XML及びセマンティック系技術を活用した次世代コンテンツ管理ソリューションの企画/開発に従事。現在は、「Microsoft Office」とXMLデータベース:NeoCoreXMSの連携によるECMソリューション「DocuDyne」のプロダクトマネージャーとして、「ドキュメントの部品化」による次世代のコンテンツ・マネージメント・システムの普及/啓蒙に取り組んでいる。また上記と並行して、XMLベースの画像記述言語SVGとセマンティック技術を活用した「次世代位置情報ソリューション」の企画/開発にも取り組んでいる。


INDEX
第1回:ドキュメント管理が変わる〜Office2007がもたらす変化〜
  はじめに
情報の三様態:定型・半定型・非定型
  Office 2007が提供する Open XML Formatsとは