TOPシステム開発【楽々デブドックを書こう!】XMLで開発ドキュメント> 第2回:情報システムにXMLが求められる背景 (1/3)

XMLで開発ドキュメント

【楽々デブドックを書こう!】XMLで開発ドキュメント

第2回:情報システムにXMLが求められる背景

著者:佐賀大学総合情報基盤センター 只木 進一

公開日:2008/02/13(水)

電子的文書の作成の意味

電子文書の基本電子的な文書作成を考える際に、まず気をつけておかなければならない点を確認しておこう。

その第一は「作成する文書の種類やサイズにあわせて、作業する道具を選ぶこと」だ。たとえば、内輪の会議案内をするにはプレーンテキストのメールで十分である。それをわざわざWordによる文書を作って添付ファイルとして送るとどうなるだろうか。送信者も受信者もワードプロセッサを起動しないといけない。最悪の場合では、ウイルスを送付してしまうことすらある。

また、図や式がたくさん入った科学技術文書をWordで作るのは効率が悪い。ちょっとした変更のたびに、文書全体を誤って壊したり消してしまうリスクを負ってしまうからだ。そのため文書を章ごとに区切って必要なところだけを作業できる環境が必要である。だいたい、式の編集が大変である。もともとが業務文書作成用だから仕方がない。また、多数の名簿にさまざまな属性を付けて管理するならば、複雑になってしまう表計算よりもデータベースを使うべきである。

気をつけなければならない点の第二は、電子的文書作成の目的、特に業務においては、それが清書ではないということだ。この点で、間違った認識を持っている場合が多数見受けられる。電子的文書の作成は、文書の電子的共有、再利用にある。そしてプログラムによって処理を行いデータベース化したり、検索を容易にすることである。そのため、電子的文書の場合には内容と構造が重要なのであって、見た目は構造に対応していることが重要である。

つまり、その内容、構造、そしてその書式を区別して考えることで、共有、再利用を可能とすることが電子化の目的である。

なぜこんな当たり前のことを書くかには理由がある。こんな当たり前のことができないために、情報システムがどうなっているかを考えよう。

一般的な業務においては、無駄な添付ファイル付きメールを送り、外部アプリケーションを頻繁に開くことを求め、ウイルス拡散のリスクを持ち込んでいる。清書として電子ファイルを大量に作り、再利用できない電子ファイルのゴミをハードディスクにため込んでいるのが現状である。「情報化」によって効率化しようとしているのに、それどころか、「情報化」の名の下、非効率と不経済が生まれているのだ。

図1:文書構造と表現スタイルの定義で変化するXML
図1:文書構造と表現スタイルの定義で変化するXML

電子文書とXML

そこで「XML(eXtended Markup Language)」の登場である。これはその名の通り、マークアップ、つまり文書構造や表示などをタグを使って記述する言語である。Webページの記述言語「HTML(Hyper Text Markup Language)」と似たようなものである。

実際に、XMLはHTMLのようなタグで文書構造を構築していく。WebのページがXMLで直接に書かれていることも多い。実は、XMLもHTMLもSGML(Standard Generalized Mark-up Language)のサブセットになっており、そもそもが兄弟なのだ。

XMLの謳い文句は、文書構造、文書の表示形式、そして文書の内容を分離ができることと、それらがすべてテキストファイルであることである。文書構造を定義するDTDあるいはXSDファイル、文書の本体であるXMLファイル、そしてXMLから表示用、たとえばHTMLやテキストファイルへの変換方式を記述するXSLファイルが別々に定義できる。

これらのファイルはテキストファイルであるため、どのようなプラットフォームでも作成が可能である。どの日本語コードで書いているかもファイル内で指定するため、テキストエディタが対応さえしていれば、気にする必要はない。また、テキスト処理が可能などんなプログラムでも処理できる。特にJavaにはXML処理のさまざまななツールが準備されおり、XMLの構造をオブジェクトとして扱う準備ができている。そのためJavaとXMLは親和性が非常に高い。

はじめに書いたように道具は対象にあわせて選ばなければならない。XMLは文書の構造定義を定め、文書がその構造と合致しているかをチェックすることができる。つまり、定型的文書であり、かつ構造がある程度複雑な場合にXMLは有効な手段となる。

また、文書の内容とその表示形式(見た目)は別にすることが可能であり、1つの内容から複数の書式を出力できる。ある文書に対して、その全項目に対応する回答を付ける、あるいは合否判定を下すような場合に有効である。そう、情報システムの要求仕様、あるいは情報システムのさまざまな設定ファイルを書くのにピッタリなのだ。逆に、構造定義、表示形式、文書を別々に定める必要があるので、あまり短い文書には不向きである。 次のページ




佐賀大学総合情報基盤センター  只木 進一
著者プロフィール
佐賀大学総合情報基盤センター 只木 進一
センター長・教授
交通流やインターネットパケットの流れなど、自己駆動粒子系の研究を専門としている。並行して、情報システムの管理運用技術の研究開発も行っている。XMLやJavaなどを仕事道具として活用している。
http://www.cc.saga-u.ac.jp/


INDEX
第2回:情報システムにXMLが求められる背景
電子的文書の作成の意味
  情報システム仕様書の全体構造
  仕様策定は共同作業