川添 裕
Yu Kawazoe

Waves on the Net 6
XMLに注目


この原稿は、もともと平凡社発行の雑誌『月刊百科』に「インターネットニューウェイブ」のタイトルで掲載したものです。改訂を加えてinternet versionとします。

 いまインターネットの世界で,XMLという言語が注目を集めている.
 これはWorld Wide Web(WWW)の文書を作成するための新しいメタ記述言語で,XMLとはeXtensible Markup Language,文字通りに訳せば「拡張可能マーク付け言語」である.「拡張可能」というのは,現在WWWの記述に使われるHTML(Hyper Text Markup Language)とは違って拡張可能の意味で,今後インターネットの情報の豊かさを左右する重要な新技術である.

 WWWの仕様を制定する団体であるW3C(World Wide Web Consortium)が,XML1.0の仕様を勧告したのは1998年2月10日のことで,W3Cのサイトにも内容が掲載されている.日本語での情報としては,日本からこの策定に加わった村田真氏が在籍する富士ゼロックスのSGML Cafeに,丁寧な説明がされている.

3つのマーク付け言語

 XML,HTML,SGMLと横文字の略号ばかりで申し訳ないのだが,すべてにMLが含まれることにも示されるように,これらは「Markup Language=マーク付け言語」という同類の言語である.HTMLで「月刊百科」という文字をウェブ上に太字で表示したい場合,「月刊百科」という文字の両側をタグ<>で囲み,中にB(Bold=太字)という書体属性を入れる(結果は「月刊百科」).これが「マーク付け」であり,こうした体裁は基本的には共通である.

 三者相互の関係は,SGMLが親で,HTMLとXMLが子に当たる.HTMLはSGMLの専用アプリケーションであり、XMLはSGMLのサブセットである.しかし,親が子より一方的に優れていると限らないのは人と同じで,インターネットで圧倒的に普及したのはHTMLである.SGMLは制定された時代背景もあって,元来,インターネットを前提にはしていなかった言語である.

WWWに新次元を拓く

 説明が遅れたが,そもそも親に当たるSGML(Standard Generalized Markup Language=標準一般化マーク付け言語)とは,1986年に制定されたISO規格で,「構造化文書」(構造の記述や内容の定義など,高次情報やメタ情報をも含む電子文書)用の,国際標準のマーク付け言語である.文書の種類や目的にも応じてDTD(Document Type Definition=文書型定義)と呼ばれる構造定義が書けるため,いかなる文書バラエティにも対応可能な「一見,究極の構造化文書フォーマット」だが,オプション機能を含め余りに仕様が煩雑なため,10年以上たっても普及していない.

 SGMLを書くとは,要するに,DTDを書くことだが,日本を代表する社員数万人の印刷会社でも,それが自由にできる要員は数人というのが実状である.しかし,DTDなどの構造定義さえ決まってしまえば,その環境下で特定少数のタグ付けを繰り返すことは,むしろ労力中心の単純作業である.

 乱暴に言うとHTMLは,DTDを現状のWWW向けの形に,単一定義に固定したものと言える.実際には,1997年12月にW3Cから発表された最新のHTML4.0の仕様書などは数百ページに及ぶ複雑なものだが,しかし,どんなに大部であろうとも,HTMLはその単一のDTDにしか対応しておらず,別のDTDを記述することはできない.

 こうした単一固定のDTD依存の限界から抜け出ようというのがXMLであり,そこでは,SGMLをぐっと簡素化して「インターネット版の使えるSGML」とし,ユーザー定義のいかなるDTDも可能,場合によってはDTDなしでもOK(SGMLではこれはできない)という共通環境を作りだすとともに, 新リンク機能なども加えて,WWWの表現に新次元を切り拓こうとしているのである.(この項は新リンク機能等を中心に,Waves on the Net 7 「XMLの可能性と新リンク機能」で再度ふれています。)

最終更新=Sun, 19-July-1998、初稿=Wed, 18-Mar-1998

Waves on the Netの目次へ戻る

 


Copyright (C) 1998 by Yu Kawazoe.