Abstract:

 この論文は、WWW上へ書式統一された文書を公開するためのデータベースシステムの開発について論じる。そのシステムがどのような仕組みであるかということを解説する。その他、管理される文書の形式としてXML方式を用い、その形式を用いることによって得られる利点についても言及する。

Keywords:

Database,WWW,Java,Servlet,XML,XSLT,Internet


1.序

 今日の急速なインターネットの普及に伴い、多くの人々が手軽にWWW(World Wide Web)に公開されている文書を閲覧することができるようになり、また容易に公開できるようにもなった。しかしながら、必ずしもWWW上の文書が能率的に利用されているとはいえない現状も見られる。そこで著者は、WWWへの文書公開と活用を能率的に行えるようなデータベースシステムの開発を行った。ここでは、現状におけるWWW上の文書利用の問題点と、その問題点をこのシステムがどのようして解決したのかと言う点と、このシステムの今後の課題に関して述べる。
 今後、教育は学校教育に限らず生涯教育が広く行われていく事が予想され、また求められている。その中で大学のような高等教育研究機関が、その学術情報を広く公開し社会に役立てることが要求されていくことは容易に予想される。そのために、書籍の出版などが行われているが、専門書は採算がとれるほど部数が売れない上に最新の学術情報を公開するのに出版という手法を用いるには時間がかかりすぎる。そのような状況の中で今後インターネットでその学術情報を公開することが求められていくと考えられる。
 まず、現状のWWW上の文書利用の問題点として、書式統一に手間がかかる、更新作業にある程度ネットワークの知識が必要、文書の再利用を行いにくいと言うことが考えられる。書式の統一を行うためには、WW上であるないに関わらずその文書の著者の他に書式の管理者が必要となり手間と時間がかかる。だからといって、書式の統一を行わない場合その情報が有用なものであっても、その見た目の悪さから利用されないと言う事態も考えられる。そこでこのシステムでは、書式統一の手間と時間をなくすために文書の内容と形式(体裁)を切り離して管理することにする。次に更新作業の問題だが、WWW上に文書を公開しようと思えば少なくともFTPとHTMLぐらいの知識は必要となるが、特に私立大学では高齢の教授が多いこともあり、WWWに文書を公開したいが難しくてできないと言う教授も少なくないようである。そこでこのシステムは、ホームページ上のフォームを利用し、簡単に登録できるようにした。最後に、文書の再利用を行いにくいと言う点についてだが、この問題は最初に書式を統一したことである程度解決されているが、文書を計算機で処理し情報の共有や検索に役立てる事も考えなければならない。そのためにこのシステムは、再利用しやすい形式で文書を管理している。
 このシステムではこれらの問題点を以上のような方法で解決を行っている。これらの詳細を以下の文章の中で追っていくと同時に、文書の再利用の可能性とこのシステムの更なる課題についても触れることにする。


2.WWWへの文書公開の問題点

 現在、WWW上に文書を公開するに当たって問題となっている点について詳しく追い、その問題に対してこのシステムがどのような考え方・方法で対処したのかを述べる。

2.1.書式統一に手間がかかる

 WWW上であるないに関わらず、同様の文書は同一の書式で書かれているほうが読み手にとって読みやすい。しかしながら実際に文書の書式統一を行おうとすると、文書の筆者の他に書式の管理者が必要となり、文書の筆者が一つの文書を公開しようとする時に一々書式の管理者のチェックを必要とする。そのための人件費や手間によって、有用な情報が公開されなくなるという事態も考えられる。また、逆に書式統一がなされてないために有用な情報であっても利用されなくなってしまうということも考えられる。
 このような問題点に対処するために、書式統一という手間を自動化する情報技術が有用であるということは容易に予想される。書式を統一するために用いられる一般的な方法では以下のような手順をとる。

  1. 必要な項目を決める
  2. 書式を決める
  3. 内容を記述する
  4. 書式に合わせて記述し直す
  5. 公開する

 この手順の中で、1と2の作業は同様の文書に対して一度だけ行われるものであり、3・4と5は一つの文書に対して一々行われる。つまり同様の文書を公開しようとする場合「書式統一を行う」という4の作業を自動化することで、文書の公開が効率的に行えることがわかる。そこでこのシステムでは、機械的な4の作業を自動化することにする。

2.2.更新作業にある程度ネットワークの知識が必要

 WWW上に情報を公開しようとする場合多くは「HTML文書を書き、FTPクライアントソフトで自分の公開ホームペ-ジ領域にアップロードする」わけだが、この一文を読んで意味が分からないという人は、WWW上に情報を公開することはできないと思って良い。また、この文章の意味が分からないという人は決して少なくない。つまり、そのようなネットワークの知識がないという人は有用な情報を持っていてもWWW上にその情報を公開できない、ということになる。
 そこでこのシステムでは、書式が統一されている文書ということもあるので、ホームページ上のフォームに入力することで更新作業ができるような仕組みとした。

2.3.文書の再利用を行いにくい

 WWW上の文書としては現在HTML形式が最もよく利用されている。この形式で記述しておけば、UNIX・Windows・MS-DOS・OS/2・BTRONやインターネットテレビなどの様々なシステムからその情報を利用することができ便利である。しかしながら、この文書形式は文書の内容と形式(体裁)が混在しているために、文書の再利用が難しい。そこでこのシステムでは、文書の内容と体裁を完全に分離して管理することにした。つまり以下のような手順で文書を作る。

  1. 必要な項目を決める
  2. 1で決めた項目をどのような体裁で配置するか決める
  3. 項目に合わせて内容を記述する
  4. 3の内容を2で決めた法則に従って記述し直す
  5. 公開する

 この手順では、2で体裁を、3で内容を決めている。そして2と3に従って4でHTML形式のファイルを生成する。このようにすることで、文書の体裁と内容を完全に分離することができる。また内容部分に関しては、決定した項目に従って規則的に記述されているので、コンピュータで文書を解析してその文書の内容を処理すること(たとえば検索処理など)ができる。

 以上のようにして、このシステムではWWW上への文書公開の問題点に対処することにした。


3.本システムの関連技術

 前項でこのシステムがどのようなことを目指したシステムであるかということはつかめたかと思うが、ここではそれを実現するために用いた技術をについて述べる。

3.1.eXtensible Markup Language(XML)

 XML(eXtensible Markup Language)とはW3C(World Wide Web Consortium)がISO-8879/JIS-X4151で規定されているSGML(Standard Generalized Markup Language)の機能を制限して勧告した文書記述言語である。この文書記述言語では、複合構造を持った文書の表現や、タグというものによって項目とその内容の対応を表現することができる。
 これによって、XMLを構文解析する事によってその文書の情報(=メタ情報)をプログラムで取得することができたり、プログラムによってある文書をほかの法則を持ったXML文書に交換することなどができる。

3.1.Java Servlet

 Java Servletとは米Sun Microsystems社がJava Web Serverと同時に発表した、WWWに文書を公開する時に用いるプログラムであるWWWサーバに、自分が作ったプログラムモジュールによって生成した文書を送るシステムである。Java Servletでは、他人の作ったプログラムを効率的に再利用できるオブジェクト指向言語の一つであるJava言語によって、プログラムモジュールを記述することができるので前述のXMLの構文を解析するソフトなどは、他人が作ったものを流用することができ、容易にソフトウェアを開発することができる。

 このシステムでは、以上のような技術を用いて開発を行った。これらの技術はともに、標準的なものであり環境を選ばないのでこのシステム自体は様々な環境で動作し、生成した文書もこのシステム以外のシステムでも容易に再利用することができる。


4.本システムの仕組み

 ここでは、このシステムがどのような仕組みで動いているのかを解説する。まず最初にこのシステムを構成するものを示す。

  1. WWWサーバ(WWW上に文書を公開するためのソフト)
  2. サーブレットエンジン(Java Servletを動作させるためのソフト)
  3. XML文書
     1. 文書の鋳型(文書の項目を定義するファイル)
     2. HTML形式文書に変換するための法則
     3. それぞれの文書
     4. 文書の一覧
  4. それぞれのHTML形式の文書

 以上のものが、どのように用いられているかをシーケンス図を用いて示す(図1)。このシーケンス図の流れの中でユーザが実際に操作する部分は入力(1)の一覧からの文書の選択と、入力(2)のフォームへの入力部分のみであり、ユーザはシステム内部(図1におけるWWWサーバより右の部分)を意識する必要はない。しかしこのシステムは、ユーザの入力に基づいて実際にXML文書とHTML文書を生成するので、生成されたそれら文書をWWW上に公開しておけば誰もが自由に利用することができる。具体的にXML文書に関しては、他のネットワーク上のプログラムから解析処理して利用する(検索サーバなど)ことや、XML文書をそのまま印刷業者に持ち込んで実際の出版に用いることもできる。HTML文書に関しては言うまでもなく数多くのWWWブラウザソフトから閲覧することができる。
writoshow-01


5.本システムの可能性と今後の課題

 今までの項目でも述べてきたようにこのシステムは、XML/SGMLという標準的な形式で文書を保存管理している。そのために、このシステムで作った文書は簡単に再利用を行うことができる。たとえばこのシステムをA大学で、このシステムのように文書をXMLで管理しているシステムをB大学で利用しているとすると、A大学はB大学の文書を、B大学はA大学の文書を異なるシステム間同士であるにも関わらず、自分の大学のものと全く同様に扱うことができる。よく異なる種類のシステムを使っている大学同士などが共同で計画を進める時にどちらのシステムに合わせるかと言うことが問題になることがあるが、このようなシステムを用いている場合は、システムを統一することなしに共同で計画を進めることができる。それでもシステムを統一しなければならないと言う事態が発生した場合でも、標準的な文書形式を利用しているので別のシステムにもそのまま今までの文書を利用することができる可能性が高い。最終手段として自分で文書変換プログラムを作って変換しなければならない場合でも、XMLの構文解析ソフトは充実しているので他の形式の場合に比べ、開発の手間は大幅に減る。
 入力方式として、このシステムはフォームからの入力・更新方式を採用している。しかしながらこのような入力方式は容易である反面、複雑な形式の文書を入力させることは難しい。そこで、もっと複雑な形式の情報を容易に扱うことができるように、クライアント側にもっと複雑な仕組みを持たせることも検討すべきではないかとも考えられる。その部分がこのシステムの大きな課題と思われる。


6.結び

 さて、以上のようにこのシステムを利用するとある程度能率的にWWW上に文書を公開できると言うことを示した。またそれと同時にこのシステムで作った文書は、容易に他のシステムにも再利用できることも示した。例えばこのシステムを使ってみて不具合が生じた場合でも容易に他のシステム変更することができるのである。つまりこのシステムは、他のシステムの場合と比較して、とりあえず導入するという事が容易に行える。導入して失敗した場合のリスクが小さいと言うことが言える。
 この論文を読み、このようなシステムに関心を持った人がとりあえずと言う形ででも利用してみれば、大学などの機関のWWW上への文書公開が進むきっかけの一つになるのではないかと思われる。

Works sited:

  1. 丸山宏・田村健人・浦本直彦著訳「XMLとJavaによるWebアプリケーション開発」ピアソン,1999年
  2. 原田洋子著「Java Servlet 最新サーバ・プログラミング」秀和システム,1999年
  3. 日置慎治「シラバスインターネット公開のためのデータベースシステムの開発」論文誌情報教育法法研究第2巻第1号,1999年11月
  4. Apache XML Project (http://xml.apache.org/)
  5. IBM alphaWorks (http://www.alphaworks.ibm.com/)

※このエントリは「パソコンリテラシ 2000.9」に掲載されました。
※論文情報:http://ci.nii.ac.jp/naid/10010066348