【私の卒業研究】O・Kさん 「Web資源のXML記述に関する研究・開発」

  (以下の記事は、情報社会学科が2学科制の際の【私の卒業研究】です。現在の3学科制の情報社会学科とは扱う内容が一部異なりますが、参考までに掲載します)

卒論の内容を紹介してください。

「XML」という、データ記述用の言語があるのですが、それを使ったデータベースを作り、その作成過程を通して、今後の情報流通と活用には何が大切で、どういったことに気をつけなければならないかを考える。また、そのためには、今ある最新の技術や規格のうち、何をどのように応用すべきかを考える。…専門用語が多いので、わかりやすく噛み砕いていうと、だいたいそういった感じの内容です。

「XML記述」に取り組んだ理由を教えてください。

これは、近年問題になってきている、情報氾濫の観点からです。
IT=情報技術の進展によって、私たちの周りには「情報」というものが溢れるようになりました。特にこの10年、インターネットの普及によってその情報量は爆発的に増えてきてるんですよね。で、そうなってくると、だんだん収拾がつかなくなってきた。どれが正しい情報なのか、どれが新しい情報なのか区別がつかなくなってきているんですよね。何年前の情報かもわからない情報が、未だに「最新情報」というキーワードで平気でサーチエンジンに引っかかってくる。

 データベースは情報を貯めておいて、あとでその情報を有用な形で活用できるようにするための仕組みなのですが、このように情報が溢れて整理がつかなくなると、その機能が麻痺するようになってきているんです。どの情報を保存して、どの情報は廃棄すべきで、どの情報は修正が必要なのか…こういったことが区別できない以上、とりあえず全部の情報を蓄積するしかありません。ところが、そうやっていくうちに、そういった不要な情報が雑音として入り込み、データベースの機能を低下させはじめました。

 さらに、情報量が増加して、その情報自体も全て貯めておくことはできなくなってきたんですね。もはや、整理がつかないという次元を通り越して、格納しきれないというところまできているわけです。ちゃんと分類整理されていれば廃棄すべき情報がわかり、保存する情報の総量を大きく減らすことができるんでしょうが、現状ではそれができません。卒論のタイトルでは、「Web資源」と表現していますが、実はインターネット上にある情報は、人類共通の貴重な情報資源でもあるわけです。せっかく蓄積した情報を、蓄積しきれないからというだけの理由で、ゴミ情報ごと有益な資源も廃棄しちゃっていいのか?という考えも起こってきます。で、こういう状況にきてやっと気づくわけです。…情報ってどうやって保存・管理して、どうやって流通させればいいんだろ?と。

 この卒論でXMLに注目したのはこういう事情があったからです。XMLは今後の情報流通フォーマットとして注目を浴びています。XMLは情報の階層構造を表現できる上に、インターネットを通じてやり取りができたり、特定のソフトウェアに依存しないという強みを持っています。

 さらに、XMLで文書を作成すると、コンピュータのプログラムで自動的に処理することが出来るようになります。例えば、有効期限の切れた情報は自動的に削除するとか、特定のキーワードで自動的に分類保存する、さらには内容を一部自動的に修正して保存するということまで可能です。今までの文書フォーマットでは残念ながらこれができませんでした。

 この卒論ではそういったXMLの長所を、円滑で効果的な情報の流通と活用に活かせないかと、いろいろと思案してみました。

これまでの関連する研究と比較して、O・Kさんのこの論文の長所はなんだと思いますか? また、反省点は何ですか?

XSLTというXML変換用の言語(…というか本来はXSLという規格に含まれる機能の一つなんですが)があるですが、それを使えば、XML文書を自由に加工・変形することができます。このXSLTを使いネイティブXML(生のXMLファイル)のままデータベースとして利用できることがこのシステムの長所であると考えています。生のXMLのままですから、データをそのままの形でインターネット等で流通させることができますし、XSLTで変形させて流通させることもできます。

データが生のXMLですから、他のシステムにも簡単に組み込んだりもできます。構想のみで実装にまでは至らなかったんですが、このXSLTの機能を応用すれば、インターネットを経由したデータベース間での横断検索なんかもできるかと思います。

 反省点は、「データベース」と言いながら、実はまだできることが検索のみなんですよね。データの更新や削除ができなければデータベースとはやはり言い難いと思います。この問題には、今後も開発に取り組んでいくつもりです。

この論文を読むと、大学の授業を越えた知識を持っていないと書けない部分があるように思えます。O・Kさんは、どうやってその知識を身につけましたか?

関連する書籍やWebサイト、それに、自分より多くの技術と知識を持った人から聞いた…ということになるかと思いますが、結局、何でも自分で興味を持って知識を得ようとすることが大切だと思います。静岡大学情報学部の良いところは、文理融合型の学部であるということです。自分はその利点を活かして、理系学科である情報科学科の授業にも積極的に参加するようにしました。

 あと、学部内では学生中心の様々なプロジェクトや勉強会が開かれています。そういった場にも積極的に顔を出し、科学科の人や先輩方から様々な知識や技術を吸収するようにしました。じっとして無難に過ごしていれば、技術も知識も何も付かないまま、4年間なんてあっという間に過ぎてしまうと思います。個人的に、何も残らないまま4年間の学生生活を終えるのは嫌だったので、なんでもかんでも顔を突っ込んでみたのが良かったのかもしれませんね。その分、関係各位にご迷惑をかけた面も多々あったかと思いますが(笑)。

この論文を通して、今後の情報社会の進むべき道をどう考えましたか?

円滑で効率良い情報の流通と活用のためには、そのルール作りが大切であるということを思いました。そのためには、情報を格納する受け皿となるフォーマットの規格化が大事だと思います。

ご存知のように、インターネットというメディアの誕生によって、誰もが自由に情報発信ができるようになりました。しかし、現在の情報氾濫の原因はここにあると考えます。誰もが好き勝手に情報を生成して発信してしまっているのです。

 じゃあ、ちゃんとルールに乗っ取った情報を作りなさいよ、と言ったところで、不可能なんです。なにしろ、そのルールがイマイチちゃんと定まってないんですから。ルールとフォーマットが曖昧なまま、とりあえず情報を流すインフラのみを整えてしまった。…これが今の情報社会なのです。

ですから、今後の情報社会は情報流通インフラの整備よりも、流通させる情報の内容(コンテンツ)の整備に力を入れるべきでしょう。情報をどう流すかではなく、どのような情報を流すか、そこを考えるのが情報社会学を学んだ者としてのこれからの仕事だと思います。

卒論を書くに当たって、後輩になにか助言はありますか?

事前調査を踏まえ、夏休み前からシステムの開発にあたったのですが、結局検索のみの未完成なシステムになってしまった。文系人間ですから、やはりプログラムを書いてゼロからシステムを作り上げるのは相当な苦労があります。特にこれから卒論にかかろうとする3年生・4年生の方は就職活動で忙しいでしょうが、できる限り早目に卒論に取り組むことをお勧めします。

 あとは、とにかくやってみる、行動に移してみることです。システムを開発するなら、できるかどうか迷っているよりも、まず画面に向かってみる。社会調査をやるなら、アンケートを取るなり、聞き取り調査を行うなり、まず行動を起こしてみることです。後手後手に回ると、結局提出間際になって寝れない日々を過ごすことになります。事前に自分の体を動かして得たデータや知識は、最後になって必ずどこかで活きてきます。

 最後に、卒論を書いていると、大体こんな風に書いてこういう結論に落ち着くだろうと、最初の頃思っていたのとは違う方向に論文の流れが進んで行くことがあると思います。壁にぶつかり、論拠の修正を余儀なくされることも多々あることでしょう。正直、「本当にこんな調子で卒論が完成するのだろうか」と不安になります。ですが、それが当たり前なのです。卒論も大きな一つの勉強なんですから、書いているうちに新たな発見や結論に至るのは当然のことです。むしろ、何も新たな問題点や修正点が見つからない方が問題です。最初に思った通りに何の障害もなく書けてしまうなら、その論文が、3年生の時点の知識や発想でも簡単に結論に至ってしまうレベルのものでしかありませんから。

 卒論は4年間学習してきたことの総まとめですから、大変なのは当たり前です。へこたれずにがんばって良い論文を書いてくださいね。

八重樫先生の指導でどういうことが役に立ちましたか?

情報の流通と規格化に関する部分は、日々、ゼミ室で先生とお話をするにあたり、自然に身についてきた考えだと思います。これは先生のお話の受け売りなんですが、情報の流通というものは、水道に例えるとよくわかるんですね。水が情報にあたり、水道管はその水(情報)を流すインフラ、つまり、インターネット等のコンピュータネットワークにあたります。

 ところが、今それを流れる水(=情報)の量が増え、水質(=情報の質)の管理が追いつかなくなってきています。情報技術の発展は太い水道管や高性能なポンプを開発することばかりに主眼が置かれ、肝心のどんな質の水を流すかはほとんど考慮されていないのが現状です。言葉が悪いかもしれませんが、今の状態ではやがて汚水しか流れなくなってしまいます。

 データベースは情報を貯めておくタンクなわけですが、汚水ばかり貯めていても意味がありません。ちゃんとした使える水(質の良い情報)を流すには、その水質の管理が重要なわけです。水質を管理する役割を担っているのが水道局であり、情報に関する各種の規格やルールであるわけです。

自分はただ、その水道局をどう作るかを考えたのみであって、実は、この論文の最も本質的な部分であり、また大前提でも結論でもある部分は八重樫先生の影響を大きく受けています。そういう観点で見ると、八重樫先生から多くのことを学ばせていただいたと思っています。

 あと、自分から問題解決のために行動を起こすという姿勢も、日々の研究室での指導で身についたように思います。先生は、いちいち細かく指導はしてくれません。ある程度のアドバイスというか行動指標を示していただくのみで、あとは全て自分でやるべきことを見つけて動くしかありません。サーバやプログラミング等の知識も全て自学自習で身につけました。これは、大学生、そして、研究者としては当たり前の姿なんでしょうが、最初はやはり戸惑いました。

主査・副査の先生の評価はどうでしたか?

うーん、いやはやなんとも(笑)。主査の先生からは、そこそこの評価は頂きましたが、論文の構成や表現面で問題があるとの指摘を受けました。

 副査は情報科学科の先生だったので、もっと厳しかったです。理系の先生ですのでプログラム等でも誤魔化しが効かないので、良くわからなくて逃げた部分とかは、ものの見事にツッ込みが入りましたね。最後の最後までビシッと指導していただきました。主査の先生にフォローしてもらいながらまぁ、なんとか単位を認めてもらったって感じでしょうか。

大学院に進学後、この論文でまとめたことをどう生かしたいですか?

前にも言いましたが、この論文で開発したシステムは未完成です。今後もこのシステムの開発を続けることになりそうです。その過程で、情報流通のための規格やルールを作るために、できることなら社会に対して何らかのアクションを起こしてみたいですね。日本はこういった規格の整備が、欧米と比較して遅れを取っています。機会があれば、海外に調査にも行ってみるのもいいんじゃないかなー、とか思っていたりします。

情報社会学科で学んだこと・得たことはなんだと思いますか?

何でも自分から求めて行こうという姿勢です。自分からやりたいことを考え、問題点を把握し、それについて自ら知識を得たりしながら解決をみる。…大学教育は高校までの教育と違って、上からああしろこうしろとは言われません。つまり、完全に自由なのです。だからこそ、自分から積極的に求めて行くようにしなければ、何も降ってはきません。

 4年間というフリーで貴重な時間を、何にどう使うのか? じっとしていれば、じっとしたまま4年間は過ぎていきます。現在在学中の皆さん、そして、これから大学生になろうとする皆さん、そのことを肝に銘じて、有意義な学生生活を送ってください。

 最後に、情報と社会の関係について自分なりの見識や考えを持てるようになって、こういった場であれこれ喋れるようになったのも収穫の一つかもしれませんね。

指導教員講評
指導教員:八重樫純樹
文系、理系どちらでもこなせるセンスと能力を有しておりました。
XMLについては先輩が調査研究を行なっており、3年時点から実開発研究として取り組む姿勢でおりました。社会学科で開発研究は大変なのですが、情報科学科の授業や勉強会に積極的に参加しており、この1年間で目安がつく程度まではやれると思っていました。

 アラっぽい指導ではありましたが、自分で積極的に色々調べ、勉強して問題解決を行なっており、当初の予想通りの成果を出してくれました。

 卒研で大事なことは、新たな知識獲得は基本ですが、問題発見、解決の方法を身につけることです。これを率先してしっかりやってくれました。大学院では社会先端の実状況に触れながらさらに視野を広げて欲しい。またアルゴリズムやプログラミング等の情報科学の基礎をもう少ししっかり身につけて欲しいと思います。

取材・編集:N(2003/03/12)