牛島研究室OnLineへPHPで書かれています。

 

BOOK/WEB情報システム

概要

  • BOOK/WEB情報システムの目標は、本を「読む」、ノートやメモを「書く」、必要な情報が印刷されている書籍のページを「探す」といった知的生産の根幹をなす人間の行為をすべてPC上で行なうことができるようにするものである。
  • この情報システムの対象は書籍すなわち「紙の本」に限定されない。ウェブを情報源として活用していれば自明のことであるが、「紙の本」以上に有益な情報がウェブ上にアップされているケースが急速に増大している。こうしたウェブ上の情報を「ウェブBOOK」という名称のもとに、「紙の本」と同様に取り扱うことができるようにすることも、この情報システムの主要な目標の一つである。
  • BOOK/WEB情報システムの概要を以下に図で示す。

  • BOOK/WEB情報システムの「ハイパーBOOK」は伝統的なメディアである「紙を本」を表わし、「ウェブBOOK」は新しいメディアであるウェブ情報空間上の本を表わす。BOOK/WEB情報システムが実装しなければならない機能は大きく3つある。
    1. 「紙の本」をPC上でページを繰りながら「読む」ことができるようにすること
    2. 「紙の本」とウェブBOOKを統一的に扱う共通のインターフェースを開発すること。
    3. 検索機能を持たせて、そこから該当ページが直接に表示されるようにすること。
  • 第一のページ表示の機能すなわちビューア機能がどのように実現されているかを例示するために用意したのが次の図である。左側では従来の書籍のページがPC上で表示されており、右側ではアーカイブ化されたウェブページが表示されている。

    いずれもフレームを使ってメニューバーが右ないし下に用意されている。「紙の本」の場合には、次頁・前頁を読むためのページ送り機能や、今読んでいるページ画像をOCRソフトに自動的に引き渡す機能が装備されている。
    両者共通に用意されているのが、ページを読みながら読書ノートを取り、それをデータベースの所定の場所に自動的に保存する機能である。メニューバーにある「メモ」ボタンを押すと、下の図にあるように小さなウィンドウが開く。そのウィンドウのフォーム欄に記入を済ませて上部にある「読書ノート書き込み」ボタンを押すと、後はPHPスクリプトがISBNとページ数あるいはURLを取得して所定の場所に書き込むまでの処理を一括して実行する。
  • 次に、第二のインターフェースの共通化であるが、WAMP情報システムのトップページを使って説明する。

    このトップページには、BOOK/WEB情報システムのノウハウが凝縮されているが、その機能は2つに、すなわちページをPC上に表示させる本を絞り込むための機能と各種ツールを呼び出す機能とに大別される。
  • 絞り込み検索のために、著者名・書名・出版社といった書誌情報に加えて、分野やデジタル化のレベルが登録されたMySQLのテーブルが用意してあり、そのデータを照会することで絞り込みが的確かつ効率的になるようにしてある。トップページの選択画面は左中右の3列に分割されているが、左例で「分野」を選択するか、中央列で検索文字列を入力するかして、「PHPに送信」ボタンを押すと、ヒットした本が一覧表示される。右列は「オプション検索」ないしは高度な検索をつかさどる。そのために左中列とは背景色を変えてある。「オプション検索」のために5バイトのコードを独自に定義して、スキャン入力の状態・OCR化の状態・索引ファイルの整備状況・読書ノートへの登録状況などが、このコードを検索することで分かるようにしてある。
  • 絞り込み検索の結果は一覧表示されるが、表示の形式として2種類を用意してある。その例を下の図に示す。1種類は通常の一覧表形式であるが、それに加えて図の右側のように表紙の一覧形式(「カバーリスト」形式と呼んでいる)が用意されている。

  • トップページの右列の下に用意してあるのが「セットメニュー」である。デフォルトは「本を読む」にしてあるが、「索引検索」や「ウェブBOOK全文検索」を選択することもできる。セットメニューにはとりわけ利用頻度の高いツールが登録されているが、それ以外のツールはページの最下部から2クリック以内でコールできるようになっている。BOOK/WEB情報システムの真価を決するのは、MySQLのデータベースやデジタル化したBOOK情報ではなく、それらを活用するためのツール群がどれだけ整備されているかである。。ツール群の一端を挙げると、スキャン入力を最大限自動化するためのツール、ウェブページを解析して必要な書き換えを実行しながら自動的にダウンロードするツール、ローカルドライブに一括してファイルやフォルダを作成するツール、データの形式や場所をチェックして診断結果をレポートするツールなどがある。これらのツールはすべてPHPスクリプトによって書かれている。すなわちPHPツールの機能はすべてウェブブラウザから呼び出して実行できるようになっており、このPHPツールを動かすためにWAMP環境が必要となっている。
  • ここでは、検索用に開発したPHPツールだけを紹介しておく。下の図の左側が、登録された全索引項目から検索するツールであり、右側は登録されたウェブBOOKの全ページから検索するツールである。トップページとデザインが統一されていることが、一見しておわかりいただけると思う。

  • この索引検索機能が、先に挙げたBOOK/WEB情報システムの3機能のうちの第三に該当する。BOOK/WEB情報システムのビューアは、ISBNとpageないしはURLが指定されたときに該当ページを表示するようになっている。「ハイパー索引」用の検索ツールが果たす機能は、語句が入力されたときに索引ファイルを検索して、ISBNとpageないしはURLを取得し、その結果を一覧表示した上でビューアを呼び出すことである。文字列検索の機能が備わることで、BOOK/WEB情報システムはようやく実用段階に入ったと自己評価している。