牛島研究室OnLineへ
  USI情報システム on WAMP  

 

ウェブアーカイブ

概要
2つのツール
画像による説明

ウェブアーカイブとは

  • ウェブアーカイブ
    ウェブを検索していて役立ちそうなページを見つけたら、かならずそのページそのものを自分のパソコンに保存(ローカル保存)します。これをウェブアーカイブと呼んでいます。
  • アーカイブツール
    アーカイブ処理はPHPで完全に自動化されています。役立ちそうなウェブページを見つけたら、ブラウザの上部に用意してあるボタンをクリックします。そうすると、自動的にアーカイブ処理が開始され、数秒で処理が完了します。お気に入りに登録するより簡単な操作で済みます。
  • スクリーンカードへの自動登録
    ウェブ情報を管理するのはスクリーンカードです。 アーカイブしたウェブ情報はスクリーンカードに登録しなければなりませんが、この処理は自動化されています。

2つのツール

  • ウェブアーカイブは2つのツールから構成されます。
    1. URL取得ボタン:
      ブラウザ上のお気に入り(ブックマーク)のなかに置かれた送信ボタンです。
      ウェブページをブラウズしているときに、そのページのURLとタイトル情報をPHPアーカイブツールにGETで送信します。
      javascriptの機能を使ったアンカーリンクです。
    2. PHPアーカイブツール:
      ウェブページをアーカイブする機能はPHPだけで実装することができます。 PHPよりは、ウェブページに関する深い知識が必要です。

サンプル:ウェブ検索の一コマ

  • グーグルで検索する。
  • 検索結果に挙げられているページを上から順に(多くても20位くらいまで)みていく。
  • 役立ちそうなページが含まれていたら、
    1. グーグルの検索結果のページ
    2. リンク先の役立ちそうなページ
    を順次、アーカイブします。
グーグルの検索結果のページです。
サンプルは「薬害肝炎」の検索結果を表示しています。
左の画像をクリックすると、拡大した画像をご覧いただけます。
リンク先のページの一例です。
その内容をざっと見てみて、有益だと判断したら、アーカイブします。
まず、グーグルの検索結果のページをアーカイブします。
お気に入りのリンクの中に用意したボタンを押します。

このボタンはjavascriptだけで書かれています。 ボタンを押すだけで、今見ているページのURLやタイトルが自動的に送信されます。 USIにとっては、まさに「打出の小槌」になりました。

アーカイブ処理を担当するPHPが受信した内容を表示します。いちおうURL・タイトルを表示させていますが、内容を確認する必要はありません。

スクリーンカードへの登録状況をリポートする画面です。URLが未登録であれば、スクリーンカードに登録した上でアーカイブ処理しますし、既に登録されていれば、アーカイブ処理だけを行ないます。
すべて自動化されていますので、クリックするだけですみます。
アーカイブ処理が完了すると、その経過をリポートします。
  • CSS外部ファイルがimportを含むかどうか、
  • 文字コードの判別とシフトJISへの変換、
  • 主要なパスの相対パスへの書き換え、
  • コンテンツの取得に失敗したときはそのパス
などがレポートされます。
このページを更新[ctrl+f5]すると次のステップに進みます。
アーカイブ先のローカルパスをスクリーンカードへ自動登録します。
これによって、アーカイブされたウェブページの場所を探す手間を省くことができます。 スクリーンカード上に表示されるローカルリンクをクリックすれば、アーカイブされたページを見ることができます。
グーグルの検索結果のページが保存されているディレクトリを表示しています。検索条件と日付を含めたファイル名で、ローカル保存されています。
今度は、グーグル検索で見つけた有益なページをアーカイブしていきます。
操作はグーグルの検索ページとまったく同じです。

ブラウザのお気に入りに用意したアーカイブボタンを押します。

アーカイブ処理を開始する前に、URLやスクリーンカードへの登録状況を確認する画面が表示されます。
これらのページはスキップさせることもできますが、こういう良いページを見つけて保存しているということを心に刻むために表示させています。
アーカイブ処理の経過をレポートする画面です。
重要な書き換えを行なった場合には、大きな赤い字でレポートされます。
アーカイブ処理が大過なく完了していることを確認した上で、このページを更新します。
すると、アーカイブの結果をスクリーンカードに自動登録することができます。
アーカイブしたページのローカルパスが無事にスクリーンカードに登録されたことが確認されます。
アーカイブ処理が完了したら、スクリーンカードを呼び出します。
アーカイブしたウェブページのタイトルを右の欄に表示されます。
薬害肝炎に関するグーグルのページと有益サイトのページが登録されているのがわかります。
グーグルの検索結果のページに割り当てたスクリーンカードです。
左下にリンク表示欄が用意されています。URLと共にローカルパスもリンク表示になっています。
ローカルパスは、単にリンクを表示しているだけなく、そのファイルのis_fileチェックも行なっています。つまり間違いなくそのファイルがアーカイブされていることを確認しています。
グーグルの検索結果のリンク先のページに割り当てられたスクリーンカードです。
このページのローカルリンクをクリックして、より詳しくそのページの情報を見ていきます。いろいろ気づいたことがあれば、直接にアーカイブしたページにHTML形式で書き込みます。これは本で言えば、図書館から借りた本に書き込みはできませんが、自分で買った本ならいくらでも赤線を引いたりメモを書き込んだりできるようなものです。