骨董品の世界はオリジナルをホンモノ、それを真似て作ったものはニセモノです。物の世界はコピーできないので、ニセモノはすぐに見破られてしまいます。それに真似て作るわけですから、オリジナルの作成年代は古く、それを真似て作ったニセモノの年代は新しいのが常識です。それが逆転してニセモノの年代が古いということはありません。
Webの世界はよくリニューアルします。車の場合は4年でフルモデルチェンジしますが、ホームページは1年でフルチェンジします。まもなく3年半経とうとしている検索デスクも、今まで数十回の更新をしています。現在のよりも前のほうがよかったという人もいます。現在のトップ・ページは1年前のものに比べて大幅に変更しており、その経過を知らない人は1年前のものをホンモノと思うかも知れません。それにURLの変更したことを知らなければ別物とみなすかも知れません。
Web情報のホンモノとニセモノは何で区別できるのでしょうか。Web情報の著作者本人が発信しているのがホンモノで、Webページをそっくりコピー、あるいはコピーを少し改変してWeb上に流しているものはニセモノです。これは著作権違反に該当します。コピーページはある時点のものですが、ホンモノは更新していきます。コピーページは更新しないため、ホンモノのイメージは損なわれてしまいます。骨董品の場合と違って、Webはニセモノの方がホンモノよりも作成年月が古いということが生じます。
この調査で気がついたことが2点あります。第1は複数の検索サイトへの収集年月が1日しか違わないことです。具体的に言いますと、コピーAは検索サイトS1とS3に紹介されています。S1の収集年月は1997.10.12、S3のは1997.10.13と1日しか違いません。また、コピーBに関して、S1の収集年月は1997.11.11、S2とS3は共に1997.11.12と1日違いです。ロボットを想定していたので登録日が異なるものと思っていましたが、偶然でも二回も生じるのには驚きました。
第2は情報発信してから収集されるまでが短いことです。コピーBのコピー年月は1997.11.9で、収集年月は1997.11.11です。またコピーCのコピー年月は1998.4.26で収集年月は1998.4.27です。情報発信して収集されるまでには一般に14〜30日位かかりますから、このケースのように1〜2日の収集は超まれな現象と言えます。
ロボット型の場合は次々にページを収集してきます。以前に収集したのと同じなのか更新したのかなどはソフトで自動判定しています。それにコンテンツを評価することは難しいことです。コピーページが紛れ込んでいても、それを自動的に排除することは不可能ですし、逆にホンモノを排除することもありえます。すべてをソフトに任せるのでなく、疑問が出たところは人間がチェックするシステムの方が安全です。