インターネットでサイト作って公開するようになってからかなりの年月が経ちました。しかし昔はseesaaブログを使ってmade in japanの製品の感想や紹介をしていたこともありました。そのことをふと思い出した私はアーカイブされていないかを調べました。するとありました(汗)かなり古い内容ですし、文章も拙くて恥ずかしいため、削除してもらうことにしました。その顛末です。
なんでもかんでも保存しているアーカイブサイト
人によっては「大迷惑」あるいは「大感激」されているのが、かの有名な「Internet Archive wayback machine」というサイトです。
http://archive.org/web/
こちらのサイトは、インターネット上で公開されているウェブサイトを手当り次第にキャッシュして保存して公開しているのです。
もちろん無くしてしまったサイトなども記録されているため、自分のサイトでトラブルがあったときには泣いて喜ぶ存在になるかもしれません。しかしそうでない限りは管理人が死んだ後も永遠に残り続ける負の遺産となる可能性が高いため、対策を施しておいた方が良いでしょう。
ちなみにこのサイトの利用方法ですが、調べたいURLを入力して検索し、保管されているデータがあれば表示されます。ただしそれは、当該のサイト管理人さんがデータの保存拒否などの措置をとっていない場合に限ります。
昔好きだったサイトで無くなってしまって悲しい思いをしている方はこちらのサイトに行くとひょっとしたらそのサイトを見る事が叶うかもしれません。(管理人さんは嫌かもしれませんが)
削除する方法
この愛されつつも迷惑がられているであろう「Internet Archive wayback machine」から自分の黒歴史を取り除くには今のところ二つの方法があります。それは自分のサイトのルートディレクトリ(public_htmlのある場所)に、訪れてくる情報収集bot、クローラーにデータの保存をしないように命令するタグを記載した「robots.txt」を置く事と、「Internet Archive wayback machine」へ直接メールを出して依頼する方法です。
robots.txtにインターネットアーカイブを拒否するタグを記載する
「robots.txt」とは、自分のサイト内の案内図、案内文だと考えると良いと思います。
判りやすく言うと「このサイトはこういう記事があるよ」「こんな風に置いてあるよ」「これは保存しないでね」「これは古い記事だからクロールしなくていいよ」などという意味のタグを記載しているものです。ただ、絶対に置かなくてはいけないものではありませんし、置いてないサイトもあります。
というわけで、もうお分かりだと思いますが、この「robots.txt」に「アーカイブしないでくれっ!!」と書き加えれば良いのです。ちなみに加えるタグは以下のものです。
User-agent: ia_archiver Disallow: /
この命令が書かれていると「Internet Archive wayback machine」がやってきても何もせずに帰ってくれます。
しかしこの方法は、自分でサーバーを借りてブログの運営をされている方しか出来ない削除方法です。seesaaブログなどのブログサービスを利用したブログでは「robots.txt」を自分で置いたり、内容の変更などは、恐らく不可能なので、他の方法しかありません。ただしそれも特定の条件をクリアしている必要があります。それについては次の項をお読みください。
「Internet Archive wayback machine」へ除外依頼メールを送って削除してもらう
wikipedia情報ですが、この「Internet Archive wayback machine」は1996年に創立された非営利の団体によって運営されており、本部はカリフォルニアで、英語で管理されております。
https://ja.wikipedia.org/wiki/%E3%82%A4%E3%83%B3%E3%82%BF%E3%83%BC%E3%83%8D%E3%83%83%E3%83%88%E3%83%BB%E3%82%A2%E3%83%BC%E3%82%AB%E3%82%A4%E3%83%96
乏しい英語力しかありませんが、削除する方法を探してみたところ、FAQのページに記載されていました。
How can I have my site’s pages excluded from the Wayback Machine?
You can send an email request for us to review to info@archive.org with the URL (web address) in the text of your message.
Internet Archive Help Center – How can we help you?
直訳すると「Q.私のサイトをどうしたらWayback machineから除外できますか?A.リクエストのメールを送ってください。」と書いてあり、メールを送れば除外してもらえる事がわかります。
しかしサイトと無関係な人が除外メールを送る事も考えられますから、サイトの管理人である証拠が必要になります。これが先述したと特定の条件です。
自分が管理人であることの証明
依頼人が本当の管理人であるかの証明がされない限り、「Internet Archive wayback machine」に削除依頼を出しても削除はしてもらえません。ここからはその照明方法について述べます。
同じメールアドレス
「Internet Archive wayback machine」に保存されている古いページに自分の使っているアドレスが記載されていれば、同一人物である証拠となります。そのアドレスを使い、そのアドレス記載を指摘したメールを送ると良いでしょう。
同じツイッターアカウント
メールアドレスと同じく、ツイッターアカウントが記載された古いページが保管されていれば、それも証拠になり得ます。アカウントについて記載した上でメールしましょう。
同じグーグルアドセンスのID
もし古い方のブログでグーグルアドセンスの広告を張っていたらそれも証拠になります。グーグルアドセンスのIDはその広告のソースを見れば判ります。IDについて記載したメールを送ると良いでしょう。
少し脱線しますが、グーグルアドセンスのID情報を元に、別名儀で運営している他のサイトがバレるということもあるそうです。全く違う内容や知られたくない内容のサイトがある方はお気をつけ下さい。
アマゾンアソシエイトのID
こちらもグーグルアドセンスと同じようにアドセンスのIDが本人証明の証拠になります。IDを記載してメールしましょう。
同じ画像を持っている
「Internet Archive wayback machine」に保存されているページに画像がある場合に有効かもしれない証拠です。同じ画像を持っていることを伝えれば管理人として認めてもらえるかもしれませんから、画像を添付してメールしてみましょう。
引っ越し先のURL
今回私が挑戦した削除依頼の方法です。前に複数のサイトを運営していた私は、現在の「Select Japan Closet」に集約しました。なので、古い方には移動先として新しいサイトURLを記載していたのです。
幸いなことに「Internet Archive wayback machine」に保存されていたページに新しいURLが記載されていたページもありましたから、私はグーグル翻訳を頼って、インターネットアーカイブ宛にeメールを送付しました。それが以下のものになります。
To Internet Archives
Dear staff,
I integrated several older sites and created a new one.
So delete the archive of the old sites.old
http://○○.seesaa.net/
http://△△.seesaa.net/↓
My new blog
(当サイトのURL)
The page with the same contents as the sent e-mail is here.
So,I will be proof that I am an administrator.http://当サイトURL/○○.html(注釈:このメール内容をコピペしたファイルです)
My name is yuu(優)
e mail
メールアドレス(注釈:インターネットアーカイブに送ったのと同じメールアドレス)Thank you.
送った文章はこのような内容で、更にこの内容をサイト内にhtmlファイルでアップしました。自分が管理人で、同じメールで送って、同じ内容の文章をサイト内で公開できるんですよ〜!というアピールです。
メールを送ってから一週間ほどしてお返事がきました。意外と早かったです。1ヶ月は掛かると思ったのですが。内容はこちら。
Hello,
The sites/URLs referenced in your email have now been submitted for exclusion from the Wayback Machine at http://www.archive.org.
Please allow up to a day for the automated portions of the process to run their course and for the changes to take effect. If you have any other questions or concerns, please let us know.
—
The Internet Archive Team
内容は「あなたのサイトは除外しましたよ。でも反映されるのに時間が掛かるかもしれません。何か質問とかあれば連絡してください。」という意味です。
メールを貰ってから一日後、試しに依頼したURLで調べてみたらもう削除されていました。意外とあっけなかったです。
証明できるものが何も無い
この場合は恐らく無理です。どうにもなりません。こういう事にならないようにするために、今ブログやサイト運営をしている方は「ツイッターアカウント」か「使い続けられるメールアドレス」をページ上に記載しておくことを強くお勧めします。
インターネットでサイト運営する覚悟
インターネットに出た情報は回収不可能です。まずその点を肝に銘じなくてはなりません。そして自分の指が叩き出した言葉には責任が伴います。この点を考える時、私も怖いと感じますし、こんなサイトをやっていて大丈夫か?とも思います。
でも、日本製のいいものを買った時に「良かった」と感想を書いたり、「もっとこうして欲しいああして欲しい」という願いをネット上に公開して、メーカーに伝えたいという少しばかりの自己主張が顔を出しちゃうのです。
しかし人によってはうざいであろう私の主張でも、「新商品のヒント」「商品改善のヒント」になったり「新商品開発」のモチベーションアップになるのではないかとも思っています。だからこれからもあくまでも主観的な感想になりますが、日本製の商品や製品の感想を書き綴っていくつもりです。
最後にひとこと
一番良い事は、「インターネットで文章なんて公開するな」です。人間は何時死ぬか判りません。放置されっぱなしになる可能性も多分にあり、実際に管理人さんが亡くなってしまったブログも多くあります。自分の死後、それらをさらされ続けるのは嫌だと思う方は、サイト運営やブログなんてやってはいけません。
それでもブログを書きたい方は、事前にアーカイブされないタグを記載した上で記事を公開し、死んだ後は削除してという遺言をしっかり残して家族に伝えておきましょう。家族の居ない方は・・・そうですねえ。信用の出来る友人にでも頼むしかないでしょう。友人が居ない場合は、死後の手続きを全て依頼出来る行政書士に依頼しておくこともありです。
まあでも一番良いのは恥になるような文章はそもそも書かない事だと思います。個人のブログで「今日は誕生日だったからチョコレートのケーキを食べたよ」なんて内容なら人畜無害で誰にでもある日常の風景ですから死後残ってても問題は無いでしょう。ただ個人の日記なんてものは手書きの手帳のがいいんじゃないかな〜と私は思います。
ここまでお読みくださり、ありがとうございました。