はてなIDがクッキーで約50サイトに送られていた話

(追記) 要点を整理をした記事を書きました。こっちのほうが、余計なこと書いてない分、わかりやすいかもしれません。

はてなブックマークに、マイホットエントリーという大変すばらしい機能があって、毎日見ている。

自分のマイホットエントリーのURLはこう。

マイホットエントリーを見ていると、はてなID koseki を含むリファラが各サイトに送信される。

リファラGoogle アナリティクスの __utmz に記録される。

Firefox には、全クッキーの値を横断検索する機能がある。

設定プライバシーCookieを個別に削除検索

自分の環境では、およそ50個*1のクッキーに koseki という文字列が含まれていた。

f:id:koseki2:20130509143452p:plain

あんなサイトやこんなサイトを、本名を名乗って閲覧していたのか、と戦慄した。

はてなIDGoogle アナリティクス

戦慄したため、うすぼんやりとしか理解していなかった Google アナリティクスのクッキーについて、ちまなこで調べた。

流入元を記録するクッキー __utmz の有効期限は6ヶ月。__utmzリファラで書き換わる。

それとは別に、ビジターを識別する __utma というクッキーがある。有効期限は最後にアクセスしてから2年。

リファラが送られた時点で __utma を、はてなIDと関連づけることが可能になる。

するとどうなるか

ビジターを識別する以外に意味を持たない __utma は、はてなIDと置き換えられ、最新の興味関心(=はてブ)を、アクセス先のサイトに延々と提供し続けることになる。

本人?

はてブのページからアクセスしているのは本人とは限らない。が、

を見ている者が、自分以外にいるとは思えない。自分のはてブトップが Google でヒットしているのを見たこともない。

アクセス回数から、どの __utma が本人なのか推測できる。

本人がブックマークしていない URL へのアクセスは、マイホットエントリー経由なので、本人だと確定できる。

プライベートモードの場合も本人と確定できるが、そのユーザの関心事を調べることはできない。クロスドメインのIDとしてのみ機能する。

ID連携

たとえば TSUTAYA のサイトでも、もちろん GA でトラッキングが行われている。

マイホットエントリ経由で TSUTAYA の映画レビューにアクセスし、レンタルするためにログインする。

と、はてなIDとTポイントカードが連携してしまう。

GigazineB級グルメ記事をブックマークして、ファミマでその商品を買った、とか、ネットの外までトラッキングできるようになる。

個人情報の積み増し

自分のところには、いつ登録したのか覚えていない「Tアンケートメール」というのが大量に送られてくる。

From: Tアンケートメール
日付: 2013年4月26日 10:09
件名: 答えてお得なQ&Aメール【5問で5ポイント(PR)】

★たった5つの質問に答えるだけで、★
★5ポイントがもらえる      ★
(2013/4/26)

いつもTサイトをご利用いただき、ありがとうございます。

このメールは、「Tアンケートメール」にご登録いただいているみなさまに、
Q&A形式でお得な情報をお届けします。
回答するだけでポイントがもらえますので、是非ご参加ください!

◆「映像レンタル・動画配信に関するQ&A!」

◆回答期限 2013/5/10(金)まで

◆特典  Tポイントを5ポイント

・回答いただいた内容は、カルチュア・コンビニエンス・クラブ株式会社が、
T会員規約に従い責任を持って管理し、お客様の情報として利用致します。

  本アンケートをご案内するメールが届いたご本人様のみが、
  本アンケートの依頼対象となられた方です。
  依頼対象となられたご本人様以外は、大変恐縮ですが
  回答をご遠慮ください。

ちなみに 3月、4月に送られてきたテーマは、

  • 保険に関するQ&A!
  • メンズエステに関するQ&A!
  • 自動車に関するQ&A!
  • 貯蓄に関するQ&A!
  • 自動車保険に関するQ&A!
  • 資産運用に関するQ&A!

だった。具体的に何をやっているのかは知らないが、なんとなく、Yahoo 知恵袋の怖い質問シリーズを連想してしまう。

IDの先にいる生身の人間の性質を、法に触れない範囲で可能な限り収集したい、という欲求があるとしたら、ソーシャルブックマークのユーザIDは格好のターゲットになり得る。

Gunosy

最近話題の Gunosy の URL も、はてブと基本同じだった。

といったURLで、パーソナライズされたURL集を配信しており、各サイトにリファラが送られている。

Facebook の例

ここまで書いてから Facebook の ID がリファラで漏れる mala さんの記事を見つけてしまった。

なんか 100% 蛇足だった気がしてきたが、Facebookはてブでは違うところもある(と思う)。

  • Facebook の広告を毎日何件もクリックしたりしないが、マイホットエントリーは毎日何度もクリックする(人もいるかもしれない)
  • Facebook では他人事だった話が、はてブだとリアルに思える(人がいるかもしれない)

アンチパターン

本人が見ている可能性が高いページから外のサイトに出るときは、リファラにユーザIDを含めない方がよい。

代替案

デメリットが大きすぎて、あんまり現実的でないような気もする。が、一方で、名前が載ったクッキーが50個も見つかるのも、けっこう本気でいやだ。

アドオンでリファラをオフにしたりはしたくない。GA をオプトアウトする、という選択肢もあるけれども、

根本的な解決にならない。


線を引く

自分のプライバシーをどこまで公開できて、どこから守りたいのか、自分でもよくわからない。何もかも秘密にしたい日もあれば、全裸で外に出たい日もある(ない)。

どこに線を引くかの基準には、市場の側面と倫理の側面があるように思う。

市場の話

俺のプライバシーと交換で、もっといいサービスを受けるため、お前らも安く売んな、というのが市場の話。

われわれがオンラインで何か活動をすれば、必ず誰かがそれをデータベースに記録し、その情報に基づいて何かを売りつけようとしてくる。これについて はオンラインで活動しないという選択肢を除いてわれわれができることはほとんどない。それに赤ん坊がいる家庭にオムツの広告が表示されたり、車を買い換え ようと思っているときに車の広告が表示されたら便利なことだってある。いずれにしてもささいなことだ。

Wall Street JournalがFacebookのプライバシー問題をめぐってから騒ぎ - TechCrunch

IT業界の人が「ささいなことだ」と言いたくなる背景には、プライバシーが値上がりすると儲けが減って困る、という(おそらくは無自覚な)思いがあるんじゃなかろうか。

「ささいなこと」と言いつつ、一方で、必死で個人情報を吸い上げている。

プライバシーは、安く仕入れることができ、高く売れるからだ。

そんなに儲かるなら、まだまだプライバシーの値段を釣り上げられるはず。

倫理の話

たとえば、高級ホテルがすばらしいおもてなしを提供するため、VIPのお客様を尾行して、生活パターンを事細かに記録していた、というような場合。

誰にも害はなく、むしろ心地よいサービスを受けられる、けれども、理由は説明できないけれども悪だと感じる、のが倫理の話。

現実の尾行はダメで、ネットの尾行はアリなんだろうか。情報量が少ないから、解像度が低いから、許容できるのか。

ソーシャルなデータで解像度が上がると、ネットの尾行も許容できない行為に変わるかもしれない。

*1:気付いた時点で49個、その後いろいろ試して増減した。