Twitterの利用データから「96.7%の精度で個人を特定できた」とする研究結果が発表される

投稿日:

by ともぞう

自分は気を付けて使っているつもり…そんな人でももしかしたら個人を特定されてしまうかもしれないという研究結果が発表されました。

WIRED.jpによると、「Twitterのツイートに含まれるデータを利用することで、1万人のTwitterユーザーの身元を96.7%の精度で特定できた」とする論文が発表されたと伝えています。

記事によると、ロンドン大学の研究チームが発表した論文で、Twitterのツイートに含まれる「メタデータ」を機械学習を用いて解析することで、個人の特定ができたとのこと。

論文は、ユニヴァーシティ・カレッジ・ロンドンと、ビッグデータの専門機関である英アラン・チューリング研究所の研究チームが発表した。

科学者はツイートに関連づけられたメタデータを使用し、10,000人のTwitterユーザーの身元を96.7パーセントの精度で特定した。メタデータを60パーセントまで不明瞭にしたときでさえ、95パーセント以上の精度で1人の人間をピンポイントで識別できたのだ。

引用元:WIRED.jp

肝心な「メタデータ」とは何なのか詳しく説明がないので分からなかったのですが、研究者によるとTwitterには144種類のメタデータが含まれており、そのデータには外部からAPIを介して外部からアクセス可能なそうなんです。

彼の推測によれば、ほとんどのTwitterユーザーは次のような重要なことを知らないのだという。Twitterには144種のメタデータが保存されていて、それらはAPI(アプリケーションプログラミングインターフェース)を通じて外部からアクセスできるのだ。
引用元:WIRED.jp

とこれだけ読むと、そもそもメタデータにはどんなデータが含まれていて、主にどのデータによって個人がどこまで特定されたのかは不明。

気を付けようもない話ではあるのですが、このようなデータ解析を行わなくても投稿の仕方によっては住んでいる場所や最寄り駅、家族構成や今どこにいるかなどは分かってしまう場合もあります。

そういう意味ではそもそも自分から大事な個人情報を垂れ流してしまっている可能性もあるので、みなさんくれぐれもそのようなことがないよう気を付けて下さいね。

ライターのひとこと

近所に〇〇(チェーン店)がオープンした」とか投稿するだけで、オープン情報を調べれば住んでいる地域はある程度、時期で特定可能ですし、近所とあれば都心なら徒歩圏内、田舎なら車で10-15分くらいの場所に住んでいるってくらいは推測できちゃいますから、ほんとご注意を。

iPhoneをチェックする

 ソフトバンク民は見ない方がいいかも。最終的に全然違うよ。

参考:WIRED.jp

人気記事

ランキングの続きを見る


関連記事