giovedì 16 luglio 2015

Panopticlick

Insomma, tu sostanzialmente sei tracciabile anche se disabiliti i cookie, pulisci la cache e quant'altro.

"Tracciabile", cioè "ieri entravi con la login Lupo a far caciara e oggi entri con la login Pecora a fare il pacifista, ma sei la stessa persona".

Ogni browser, nel collegarsi a un sito web, dichiara le proprie caratteristiche ("sono Mozilla 5.0 per Linux... accetto cookies... la mia timezone è questa... i plugin abilitati qui sono questi, ognuno col suo numero di versione... il mio plugin Adobe riporta che i font installati sono questi... il mio monitor è 1920x1080x24...").

Ognuna di queste caratteristiche è esprimibile in una percentuale (esempio: il 74% dei browsers accetta i cookie; l'8% dei monitor è full hd 1920x1080x24; durante l'estate il 16% degli utenti vive nella timezone -120, cioè due ore di differenza dal GMT inclusa l'ora leale; il browser Chromium di Ubuntu 14.04 su macchine x86 ha oggi una UserAgent che compare una volta ogni 90252 browsers...).

Combinando le caratteristiche indipendenti si ottiene una probabilità di aver identificato un singolo utente dalla massa: se a tale sito si connette sempre il tizio che accetta i cookie e ha un monitor full hd e rispetto al GMT ha -120 minuti, si ottiene:
  • 0.74 * 0.16 * 0.08 = 0.009472
cioè ci sono solo 9472 utenti ogni milione di utenti che hanno esattamente quelle tre caratteristiche.

Se l'utente in questione ha un browser Chromium x86 Ubuntu 14.04 come detto sopra (0.0011%), si ottiene:
  • 0.74 * 0.16 * 0.08 * 0.000011 = 0.000000104192 = 1 su 9.57 milioni di utenti.
Cioè il sito web in questione (che magari ha solo 5-6 milioni di utenti l'anno), quando vede quelle quattro caratteristiche, può dire con certezza di 9.57 milioni contro uno: è lui, quello di ieri, anche se ora sta entrando nel forum con un nick diverso e i cookie ripuliti!



Per provare quanto è "unico" il tuo browser, puoi cliccare sul tool Panopticlick della Electronic Frontier Foundation (EFF) e vedere quante informazioni "rilascia" ognuno dei tuoi browser e PC e quanto sono diffuse - "uno ogni x browsers ha questo valore": più è alto questo valore, e più sei "unico" (cioè, a lungo andare, riconoscibile come "la stessa persona che ha fatto quello e quello su quel sito là e quel sito lì").

Per implementare e mantenere un sistema del genere occorre una certa fatica (poiché col passare del tempo, nella popolazione dei naviganti, i browser cambiano, le statistiche cambiano, i font cambiano...), grosso modo alla portata dei siti web più grossi (quotidiani nazionali, social networks, ecc.) e delle agenzie governative.

Nessun commento:

Posta un commento