Metriche di Tor
Come è possibile contare gli utenti in una rete di anonimato?
We actually don't count users, but we count requests to the directories that clients make periodically to update their list of relays and estimate number of users indirectly from there.
Do all directories report these directory request numbers?
No, but we can see what fraction of directories reported them, and then we can extrapolate the total number in the network.
Come ottenete il numero di utenti da queste richieste di directory?
We put in the assumption that the average client makes 10 such requests per day. A tor client that is connected 24/7 makes about 15 requests per day, but not all clients are connected 24/7, so we picked the number 10 for the average client. Dividiamo semplicemente le richieste di directory per 10 e consideriamo il risultato come numero di utenti. Another way of looking at it, is that we assume that each request represents a client that stays online for one tenth of a day, so 2 hours and 24 minutes.
Quindi questi sono utenti distinti per giorno, la media degli utenti connessi al giorno, o cosa?
La media degli utenti simultanei, stimata dai dati raccolti durante il giorno. Non possiamo sapere quanti utenti distinti si sono.
Sono disponibili numeri più precisi, ad esempio, sul numero di utenti all'ora?
No, the relays that report these statistics aggregate requests by country of origin and over a period of 24 hours. Le statistiche che dovremmo raccogliere per il numero di utenti all'ora sarebbero troppo dettagliate e potrebbero mettere a rischio gli utenti.
Are these Tor clients or users? What if there's more than one user behind a Tor client?
Poi contiamo questi utenti come un unico utente. Contiamo davvero i client, ma è più intuitivo per la maggior parte delle persone pensare agli utenti, ecco perché diciamo utenti e non client.
What if a user runs Tor on a laptop and changes their IP address a few times per day? Don't you overcount that user?
No, perché l'utente aggiorna l'elenco dei relays con la stessa frequenza di un utente che non cambia l'indirizzo IP nel corso della giornata.
Come fate a sapere da quali nazioni vengono gli utenti?
The directories resolve IP addresses to country codes and report these numbers in aggregate form. This is one of the reasons why tor ships with a GeoIP database.
Why are there so few bridge users that are not using the default OR protocol or that are using IPv6?
Pochissimi bridge riportano dati sui trasporti o sulle versioni IP, e di base consideriamo che le richieste usino il protocollo predefinito OR e IPv4. Quando più bridge riporteranno questi dati, i numeri saranno più accurati.
Perché i grafici finiscono 2 giorni fa e non oggi?
Relays and bridges report some of the data in 24-hour intervals which may end at any time of the day.
And after such an interval is over relays and bridges might take another 18 hours to report the data.
Abbiamo tagliato gli ultimi due giorni dai grafici, perché vogliamo evitare che l'ultimo punto di dati di un grafico indichi un cambiamento di tendenza recente che è in realtà solo un artefatto dell'algoritmo.
But I noticed that the last data point went up/down a bit since I last looked a few hours ago. Why is that?
Il motivo è che pubblichiamo i numeri degli utenti quando siamo abbastanza sicuri che non cambieranno più in modo significativo. But it's always possible that a directory reports data a few hours after we were confident enough, but which then slightly changed the graph.
Perchè non ci sono numeri disponibili prima di settembre 2011?
Abbiamo archivi descrittivi prima di quella data, ma non contengono tutti i dati che usiamo per stimare il numero di utenti. Vedi la seguente tarball per maggiori dettagli:
Perché credi che l'attuale approccio alla stima dei numeri di utenti sia più preciso?
For direct users, we include all directories which we didn't do in the old approach. We also use histories that only contain bytes written to answer directory requests, which is more precise than using general byte histories.
E riguardo al vantaggio dell'approccio attuale rispetto a quello vecchio, in caso di utilizzatori di bridge?
Oh, è tutta un'altra storia. Abbiamo scritto un report tecnico di 13 pagine che spiega i motivi del ritiro del vecchio approccio.
tl;dr: nel vecchio approccio misuravamo la cosa sbagliata, invece ora quella giusta.
Cosa sono quei punti rossi e blu che indicano possibili eventi di censura?
Gestiamo un sistema anonimo di rilevazione censure che controlla il numero stimato di utenti in una serie di giorni e prevede il numero di essi nei giorni successivi. Se il numero effettivo è più alto o più basso, potrebbe indicare un possibile evento di censura o un'attenuazione di essa. Per maggiori dettagli, vedi il nostro report tecnico.