Tor Metrics
Anonimlik sağlayan bir ağdaki kullanıcılar nasıl sayılabilir?
Aslında kullanıcıları saymıyoruz. Ancak istemcilerin düzenli aralıklarla aktarıcı listelerini güncellemek için yaptıkları istekleri sayarak dolaylı yoldan kullanıcı sayılarını kestiriyoruz.
Tüm dizinler bu dizin isteği sayılarını bildiriyor mu?
Hayır, ancak dizinlerin hangi bölümünün bunları bildirdiğini görebiliriz ve buradan ağdaki toplam sayıyı kestirebiliriz.
Bu dizin isteklerinden kullanıcı sayılarını nasıl kestiriyorsunuz?
Ortalama bir istemcinin bir günde bu türde 10 istek yaptığını varsayıyoruz. 7/24 bağlı bir Tor istemcisi günde yaklaşık 15 istek yapar. Ancak tüm istemciler 7/24 bağlı olmadığından, ortalama istemci için sayıyı 10 olarak belirledik. Basitçe dizin isteklerini 10 ile bölerek sonucu kullanıcı sayısı olarak kabul ediyoruz. Buna bakmanın başka bir yolu da, yapılan her isteğin bir günün onda biri kadar yani 2 saat 24 dakika süreyle çevrimiçi olan bir istemciyi temsil ettiğini düşünmektir.
Peki bu sayılar günlük farklı kullanıcılar mı, gün içinde bağlanan ortalama kullanıcılar mı ya da ne?
Bir günde toplanan verilerden kestirilen ortalama eşzamanlı kullanıcı sayısı. Farklı kaç kullanıcı olduğunu söyleyemeyiz.
Örneğin saat başına kullanıcı sayısı gibi daha ayrıntılı rakamlar var mı?
Hayır. Bu istatistikleri bildiren aktarıcılar, istekleri kaynak ülkeye göre ve 24 saatlik aralıklar için derler. Saat başına kullanıcı sayısı için derlememiz gereken istatistikler çok ayrıntılı olur ve kullanıcıları riske atabilir.
Peki bunlar Tor istemcileri midir yoksa kullanıcıları mıdır? Bir Tor istemcisinin arkasında birden çok kullanıcı varsa ne olur?
Bu durumda bu kullanıcıları bir kişi olarak sayarız. İstemcileri gerçekten sayıyoruz, ancak çoğu insan sezgisel olarak sayıların kullanıcı olduğunu düşünür. Bu yüzden istemci sayısı yerine kullanıcı sayısı diyoruz.
Ya bir kullanıcı dizüstü bilgisayarında Tor çalıştırırken IP adresini günde birkaç kez değiştirirse? O kullanıcıyı birden çok kez saymış olmuyor musunuz?
Hayır, çünkü bu kullanıcı da aktarıcı listesini, IP adresini gün içinde değiştirmeyen bir kullanıcı ile aynı sıklıkta günceller.
Kullanıcıların hangi ülkelerden geldiğini nasıl öğrenebilirsiniz?
Dizinler IP adreslerini ülke kodlarına çevirir ve bu sayıları toplu olarak bildirir. Tor uygulamasının GeoIP veritabanıyla birlikte sunulmasının nedenlerinden biri de budur.
Neden varsayılan OR iletişim kuralını kullanmayan ya da IPv6 kullanan çok az köprü kullanıcısı var?
Şu anda aktarımlar ya da IP sürümleri hakkında veri bildiren çok az sayıda köprü bulunuyor ve isteklerin varsayılan OR iletişim kuralı ile IPv4 kullandığını varsayıyoruz. Daha fazla köprü bu verileri bildirmeye başladığında daha doğru sayılar elde edilecektir.
Çizelgeler neden bugün değil 2 gün önce bitiyor?
Aktarıcılar ve köprüler, 24 saatlik aralıklarla günün herhangi bir saatinde bitebilen veriler bildirir.
Ve bu sürenin sonunda aktarıcılar ve köprülerin verileri bildirmesi 18 saat daha sürebilir.
Bir çizelgedeki son veri noktasının algoritmanın yapaylığından kaynaklanan yeni bir eğilim değişikliği göstermesini istemediğimizden son iki günü çizelgelere katmıyoruz,
Ancak birkaç saat önce baktığımdan beri son veri noktasının biraz yukarı/aşağı gittiğini fark ettim. Neden?
Bu durum, kullanıcı sayılarını artık önemli ölçüde değişmeyeceğinden yeterince emin olduğumuzda yayınlamamızdan kaynaklanıyor. Ancak bir dizin, biz yeterince emin olduktan birkaç saat sonra yeniden veri bildirebilir. Bu durum da çizelgeyi biraz değiştirir.
Neden Eylül 2011 öncesi için bir numara yok?
O zamandan öncesine ait tanımlayıcı arşivlerimiz var. Ancak bu tanımlayıcılar kullanıcı sayılarını tahmin etmek için kullandığımız tüm verileri içermiyordu. Ayrıntılı bilgi almak için şu tarball paketine bakın:
Neden var olan yaklaşımın kullanıcı sayılarını kestirmekte daha doğru olduğuna inanıyorsunuz?
Doğrudan kullanıcılar için, eski yaklaşımda yapmadığımız şekilde tüm dizinleri katıyoruz. Ayrıca genel bayt geçmişlerini kullanmaya göre daha kesin olan ve yalnız dizin isteklerini yanıtlamak için yazılan baytları içeren geçmişleri kullanıyoruz.
Kullanıcılar arasında köprü kurmak söz konusu olduğunda, var olan yaklaşımın eskisine göre avantajı nedir?
Bu tamamen farklı bir hikaye. Eski yaklaşımdan vazgeçmemizin nedenini açıklayan 13 sayfa uzunluğunda bir teknik rapor yazdık.
tl;dr: Eski yaklaşımda yanlış şeyi ölçüyorduk şimdi doğru şeyi ölçüyoruz.
Olası sansür etkinliklerini gösteren bu kırmızı ve mavi noktalar nedir?
Bir kaç gün boyunca kestirilen kullanıcı sayılarına bakarak sonraki günlerdeki kullanıcı sayılarını öngören anormallik tabanlı bir sansür algılama sistemi çalıştırıyoruz. Gerçek sayı daha yüksek ya da daha düşükse, bu durum olası bir sansürlemeyi ya da sansürün kaldırıldığını gösterebilir. Ayrıntılı bilgi almak için taknik raporumuza bakabilirsiniz.