Rasio standar cookie dengan "pengunjung"?

31

Sebagaimana dicatat dalam posting blog baru - baru ini , Kami melihat perbedaan besar antara "pengunjung" dan "pengunjung" Google Analytics.

Juga, karena alasan yang belum pernah kami ketahui, Google Analytics hanya mendapatkan angka yang lebih besar daripada Quantcast. Saat ini GA menunjukkan lebih banyak pengunjung (15 juta) di stackoverflow.com sendiri daripada yang dilihat Quantcast di seluruh jaringan (14 juta):

Mengapa? Saya tidak tahu Google Analytics kadang-kadang kehilangan cookie, atau Quantcast merindukan pengunjung. Menghitung adalah ilmu yang tidak eksak.

Kami pikir ini karena Quantcast menggunakan rasio cookie terhadap pengunjung yang lebih konservatif . Sedangkan Google Analytics mungkin menganggap setiap cookie sebagai "pengunjung", Quantcast hanya akan menganggap setiap 1,24 cookie sebagai "pengunjung". Ini masuk akal bagi saya, karena orang dapat mengakses situs kami dari banyak komputer, banyak browser, dan sebagainya.

Saya punya dua pertanyaan yang berhubungan erat:

  1. Apakah ada rasio standar cookie yang diterima untuk pengunjung? Ini jelas ilmu yang tidak eksak, tetapi adakah aturan praktis yang muncul?

  2. Apakah ada cara yang lebih akurat untuk menghitung "pengunjung" ke situs web selain mengandalkan cookie browser? Atau apakah ini hanya akan selalu menjadi semacam estimasi upaya terbaik tidak peduli bagaimana Anda mengukurnya?

Jeff Atwood
sumber
Quantcast pasti menggunakan cookie, bukan? Mereka tidak pergi alamat IP atau apa?
DisgruntledGoat
@disgruntledgoat saya baru saja memeriksa situs web: "Quantcast menyediakan data pemirsa untuk jumlah cookie unik dan orang."
Matthew Brookes
@DisgruntledGoat periksa halaman ini juga. Ini memiliki cookie dari quantserve.com.
Yahel

Jawaban:

14

Quantcast mengirimi saya email:

Anda menyebutkan bahwa ada delta yang cukup besar antara nomor GA Anda dan nomor QC Anda. Meskipun ini tidak sering terjadi, itu memang terjadi dan ada beberapa alasan mengapa hal ini dapat terjadi. Misalnya, kami memperhitungkan cookie pihak ketiga dan pembaruan otomatis dan GA tidak. Kami juga meminta penerbit untuk menempatkan tag kami di dekat bagian bawah halaman untuk mematuhi standar MRC dan IAB. Jika tag pengukuran Anda yang lain lebih tinggi pada halaman, mereka dapat menyala ketika Quantcast tidak. (Kami adalah satu-satunya layanan pengukuran lalu lintas terakreditasi MRC). Juga, angkanya tidak akan pernah sama persis karena pertimbangan zona waktu - kami menggunakan fungsi normalisasi dan GA diperbaiki.

Jika Anda ingin mempelajari lebih lanjut tentang bagaimana kami menentukan angka-angka kami, silakan periksa: http://www.quantcast.com/how-we-do-it . Kami juga memiliki laporan resmi tentang data audiens kami yang diperbaiki dan metodologi kami ada di sini.

Dengan meneliti kertas-kertas putih, saya melihat bahwa mereka sebenarnya melakukan apa yang disarankan Jeff: menipu angka "resmi" untuk mendapatkan sesuatu yang menurut mereka lebih dekat dengan jumlah sebenarnya orang. Mereka memiliki White Paper Pemirsa Terkoreksi Cookie (tautan PDF) yang menyiratkan bahwa sistem mereka agak rumit, tidak sesederhana hanya membaginya dengan angka ajaib:

Program Quantcast Quantified Publisher menangkap lebih dari 75 miliar peristiwa konsumsi media setiap bulan, dihasilkan oleh lebih dari 1,4 miliar cookie (data per Juni, 2008). Terlebih lagi, banyak dari mitra Penerbit Terkuantitas kami membagikan pengidentifikasi anonim dengan kami yang tidak bergantung pada cookie. Model kami juga mencakup beberapa panel yang menyediakan titik referensi dan kalibrasi berbasis orang yang bebas dari penghapusan cookie. Kami melakukan triangulasi di seluruh kumpulan data ini dengan berbagai proses pengumpulan, bias dan masalah. Model kami memperhitungkan frekuensi kunjungan akun, periode waktu, kemungkinan penggunaan beberapa komputer dan bahkan dampak dari beberapa orang yang menggunakan komputer yang sama untuk memberikan perkiraan berdasarkan orang. Model kami untuk menerjemahkan cookie unik kepada orang-orang telah divalidasi menggunakan sampel bertahan dan set data independen. Selanjutnya, model kami dinamis dan dikalibrasi ulang secara berkelanjutan untuk mencerminkan sifat pola lalu lintas Internet yang berkembang.

Joel Spolsky
sumber
2
Menarik. Kutipan terakhir lebih informatif (dan persuasif) daripada yang pertama. GA tidak perlu memperhitungkan cookie pihak ketiga, karena menggunakan cookie pihak pertama. Ya, perbedaan zona waktu akan mengubah angka yang tepat, tetapi dalam rentang waktu sebulan, sangat tidak mungkin untuk memperhitungkan perbedaan pengukuran yang signifikan.
Yahel
27

Ada faktor lain yang berperan dalam penghitungan jumlah Quantcast: Mereka menggunakan cookie pihak ketiga (cookie yang disajikan dari .quantserve.comdomain), sedangkan Google Analytics menggunakan cookie pihak pertama ( stackexchange.com, dll.)

Ini sangat penting, karena beberapa browser (terutama Safari, tetapi yang lebih baru Firefox dan Chrome) menonaktifkan cookie pihak ketiga sebagai pengaturan default, dan banyak lainnya secara individual dapat memilih pengaturan privasi yang membatasi cookie pihak ketiga. Ini berarti ada bagian dari populasi yang tidak akan pernah dilacak oleh cookie QuantCast. Secara inheren, itu berarti Google Analytics akan selalu mengembalikan jumlah pengunjung yang lebih tinggi.

Saya akan mengatakan tidak ada aturan praktis. Sebagai seorang praktisi analitik, saya akan mengatakan bahwa pencarian untuk jumlah pengunjung 'benar' tidak ada harapan, dan sebaliknya fokus pada kunjungan itu sendiri. Misalnya, ke akun Google Analytics Anda, saya setidaknya 8 pengunjung berbeda, setelah mengakses StackOverflow dari Chrome, Safari dan Firefox di laptop kantor saya, laptop pribadi saya, ponsel saya, dan iPad saya. Semua layanan Analytics dihitung dengan cara yang berbeda, dan karenanya semuanya menghasilkan angka yang sangat berbeda.

Bahkan dengan penerapan yang sempurna, Google Analytics hampir selalu akan menampilkan jumlah kunjungan yang lebih rendah daripada sistem analisis log berbasis server, tetapi akan menunjukkan jumlah kunjungan yang lebih tinggi daripada sistem berbasis cookie pihak ketiga seperti Quantcast. Yang penting bukanlah melihat total mentah, tetapi tren yang ditunjukkan oleh masing-masing metode dengan kekuatannya. Jadi, jangan pernah membandingkan angka Quantcast dengan angka Google Analytics; sebagai gantinya, gunakan angka-angka dalam konteks di mana mereka dikumpulkan.

Masalah lainnya adalah implementasi Google Analytics Anda tidak benar, karena mengonfigurasinya untuk jenis multi-domain-dan-subdomain Anda bisa menjadi mimpi buruk jika tidak dilakukan dengan benar dan ketat, yang dapat menyebabkan satu browser dihitung sebagai beberapa pengunjung, itu sendiri menggembungkan jumlah Anda. Ini tidak pernah menjadi masalah bagi Quantcast, karena semua cookie ditetapkan pada domain pihak ketiga mereka.

Yahel
sumber
Google Chrome juga tampaknya memblokir cookie pihak ketiga secara default.
MrWhite
7

Rasio cookie terhadap pengunjung unik biasanya antara 1,3 dan 1,7 untuk situs dengan lebih dari satu juta kunjungan.

Meskipun yc01 benar bahwa GA menggunakan cookie pihak pertama vs cookie pihak ketiga, kami di RealSelf.com menggunakan dua penyedia analitik pihak pertama (GA dan Comscore Direct) dan GA masih menunjukkan 30% lebih banyak Pengunjung Unik Absolut daripada Pengunjung Unik Comscore.

Comscore hanya menampilkan pengunjung unik menurut negara, jadi untuk membandingkan GA dengan Comscore kita harus menghitung jumlah pengunjung unik absolut yang berbasis di AS sebagai berikut:

Kunjungan AS / Kunjungan Global * Pengguna Unik Mutlak

(1.150.110 / 1.650.979) * 1.273.059 = 886.842 Pengguna Unik yang berbasis di AS

Sebaliknya, Comscore melaporkan 680.900 Pengguna Unik yang berbasis di AS. Jadi GA menunjukkan 30,2% lebih banyak.

Comscore telah membangun bisnis mereka dengan berusaha menjadi akurat, sementara GA pada dasarnya adalah cara gratis untuk melacak dan mengoptimalkan situs yang menggunakan AdWords dan AdSense. Comscore memiliki panel orang yang juga mereka gunakan untuk memperkirakan lalu lintas, dan mereka menggunakan panel itu untuk menentukan jumlah rata-rata cookie per orang. Dengan semakin banyak orang yang menggunakan perangkat seluler (penggunaan seluler kami adalah 15%), masuk akal bahwa cookie unik melebih-lebihkan jumlah orang unik.

Eric K.
sumber
"Rasio cookie terhadap pengunjung unik biasanya antara 1,3 dan 1,7 untuk situs dengan lebih dari satu juta kunjungan." Apakah itu figur yang diterbitkan Comscore?
Ciaran
ini secara mengejutkan akurat untuk kita; Saya menjalankan UserSessionstatistik tabel di beberapa situs dan mereka berkisar dari 2,0 (Stack Overflow) hingga 1,46 (webapps.se) dengan semua yang lain di antaranya. 1.6 sepertinya standar yang sangat waras untuk situs yang berorientasi teknologi.
Jeff Atwood
4

Inilah studi terbaru (4 Mei 2011 - kemarin ketika saya menulis ini) dari MediaMind dengan "Pengganda Inflasi Cookie" untuk pasar yang berbeda:

Faktor inflasi mereka yang dihitung adalah antara 2,2 untuk Jerman sampai 3,0 untuk AS.

Theo
sumber
ini luar biasa - persis seperti referensi yang saya cari
Jeff Atwood
2

Mungkin jumlah pengunjung GA Anda lebih meningkat dari situs normal karena sifat audiensnya yang lebih teknis? Misalnya, programmer, pengembang web khususnya, lebih cenderung menggunakan berbagai browser dan dengan demikian meningkatkan jumlah cookie.

Untuk pertanyaan 1, saya rasa itu, seperti halnya banyak metrik, lebih baik menggunakan data dari situs Anda sendiri daripada mencari standar global karena agregat bisa menyesatkan. Salah satu cara untuk mendapatkan cookie ke jumlah pengunjung sebenarnya mungkin dengan menghitung berapa banyak cookie yang Anda lihat dari setiap pengguna terdaftar kemudian mendapatkan nomor dari itu.

Adapun nomor 2, secara teoritis cara terbaik untuk menghitung pengunjung nyata adalah dengan memaksa semua orang untuk mendaftarkan akun. Karena itu jelas bukan ide yang baik maka Anda bisa melihat normalisasi. Misalnya, Anda dapat menggunakan cookie rata-rata untuk metrik pengguna terdaftar yang saya sarankan di atas dan menerapkannya pada nomor pengunjung yang dilaporkan GA.

Ewan Heming
sumber
ini adalah titik yang bagus. Di Stack Overflow, saat ini kami memiliki 531.484 sesi yang 261.547 poinnya ditujukan untuk pengguna unik - jadi pada dasarnya 2 cookie per setiap 1 pengguna.
Jeff Atwood
-1

Saya pikir IP dapat dipercaya ... ketika saya membuat sistem statistik seperti GA dengan python saya menggunakan beberapa metode seperti ini

  • kirim cookie ke browser dan ambil semua data agen ke basis data
  • cara mudah jika kunjungan baru memiliki cookie itu bukan kunjungan baru jadi saya menyimpannya bukan kunjungan baru (juga saya telah menetapkan tanggal dan waktu tunda untuk menemukan kunjungan baru jika pengguna mengulangi situs kunjungan setelah 2 jam)
  • simpan IP pengguna dan beberapa id untuk pengguna ini dan IP dan cookie (ini juga menyimpan cookie)
  • pengguna baru datang dan tidak memiliki cookie ... apakah IP ini baru? iya nih? OK pengguna barunya hanya ambil agen pengguna dan IP / tidak? berapa kali pengguna ini datang? lebih dari batas? bukan kunjungan yang benar-benar baru, tidak lebih dengan agen pengguna ini? OK ini baru ...: D

metode ini memiliki kesalahan tetapi tidak buruk dan mendekati data yang valid ... (ini juga tergantung pada waktu tunda untuk menemukan pengguna baru (penundaan antara 2 kunjungan) dan coba waktu untuk pengguna yang belum menggunakan cookie)

Mohammad Efazati
sumber
5
Bagaimana ini menangani misalnya perusahaan dengan banyak pengembang yang berbeda mengakses StackOverflow dari belakang NAT? Apakah mereka semua akan dihitung sebagai satu pengunjung?
Svish
3
Aspek IP ini benar-benar cacat. Alamat IP bukan pengidentifikasi unik.
Yahel
ada waktu coba untuk ini ... kami memeriksa agen dan hal-hal lain dan kami dapat menambahkan satu ip lebih dari 100 kali ... cara yang disarankan untuk menemukan pengguna nyata di belakang NAT
Mohammad Efazati