Video musik PSY "Gangnam style" sangat populer, setelah lebih dari 2 bulan memiliki sekitar 540 juta pemirsa. Saya belajar ini dari anak-anak praremaja saya saat makan malam minggu lalu dan segera diskusi berjalan ke arah apakah mungkin untuk melakukan semacam prediksi tentang berapa banyak penonton akan ada dalam 10-12 hari dan kapan (/ jika) lagu akan melewati 800 juta pemirsa atau 1 miliar pemirsa.
Ini adalah gambar dari jumlah pemirsa sejak diposting:
Berikut adalah gambar dari sejumlah pemirsa video musik No1 "Justin Biever-Baby" dan No2 "Eminem - Love the you you lie" yang keduanya telah ada sejak lama.
Upaya pertama saya untuk beralasan tentang model ini adalah bahwa itu harus menjadi kurva-S tetapi ini tampaknya tidak sesuai dengan lagu-lagu No1 dan No2 dan juga tidak sesuai bahwa tidak ada batasan berapa banyak penayangan bahwa video musik dapat memiliki, hanya pertumbuhan yang lebih lambat.
Jadi pertanyaan saya adalah: model apa yang harus saya gunakan untuk memprediksi jumlah penonton video musik?
Jawaban:
Aha, pertanyaan bagus !!
Saya juga akan secara naif mengusulkan kurva logisitic berbentuk S, tetapi ini jelas tidak cocok. Sejauh yang saya tahu, peningkatan konstan adalah perkiraan karena YouTube menghitung tampilan unik (satu per alamat IP), jadi tidak mungkin ada lebih banyak tampilan daripada komputer.
Kita bisa menggunakan model epidemiologis di mana orang memiliki kerentanan yang berbeda. Untuk membuatnya sederhana, kita dapat membaginya dalam kelompok berisiko tinggi (katakanlah anak-anak) dan kelompok berisiko rendah (katakanlah orang dewasa). Sebut proporsi anak yang "terinfeksi" dan y ( t ) proporsi orang dewasa "terinfeksi" pada waktu t . Saya akan menyebut X jumlah (tidak diketahui) orang dalam kelompok risiko tinggi dan Y jumlah (juga tidak diketahui) orang dalam kelompok risiko rendah.x ( t ) y( t ) t X Y
˙ y (t)=r2(x(t)+y(t))(Y-y(t)),
Sistem ini dipecahkan menjadi
dan memecahkan ke
Pembaruan: Dari komentar yang saya kumpulkan, Youtube menghitung tampilan (dengan cara rahasianya) dan bukan IP unik, yang membuat perbedaan besar. Kembali ke papan gambar.
Agar sederhana, mari kita asumsikan bahwa pemirsa "terinfeksi" oleh video. Mereka kembali menontonnya secara teratur, sampai mereka membersihkan infeksi. Salah satu model paling sederhana adalah SIR (Susceptible-Infected-Resistant) yang merupakan berikut:
Dalam model ini, jumlah penayangan mulai meningkat secara tiba-tiba beberapa waktu setelah timbulnya infeksi, yang tidak terjadi pada data asli, mungkin karena video juga menyebar dengan cara yang tidak viral (atau meme). Saya bukan ahli dalam mengestimasi parameter model SIR. Hanya bermain dengan nilai yang berbeda, inilah yang saya dapatkan (dalam R).
Modelnya jelas tidak sempurna, dan bisa dilengkapi dengan banyak cara. Sketsa yang sangat kasar ini memprediksi satu miliar tampilan di suatu tempat sekitar Maret 2013, mari kita lihat ...
sumber
Mungkin model yang paling umum untuk meramalkan adopsi produk baru adalah model difusi Bass , yang - mirip dengan jawaban @ gui11aume - memodelkan interaksi antara pengguna saat ini dan yang potensial. Adopsi produk baru adalah topik yang cukup panas dalam peramalan, mencari istilah ini akan menghasilkan banyak info (yang sayangnya saya tidak punya waktu untuk berkembang di sini ...).
sumber
Saya akan melihat kurva pertumbuhan Gompertz .
Kurva Gompertz adalah formula eksponensial ganda 3-parameter (a, b, c) dengan waktu, T, sebagai variabel independen.
Kode R:
Formula pertumbuhan Gompertz dikenal baik dalam menggambarkan banyak fenomena siklus-hidup di mana pada awalnya pertumbuhan dipercepat, kemudian berangsur-angsur berkurang sehingga menghasilkan kurva sigmoid asimetris yang turunannya lebih curam di sebelah kiri daripada di sebelah kanan puncak. Misalnya, jumlah total artikel di Wikipedia yang juga viral, telah mengikuti kurva pertumbuhan Gompertz (dengan parameter a, b, c) selama bertahun-tahun dengan akurasi tinggi.
Sunting: Jika kurva Gompertz tidak cukup untuk memperkirakan bentuk yang Anda cari, Anda mungkin ingin menambahkan parameter
d
& θ seperti yang dijelaskan dalam Distribusi Weibull Gompertz Generalized Exponentaited . Perhatikan bahwa makalah ini menggunakanx
bukant
untuk parameter waktu independen. Menariknya, Wikipedia juga memodifikasi perkiraan terbaik mereka dengan menambahkan parameter ke-4 tunggald
, untuk memperhitungkan perbedaan prediksi dari nilai aktual setelah 2012 . Formula kurva 4-param Gompertz yang dimodifikasi adalah:Fungsi Gompertz dinamai Benjamin Gompertz (1779-1865) , seorang Gauss kontemporer (hanya 2 tahun Gauss 'junior), ahli matematika pertama yang menggambarkannya.
sumber
Saya pikir Anda perlu memisahkan fenomena seperti Gangnam Style, yang berutang banyak pada pandangannya sebagai meme / virus, dari Justin Bieber dan Eminem, yang merupakan seniman besar dengan hak mereka sendiri dan yang juga akan menyebar luas dalam lingkungan tradisional - JB atau Eminem akan menjual banyak single juga, saya tidak yakin PSY akan melakukannya.
sumber
OK teman-teman, kita perlu beberapa fakta tentang penyebaran video youtube, yang ternyata menyarankan pola yang agak berbeda dari literatur difusi produk yang biasa. Tempat yang baik untuk memulai adalah Meeyoung Cha, Haewoon Kwak, Pablo Rodriguez, Yong-Yeol Ahn, dan Sue Moon, 2007, I Tube, You Tube, Everybody Tubes: Menganalisis Sistem Video Konten Terbesar Pengguna yang Dibuat Pengguna di Dunia, Prosiding ACM SIGCOMM ke-7 konferensi tentang pengukuran Internet, ISBN: 978-1-59593-908-1.
dan
X Cheng, C Dale, J Liu, 2008, Statistik dan jejaring sosial video youtube, dalam prosiding Lokakarya Internasional tentang Kualitas Layanan (IWQoS), Enschede, Belanda, Juni.
sumber
Melihat perlambatan dalam pandangan selama seminggu terakhir, tanggal 13 Maret terlihat seperti taruhan yang layak. Mayoritas tampilan baru tampaknya sudah menjadi pengguna yang terinfeksi yang kembali beberapa kali per hari.
Sehubungan dengan melengkapi model Anda, salah satu metode yang peneliti gunakan untuk melacak penyebaran virus adalah memantau mutasi genomnya - kapan dan di mana mutasinya dapat menunjukkan kepada peneliti seberapa cepat virus ditularkan dan menyebar (lihat melacak Virus West Nile di AS) .
Dalam arti praktis, video seperti Gangnam Style dan Party Rock Anthem (oleh grup LMFAO) lebih cenderung 'bermutasi' menjadi parodi, flash mob, tarian pernikahan, remix, dan tanggapan video lainnya daripada kata-kata, Baby Bieber's Baby atau lagu-lagu Eminem.
Para peneliti dapat menganalisis jumlah tanggapan video (dan khususnya parodi) sebagai proxy untuk mutasi. Mengukur frekuensi dan popularitas mutasi ini di awal kehidupan video bisa berguna adalah memodelkan tampilan YouTube seumur hidupnya.
sumber