Mohon maaf, pemotongan istilah statistik saya :) Saya telah menemukan beberapa pertanyaan di sini yang terkait dengan iklan dan tarif klik. Tetapi tidak satu pun dari mereka yang sangat membantu saya dengan pemahaman saya tentang situasi hierarkis saya.
Ada pertanyaan terkait Apakah representasi setara model Bayesian hierarkis yang sama? , tapi saya tidak yakin apakah mereka benar-benar memiliki masalah yang sama. Pertanyaan lain Priors untuk model binomial Bayesian hierarkis merinci tentang hyperpriors, tapi saya tidak dapat memetakan solusi mereka untuk masalah saya
Saya memiliki beberapa iklan online untuk produk baru. Saya membiarkan iklan berjalan selama beberapa hari. Pada saat itu cukup banyak orang telah mengklik iklan untuk melihat mana yang mendapat klik terbanyak. Setelah mengeluarkan semua kecuali yang memiliki klik terbanyak, saya membiarkannya berjalan selama beberapa hari untuk melihat berapa banyak orang yang benar-benar membeli setelah mengklik iklan. Pada titik itu saya tahu apakah itu ide yang baik untuk menjalankan iklan di tempat pertama.
Statistik saya sangat bising karena saya tidak punya banyak data karena saya hanya menjual beberapa barang setiap hari. Karenanya sangat sulit untuk memperkirakan berapa banyak orang yang membeli sesuatu setelah melihat iklan. Hanya sekitar satu dari setiap 150 klik yang menghasilkan pembelian.
Secara umum, saya perlu tahu apakah saya kehilangan uang untuk setiap iklan sesegera mungkin dengan merapikan statistik per-grup iklan dengan statistik global atas semua iklan.
- Jika saya menunggu sampai setiap iklan telah melihat pembelian yang cukup, saya akan bangkrut karena terlalu lama: menguji 10 iklan saya perlu menghabiskan 10 kali lebih banyak uang sehingga statistik untuk setiap iklan menjadi cukup andal. Pada saat itu saya mungkin kehilangan uang.
- Jika saya membeli rata-rata semua iklan, saya tidak akan dapat menendang iklan yang tidak berfungsi dengan baik.
Bisakah saya menggunakan tingkat pembelian global ( sub-distribusi N $? Itu berarti bahwa semakin banyak data yang saya miliki untuk setiap iklan, semakin independen statistik untuk iklan itu. Jika belum ada yang mengklik iklan, saya berasumsi bahwa rata-rata global sesuai.
Distribusi mana yang akan saya pilih untuk itu?
Jika saya memiliki 20 klik pada A dan 4 klik pada B, bagaimana saya bisa memodelkan itu? Sejauh ini saya telah menemukan bahwa distribusi binomial atau Poisson mungkin masuk akal di sini:
purchase_rate ~ poisson
(?)(purchase_rate | group A) ~ poisson
(perkirakan tingkat pembelian hanya untuk grup A?)
Tapi apa yang saya lakukan selanjutnya untuk benar - benar menghitung purchase_rate | group A
. Bagaimana cara menyambungkan dua distribusi bersama agar masuk akal untuk grup A (atau grup lain).
Apakah saya harus mencocokkan model terlebih dahulu? Saya memiliki data yang dapat saya gunakan untuk "melatih" model:
- Iklan A: 352 klik, 5 pembelian
- Iklan B: 15 klik, 0 pembelian
- Iklan C: 3519 klik, 130 pembelian
Saya mencari cara untuk memperkirakan kemungkinan salah satu dari kelompok. Jika sebuah grup hanya memiliki beberapa titik data, pada dasarnya saya ingin kembali ke rata-rata global. Saya tahu sedikit tentang statistik Bayesian dan telah membaca banyak PDF dari orang yang menjelaskan bagaimana mereka memodelkan menggunakan inferensi Bayesian dan konjugasi prior dan sebagainya. Saya pikir ada cara untuk melakukan ini dengan benar, tetapi saya tidak tahu bagaimana memodelkannya dengan benar.
Saya akan sangat senang dengan petunjuk yang membantu saya merumuskan masalah saya dengan cara Bayesian. Itu akan banyak membantu dengan menemukan contoh online yang dapat saya gunakan untuk benar-benar menerapkan ini.
Memperbarui:
Terima kasih banyak atas tanggapannya. Saya mulai mengerti sedikit dan lebih banyak tentang masalah saya. Terima kasih! Izinkan saya mengajukan beberapa pertanyaan untuk melihat apakah saya memahami masalahnya sedikit lebih baik sekarang:
Jadi saya menganggap konversi didistribusikan sebagai Beta-distribusi, dan distribusi Beta memiliki dua parameter, dan .b
The parameter yang hyperparameters, sehingga mereka parameter untuk sebelum? Jadi pada akhirnya saya menetapkan jumlah konversi dan jumlah klik sebagai parameter distribusi Beta saya? 1
Pada suatu saat ketika saya ingin membandingkan iklan yang berbeda, jadi saya akan menghitung . Bagaimana cara saya menghitung setiap bagian dari formula itu?
Saya pikir disebut likelihood, atau "mode" dari distribusi Beta. Jadi itulah , dengan dan menjadi parameter distribusi saya. Tetapi spesifik dan sini adalah parameter untuk distribusi hanya untuk iklan , kan? Jika demikian, apakah hanya jumlah klik dan konversi yang dilihat iklan ini? Atau berapa banyak klik / konversi semua iklan telah melihat?α - 1 αβαβX
Lalu saya gandakan dengan prior, yaitu P (konversi), yang dalam kasus saya hanya Jeffrey sebelumnya, yang tidak informatif. Apakah sebelumnya tetap sama dengan saya mendapatkan lebih banyak data?
Saya membagi dengan , yang merupakan kemungkinan marjinal, jadi saya menghitung seberapa sering iklan ini diklik?
Dalam menggunakan Jeffreys sebelumnya, saya berasumsi bahwa saya mulai dari nol dan tidak tahu apa-apa tentang data saya. Sebelumnya itu disebut "non-informatif". Ketika saya terus belajar tentang data saya, apakah saya memperbarui sebelumnya?
Ketika klik dan konversi masuk, saya telah membaca bahwa saya harus "memperbarui" distribusi saya. Apakah ini berarti, bahwa parameter distribusi saya berubah, atau bahwa perubahan sebelumnya? Ketika saya mendapatkan klik untuk iklan X, apakah saya memperbarui lebih dari satu distribusi? Lebih dari satu sebelumnya?
sumber
Sebagai jawaban untuk suntingan Anda:
Pembaruan Bayesian adalah
Sebelumnya The Jeffrey tidak sama dengan yang sebelumnya tidak informatif, tapi saya percaya itu lebih baik kecuali Anda memiliki alasan yang baik untuk menggunakannya. Jangan ragu untuk mengajukan pertanyaan lain jika Anda ingin memulai diskusi tentang itu.
sumber