Masalah Dunia Nyata
Salah satu klien saya sedang bersiap untuk mengirim mailer langsung ke daftar pengguna berlangganan mereka, dan tantangan statistik ini muncul.
Tim pemasaran mereka memiliki 3 brosur berbeda, dan ingin tahu brosur mana yang mendapat tingkat respons tertinggi. Mereka juga ingin tahu apakah mengirim mailer dengan alamat tulisan tangan, pada amplop tebal, meningkatkan hasil dibandingkan dengan amplop normal.
Mari kita asumsikan sebagai berikut:
- Untuk setiap brosur ( ), seseorang yang menerima brosur yang benar-benar membukanya dan membacanya akan merespons dengan probabilitas , di mana adalah tingkat respons sebenarnya untuk brosur itu
- Amplop tebal, berkualitas tinggi memiliki laju terbuka sebenarnya dari sementara amplop normal memiliki laju terbuka sebesar
- Dari surat sebelumnya, kami berharap tingkat respons yang diamati aktual akan antara sekitar 1% dan 5%.
Tujuan kita
Kami ingin menemukan brosur terbaik saat mengirim surat paling sedikit. Kami juga ingin memperkirakan dua tarif terbuka.
Setelah mengumpulkan tingkat respons empiris dari pengirim surat yang sebenarnya, jika perbedaan sebenarnya antara tingkat respons lebih besar dari setengah persen, kita harus dapat mendeteksi perbedaan itu secara statistik signifikan dengan
Pikiranku sejauh ini
Kami menetapkan pengguna secara acak untuk masing-masing dari 3 brosur, sehingga pengguna menerima setiap brosur. Kami ingin tahu apa yang kami butuhkan untuk mencapai sensitivitas yang kami inginkan dalam mendeteksi perbedaan dalam tingkat respons. Dengan asumsi kasus terburuk, kita harus dapat mendeteksi perbedaan antara tingkat sebenarnya 1% dan 1,5%. SD untuk perbedaan ini adalah . Menetapkan dua kali jumlah itu (2 standar deviasi memberi kita kepercayaan 95%) sama dengan 0,005 (setengah persen yang kita inginkan) mengarah ke solusi .
Pertanyaan
- Apakah ini desain yang optimal atau dapatkah kita berbuat lebih baik?
- Apakah perhitungan benar?
Akhirnya, apa cara terbaik untuk memperkirakan dan , atau hanya perbedaan antara keduanya?
Gagasan saya adalah menetapkan secara acak setengah dari masing-masing kelompok brosur untuk setiap jenis amplop. Dalam setiap kelompok brosur, tingkat respons yang diamati adalah produk dari tarif terbuka dan . Ini akan mempersulit perhitungan atas, karena sebenarnya saya seharusnya menggunakan produk ini dalam perhitungan saya.
Jawaban saya kemudian akan tergantung pada perkiraan tingkat buka rata-rata - - yang harus saya tebak. Juga, saya tidak yakin bagaimana menentukan distribusi perbedaan antara dan , karena kami sekarang memiliki tiga perkiraan perbedaan yang berbeda, yang masing-masing tergantung pada berbeda , masing-masing memiliki hanya perkiraan empiris, taksiran empiris yang bergantung pada perkiraan kami pada kurs terbuka rata-rata.
Terima kasih banyak atas bantuannya.
Jawaban:
Ada rumus empiris untuk menentukan ukuran sampel. Tes yang mendasarinya adalah uji t dua sampel untuk kesetaraan metrik (tingkat respons dalam kasus Anda). Dengan asumsi bahwa Anda ingin kekuatan tes menjadi 80%, salah satu rumus tersebut adalah mana adalah std dev dari metrik (tingkat respons) dan adalah jumlahnya perubahan dalam tingkat respons yang ingin Anda selesaikan dengan andal (dengan signifikansi statistik).n=16σ2/Δ2 σ Δ
Juga, ada desain faktorial fraksional yang tersedia yang memungkinkan Anda mengoptimalkan jumlah percobaan (dengan asumsi Anda tidak ingin mengukur interaksi masing-masing faktor dengan setiap faktor lainnya). Ini adalah makalah survei tentang desain eksperimental yang menjelaskan detail.
sumber
Misalkan Anda mengirim brosur dan untuk jumlah yang sama pelanggan , maka respon pengguna untuk brosur , dan pengguna merespon brosur , dan . Maka signifikansinya adalahA B a A b B b>a
Tidak masalah berapa banyak pengguna menerima brosur Anda, hanya berapa banyak yang merespons.
sumber