Kami sedang menguji kampanye pemasaran email. Pada pengujian awal kami, kami mengirimkan dua jenis email yang berbeda dan memiliki kelompok kontrol ketiga yang tidak menerima email. Sekarang kami mendapatkan kembali "hasil" sebagai proporsi pengguna yang kembali ke aplikasi kami. Inilah hasilnya:
Group | received e-mail | returned | %-returned
A | 16,895 | 934 | 5.53%
B | 17,530 | 717 | 4.09%
C | 42408 | 1618 | 3.82%
Sepertinya Grup A mungkin sebenarnya lebih baik daripada B dan C, tetapi apa tes yang tepat untuk menunjukkan ini?
Jawaban:
Dalam tabel seperti ini Anda dapat mempartisi statistik-G yang dihasilkan oleh uji-G, daripada menghitung OR atau dengan menjalankan regresi logistik. Meskipun Anda harus memutuskan bagaimana Anda akan mempartisi itu. Di sini statistik-G, yang mirip dengan Pearson's X ^ 2 dan juga mengikuti distribusi X ^ 2, adalah:
G = 2 * jumlah (OBS * ln (OBS / EXP)).
Anda pertama-tama menghitungnya untuk keseluruhan tabel, dalam hal ini: G = 76,42, pada 2 df, yang sangat signifikan (p <0,0001). Dengan kata lain, tingkat pengembalian tergantung pada kelompok (A, B, atau C).
Kemudian, karena Anda memiliki 2 df, Anda dapat melakukan dua tes G 1 df (2x2) yang lebih kecil. Namun, setelah melakukan yang pertama, Anda harus menutup baris dari dua level yang digunakan dalam tes pertama, dan kemudian menggunakan nilai-nilai itu untuk mengujinya terhadap level ketiga. Di sini, katakanlah Anda menguji B terhadap C terlebih dahulu.
Ini menghasilkan G-stat 2,29 pada 1 df, yang tidak signifikan (p = 0,1300). Kemudian buat tabel baru, gabungkan baris B dan C. Sekarang uji A terhadap B + C.
Ini menghasilkan G-stat 74,13, pada 1 df, yang juga sangat signifikan (p <0,0001).
Anda dapat memeriksa pekerjaan Anda dengan menambahkan dua statistik uji yang lebih kecil, yang seharusnya sama dengan statistik pengujian yang lebih besar. Itu: 2.29 + 74.13 = 76.42
Cerita di sini adalah bahwa grup B dan C Anda tidak berbeda secara signifikan, tetapi grup A itu memiliki tingkat pengembalian yang lebih tinggi daripada gabungan B dan C.
Semoga itu bisa membantu!
Anda juga bisa mempartisi G-stat secara berbeda dengan membandingkan A ke B terlebih dahulu, lalu C ke A + B, atau dengan membandingkan A ke C, lalu B ke A + C. Selain itu, Anda dapat memperluas ini ke 4 grup atau lebih, tetapi setelah setiap tes Anda harus menutup dua baris yang baru saja Anda uji, dengan jumlah maksimum tes yang sama dengan df di tabel asli Anda. Ada cara lain untuk mempartisi dengan tabel yang lebih rumit. Buku Agresti, "Analisis Data Kategorikal", harus berisi perinciannya. Secara khusus, babnya tentang kesimpulan untuk tabel kontingensi dua arah.
sumber
Saya hanya akan menghitung odds (atau risiko) rasio antara kelompok A dan B, antara B dan C, dan antara A dan C dan melihat apakah mereka berbeda secara statistik. Saya tidak melihat alasan untuk melakukan tes proporsi "omnibus" dalam kasus ini karena Anda hanya memiliki tiga grup. Tiga tes chi-square bisa melakukan trik juga.
Seperti beberapa individu telah uraikan dalam komentar di bawah ini, dan regresi logistik dengan kontras yang direncanakan akan bekerja dengan baik juga.
sumber