Suatu hari saya berkonsultasi dengan ahli epidemiologi. Dia adalah MD dengan gelar kesehatan masyarakat dalam epidemiologi dan memiliki banyak pengetahuan statistik. Dia membimbing rekan penelitian dan penghuninya dan membantu mereka dengan masalah statistik. Dia memahami pengujian hipotesis dengan cukup baik. Dia memiliki masalah khas membandingkan dua kelompok untuk melihat apakah ada perbedaan risiko yang terkait dengan gagal jantung kongestif (CHF). Dia menguji perbedaan rata-rata dalam proporsi mata pelajaran yang mendapatkan CHF. Nilai p adalah 0,08. Kemudian dia juga memutuskan untuk melihat risiko relatif dan mendapat nilai-p 0,027. Jadi dia bertanya mengapa yang satu penting dan yang lainnya tidak. Melihat pada interval kepercayaan dua sisi 95% untuk perbedaan dan untuk rasio dia melihat bahwa interval perbedaan rata-rata berisi 0 tetapi batas kepercayaan atas untuk rasio itu kurang dari 1. Jadi mengapa kita mendapatkan hasil yang tidak konsisten. Jawaban saya sementara secara teknis benar tidak terlalu memuaskan. Saya berkata, "Ini adalah statistik yang berbeda dan dapat memberikan hasil yang berbeda. Nilai-p keduanya sama-sama signifikan secara marginal. Ini dapat dengan mudah terjadi." Saya pikir harus ada cara yang lebih baik untuk menjawab ini dalam istilah awam kepada dokter untuk membantu mereka memahami perbedaan antara pengujian risiko relatif vs risiko absolut. Dalam studi epi masalah ini muncul banyak karena mereka sering melihat kejadian langka di mana tingkat kejadian untuk kedua kelompok sangat kecil dan ukuran sampel tidak terlalu besar. Saya telah memikirkan hal ini sedikit dan memiliki beberapa Ide yang akan saya bagikan. Tetapi pertama-tama saya ingin mendengar bagaimana beberapa dari Anda akan menangani ini. Saya tahu bahwa banyak dari Anda bekerja atau berkonsultasi di bidang medis dan mungkin menghadapi masalah ini. Apa yang akan kamu lakukan?
sumber
Jawaban:
Nah, dari apa yang sudah Anda katakan, saya pikir Anda sudah membahas sebagian besar dari itu tetapi hanya perlu memasukkannya ke dalam bahasanya: Satu adalah perbedaan risiko, satu rasio. Jadi satu tes hipotesis bertanya apakah sementara yang lain bertanya apakah p 2p2−p1=0 p2p1=1 .002/.001=2 .002−.001=.001 .2/.1=2 .2−.1=.1
sumber
Pikiran bahwa dalam kedua tes, Anda menguji hipotesis yang sama sekali berbeda dengan asumsi yang berbeda. Hasilnya tidak sebanding, dan itu adalah kesalahan yang terlalu umum.
Dalam risiko absolut Anda menguji apakah perbedaan (rata-rata) dalam proporsi berbeda secara signifikan dari nol. Hipotesis yang mendasari dalam uji standar untuk ini mengasumsikan bahwa perbedaan dalam proporsi terdistribusi normal. Ini mungkin berlaku untuk proporsi yang kecil, tetapi tidak untuk yang besar. Secara teknis Anda menghitung probabilitas bersyarat berikut:
yang setara dengan menguji kemiringan dalam model logistik berikut:
Alasan mengapa ini membuat perbedaan diberikan dalam jawaban Peter Flom: perbedaan kecil dalam risiko absolut dapat menyebabkan nilai besar untuk peluang. Jadi dalam kasus Anda itu berarti bahwa proporsi orang yang terkena penyakit tidak berbeda secara substansial, tetapi kemungkinan berada dalam satu kelompok secara signifikan lebih besar daripada peluang berada di kelompok lain. Itu sangat masuk akal.
sumber
prop.test
(atauchisq.test
karena ini setara dengan kasus 2x2) danfisher.test
terpisah lebih dari 0,005. Jadi saya ingin tahu tes mana yang dia gunakan ...