Saya memiliki data rahasia silang dalam tabel 2 x 2 x 6. Mari kita sebut dimensi response
, A
dan B
. Saya memasukkan regresi logistik ke data dengan model response ~ A * B
. Analisis penyimpangan model itu mengatakan bahwa kedua istilah dan interaksinya adalah signifikan.
Namun, melihat proporsi data, sepertinya hanya 2 atau lebih level B
yang bertanggung jawab atas efek signifikan ini. Saya ingin menguji untuk melihat level mana yang menjadi biang keladinya. Saat ini, pendekatan saya adalah melakukan 6 uji chi-squared pada 2 x 2 tabel response ~ A
, dan kemudian menyesuaikan nilai-p dari tes tersebut untuk beberapa perbandingan (menggunakan penyesuaian Holm).
Pertanyaan saya adalah apakah ada pendekatan yang lebih baik untuk masalah ini. Apakah ada pendekatan pemodelan yang lebih berprinsip, atau beberapa pendekatan perbandingan uji chi-squared?
Jawaban:
Anda harus melihat ke "partisi chi-squared". Ini serupa dalam logika untuk melakukan tes post-hoc di ANOVA. Ini akan memungkinkan Anda untuk menentukan apakah keseluruhan tes signifikan Anda terutama disebabkan oleh perbedaan kategori atau kelompok kategori tertentu.
Google cepat menampilkan presentasi ini, yang pada akhirnya membahas metode untuk mempartisiasikan chi-squared.
http://www.ed.uiuc.edu/courses/EdPsy490AT/lectures/2way_chi-ha-online.pdf
sumber
Pendekatan yang tidak berprinsip adalah membuang data yang tidak proporsional, mereparasi model dan melihat apakah rasio odds logit / kondisional untuk respons dan A sangat berbeda (mengendalikan B). Ini bisa memberi tahu Anda jika ada alasan untuk khawatir. Mengumpulkan level B adalah pendekatan lain. Pada garis yang lebih berprinsip, Jika Anda khawatir tentang proporsi relatif yang mendorong paradoks Simpson, maka Anda dapat melihat rasio odds bersyarat dan marjinal untuk respons / A dan melihat apakah mereka membalikkan.
Untuk menghindari beberapa perbandingan pada khususnya, satu-satunya hal yang terjadi pada saya adalah menggunakan model hierarkis yang bertanggung jawab atas efek acak lintas level.
sumber
Saya tidak tahu persis apa tujuan Anda, atau mengapa itu adalah apa tujuan Anda. Tetapi daripada pengujian hipotesis, saya biasanya merekomendasikan untuk memusatkan perhatian pada prediksi dan interval kepercayaan.
sumber
Tes Post Hoc mungkin cocok dengan masalah Anda. chisqPostHoc () berfungsi dalam uji R untuk perbedaan yang signifikan di antara semua pasangan populasi dalam uji chi-square. Meskipun, saya belum menggunakannya tetapi tautan ini mungkin berguna. https://www.rforge.net/doc/packages/NCStats/chisqPostHoc.html
Alternatif lain mungkin fungsi chisq.desc () dari paket EnQuireR.
sumber