Saya memiliki dua variabel kategori / nominal. Masing-masing hanya dapat mengambil dua nilai berbeda (jadi, saya memiliki total 4 kombinasi).
Setiap kombinasi nilai dilengkapi dengan satu set nilai numerik. Jadi, saya punya 4 set angka. Untuk membuatnya lebih konkret, mari kita katakan bahwa saya memiliki male / female
dan young / old
sebagai variabel nominal dan saya memiliki weight
sebagai "output" numerik dependen.
Saya tahu bahwa transisi dari male
ke female
tidak mengubah bobot rata-rata dan perubahan ini signifikan secara statistik. Jadi, saya bisa menghitung gender
faktor. Hal yang sama berlaku untuk age
variabel. Saya tahu bahwa transisi dari young
ke old
tidak mengubah berat rata-rata dan saya dapat menghitung age
faktor yang sesuai .
Sekarang, apa yang benar-benar ingin saya lihat jika data membuktikan bahwa transisi dari perempuan muda ke laki-laki lebih dari kombinasi faktor gender dan usia. Dengan kata lain, saya ingin tahu apakah data membuktikan bahwa ada "efek 2D" atau, dengan kata lain, bahwa efek usia dan gender tidak independen. Sebagai contoh, mungkin bahwa menjadi tua bagi pria meningkatkan berat dengan faktor 1.3 dan untuk wanita faktor yang sesuai adalah 1.1.
Tentu saja saya dapat menghitung dua faktor yang disebutkan (faktor usia untuk pria dan faktor usia untuk wanita) dan mereka berbeda. Tetapi saya ingin menghitung signifikansi statistik dari perbedaan ini. Seberapa nyata perbedaan ini?
Saya ingin melakukan tes non-parametrik, jika memungkinkan. Apakah mungkin untuk melakukan apa yang ingin saya lakukan dengan mencampur empat set, mengocoknya, membelah kembali dan menghitung sesuatu.
Jawaban:
Ada tes nonparametrik untuk interaksi. Secara kasar, Anda mengganti bobot yang diamati dengan peringkat mereka dan memperlakukan data yang dihasilkan ditetapkan sebagai ANOVA heteroskedastik. Lihat misalnya di "Metode nonparametrik dalam desain faktorial" oleh Brunner dan Puri (2001).
Namun, jenis interaksi nonparametrik yang Anda minati tidak dapat ditampilkan dalam generalitas ini. Kamu berkata:
Yang terakhir tidak mungkin. Interaksi nonparametrik harus melibatkan perubahan tanda, yaitu bertambah tua meningkatkan berat badan laki-laki tetapi mengurangi berat perempuan. Perubahan tanda seperti itu tetap ada bahkan jika Anda mengubah bobot secara monoton. Tetapi Anda dapat memilih transformasi monoton pada data yang memetakan kenaikan berat dengan faktor 1.1 sedekat yang Anda inginkan ke 1.3. Tentu saja, Anda tidak akan pernah menunjukkan perbedaan untuk menjadi signifikan jika bisa sedekat yang Anda inginkan.
Jika Anda benar-benar tertarik pada interaksi tanpa perubahan tanda, Anda harus tetap berpegang pada analisis parametrik biasa. Di sana, transformasi monoton yang "menelan perbedaan" tidak diperbolehkan. Tentu saja, ini lagi sesuatu yang perlu diingat dengan memodelkan dan menafsirkan statistik Anda.
sumber
Jika Anda yakin bahwa efek dari usia dan jenis kelamin yang lebih dari sekedar efek individu, Anda dapat mempertimbangkan model The γweighti=α⋅agei+β⋅genderi+γ⋅(genderi⋅agei). γ Koefisien menangkap ukuran efek "2D" usia dan jenis kelamin. Anda dapat memeriksa t-statistik untuk mendapatkan gambaran kasar tentang apakah γ yang Anda amati dalam model Anda secara signifikan berbeda dari γ = 0 .γ γ γ=0
Berikut adalah contoh grafis yang sangat kasar untuk menunjukkan apa ini tambahan perkalian jangka tidak.genderi⋅agei
Dalam model , kami pada dasarnya mencoba untuk menyesuaikan hyperplane sederhana dengan dataresponse=x1+x2
Model ini linear dalam kovariat, maka bentuk linear yang Anda lihat dalam plot di atas.
sumber
Contoh-contoh di atas dengan demikian merupakan cara yang terlalu rumit untuk sampai pada kesimpulan ini (bahwa kita benar-benar hanya membandingkan empat cara kelompok), tetapi untuk belajar tentang bagaimana interaksi bekerja, saya pikir ini adalah latihan yang bermanfaat. Ada posting lain yang sangat bagus di CV tentang interaksi variabel kontinu dengan variabel nominal, atau interaksi dua variabel kontinu. Meskipun pertanyaan Anda telah diedit untuk menentukan tes non-parametrik, saya pikir akan membantu untuk memikirkan masalah Anda dari pendekatan yang lebih konvensional (yaitu, parametrik), karena sebagian besar pendekatan non-parametrik untuk pengujian hipotesis memiliki logika yang sama tetapi umumnya dengan lebih sedikit asumsi tentang distribusi tertentu.
Mengesampingkan interaksi "signifikan"
Contoh yang berhasil
Mari kita bandingkan hasil dari model interaksi dengan hasil dari uji Dunn. Pertama, mari kita hasilkan beberapa data di mana (a) pria berbobot lebih dari wanita, (b) pria yang lebih muda beratnya lebih rendah daripada pria yang lebih tua, dan (c) tidak ada perbedaan antara wanita yang lebih muda dan lebih tua.
Perlu menghitung kesalahan standar atau interval kepercayaan untuk efek marginal Anda? Paket 'efek' yang dirujuk di atas dapat melakukan ini untuk Anda, tetapi lebih baik lagi, Aiken dan Barat (1991) memberi Anda formula, bahkan untuk model interaksi yang jauh lebih rumit. Meja mereka dicetak dengan nyaman di sini , bersama dengan komentar yang sangat bagus dari Matt Golder.
Sekarang untuk mengimplementasikan tes Dunn.
Nilai p pada hasil uji chi-squared Kruskal-Wallis menunjukkan bahwa setidaknya satu dari kelompok kami 'berasal dari populasi yang berbeda.' Untuk perbandingan kelompok per kelompok, angka atas adalah statistik uji-Dunn, dan angka bawah adalah nilai-p, yang telah disesuaikan untuk beberapa perbandingan. Karena data contoh kami agak palsu, tidak mengherankan bahwa kami memiliki begitu banyak nilai p. Tetapi perhatikan perbandingan kanan bawah antara wanita yang lebih muda dan lebih tua. Tes dengan benar mendukung hipotesis nol bahwa tidak ada perbedaan antara kedua kelompok ini.
UPDATE: Diberikan jawaban lain, jawaban ini telah diperbarui untuk membantah gagasan bahwa ini memerlukan segala bentuk pemodelan non-linear, atau yang - diberikan contoh khusus OP dari dua kovariat biner, yaitu, empat kelompok - bahwa harus ada menandatangani perubahan untuk menilai ini secara non-parametrik. Jika usia terus menerus, misalnya, akan ada cara lain untuk mendekati masalah ini, tetapi itu bukan contoh yang diberikan oleh OP.
sumber
Jadi, Anda memiliki variabel acak ini:
Dan Anda memiliki fungsi massa / kepadatan probabilitas ini:
Namun, Anda tidak tahu PDF gabungan yang benar di atas. Karena Anda ingin membatasi diri pada metode non-parametrik, tugas Anda sekarang adalah menemukan estimasi non-parametrik ini:
Dan kemudian tunjukkan bahwa:
sumber
Itu akan memeriksa efek interaksi . Linear Modeling akan dapat memeriksa hal seperti itu tetapi tidak non-parametrik jadi saya kira alat lain harus digunakan.
Bagaimana Anda memeriksa
age
dangender
berlaku hingga sekarang?EDIT: Jawaban ini sepertinya membantu Anda
sumber