Mengikuti dari posting saya sebelumnya, sejauh yang saya bisa mengerti, jika saya memiliki tiga koefisien korelasi, saya harus mengujinya berpasangan untuk melihat apakah ada perbedaan yang signifikan di antara mereka.
Ini berarti bahwa saya harus menggunakan transformasi Nelayan untuk menghitung skor z r dan kemudian nilai p z (untungnya kalkulator yang direkomendasikan dalam posting sebelumnya, untungnya) dan kemudian memastikan apakah nilai p lebih tinggi atau lebih rendah dari nilai alfa saya (0,05) untuk setiap pasangan.
yaitu jika usia 21 hingga 30 tahun adalah Kelompok Umur 1, 31 hingga 40 tahun adalah Kelompok Umur 2, dan 41 hingga 50 tahun adalah Kelompok Umur 2, perbandingan saya tentang korelasi antara kebiasaan belanja dan penurunan berat badan adalah:
- Grup 1 vs. Grup 2
- Grup 1 vs. Grup 3
- Grup 2 vs. Grup 3
Alih-alih melakukan tiga perhitungan terpisah, apakah ada cara untuk melakukan semua perhitungan ini dalam satu langkah?
sumber
Jawaban:
Pertanyaan Anda adalah contoh sempurna dari model regresi dengan prediktor kuantitatif dan kualitatif . Secara khusus, tiga kelompok umur - - adalah variabel kualitatif dan variabel kuantitatif adalah kebiasaan berbelanja dan penurunan berat badan (saya menduga ini karena Anda menghitung korelasi).1,2,&3
Saya harus menekankan bahwa ini adalah cara pemodelan yang jauh lebih baik daripada menghitung korelasi kelompok-bijaksana yang terpisah karena Anda memiliki lebih banyak data untuk dimodelkan, maka estimasi kesalahan Anda (nilai-p, dll) akan lebih dapat diandalkan. Alasan yang lebih teknis adalah tingkat kebebasan yang dihasilkan lebih tinggi dalam statistik uji-t untuk menguji signifikansi koefisien regresi.
Beroperasi dengan aturan bahwa prediktor kualitatif dapat ditangani oleh variabel indikator , hanya dua variabel indikator, , yang diperlukan di sini yang didefinisikan sebagai berikut:c c−1 X1,X2
Ini menyiratkan bahwa grup diwakili oleh X 1 = 0 , X 2 = 0 ; mewakili respons Anda - Kebiasaan belanja sebagai Y dan hilangnya variabel berat badan jelas kuantitatif W . Anda sekarang cocok dengan model linier ini3 X1=0,X2=0 Y W
Pertanyaan yang jelas adalah apakah masalah jika kita mengubah W dan Y (karena saya secara acak memilih kebiasaan berbelanja sebagai variabel respon). Jawabannya adalah ya - perkiraan koefisien regresi akan berubah, tetapi tes untuk "hubungan" antara dikondisikan pada kelompok (di sini uji-t, tetapi sama dengan pengujian korelasi untuk variabel prediktor tunggal) tidak akan perubahan. Secara khusus,
E [ Y ] = ( β 0 + β 2 ) + β 3 W - untuk kelompok kedua , E [ Y ] = ( β 0 + β 1 ) + β 3 W - untuk grup pertama , Ini sama dengan memiliki 3 baris terpisah, tergantung pada grup, jika Anda memplot Y
Bagaimana tes yang Anda minta. Pada dasarnya, setelah Anda cocok dengan model dan memiliki perkiraan, Anda perlu menguji beberapa kontras. Khusus untuk perbandingan Anda:
sumber
Pengujian berpasangan dalam situasi ini tidak (belum) dibenarkan oleh deskripsi data. Anda harus menggunakan metode regresi multi-variabel. Panggilan R mungkin:
Membangun 3 kategori bukanlah metode terbaik untuk mengontrol usia (atau menganalisis kontribusinya jika itu adalah pertanyaan utama) karena kategorisasi dapat mendistorsi hubungan yang berkelanjutan, dan istilah spline menghapus kebutuhan untuk memilih titik-titik yang sewenang-wenang. Setelah ada bukti yang cukup tentang hubungan perubahan berat badan setelah analisis yang tepat, maka akan ada opsi tes ad-hoc yang dapat digunakan.
(Saya memang setuju dengan sebagian besar dari apa yang @whuber ungkapkan dalam komentar, dan saya biasanya menemukan komentarnya otoritatif, tetapi tidak mengerti pendiriannya mengenai pendekatan regresi.)
sumber