Pengujian signifikansi dari tiga atau lebih korelasi menggunakan transformasi Fisher

9

Mengikuti dari posting saya sebelumnya, sejauh yang saya bisa mengerti, jika saya memiliki tiga koefisien korelasi, saya harus mengujinya berpasangan untuk melihat apakah ada perbedaan yang signifikan di antara mereka.

Ini berarti bahwa saya harus menggunakan transformasi Nelayan untuk menghitung skor z r dan kemudian nilai p z (untungnya kalkulator yang direkomendasikan dalam posting sebelumnya, untungnya) dan kemudian memastikan apakah nilai p lebih tinggi atau lebih rendah dari nilai alfa saya (0,05) untuk setiap pasangan.

yaitu jika usia 21 hingga 30 tahun adalah Kelompok Umur 1, 31 hingga 40 tahun adalah Kelompok Umur 2, dan 41 hingga 50 tahun adalah Kelompok Umur 2, perbandingan saya tentang korelasi antara kebiasaan belanja dan penurunan berat badan adalah:

  • Grup 1 vs. Grup 2
  • Grup 1 vs. Grup 3
  • Grup 2 vs. Grup 3

Alih-alih melakukan tiga perhitungan terpisah, apakah ada cara untuk melakukan semua perhitungan ini dalam satu langkah?

Adhesh Josh
sumber
1
Bisakah Anda sedikit lebih detail? Seperti di - apa tanggapan Anda, variabel penjelas Anda, dan korelasi apa yang Anda minati? Anda mungkin tidak mentransformasikan Fisher untuk menguji korelasi, t-test sederhana mungkin cukup.
suncoolsu
@suncoolsu Saya menguji korelasi antara kebiasaan belanja dan kenaikan berat badan untuk ketiga kelompok ini. Hasil saya adalah sebagai berikut: Grup 1: r = .8978, n = 105; Grup 2: r = .5678, n = 95; dan Kelompok 3: r = .7865, n = 120.
Adhesh Josh
Saya pikir data Anda melewati IOTT. Itu adalah tes trauma interokular - itu menyentuh Anda di antara mata. Jika korelasi 0,9, .6 dan .8 tidak berbeda satu sama lain, apa? Tetapi jika Anda benar-benar tertarik
Peter Flom

Jawaban:

4

Pertanyaan Anda adalah contoh sempurna dari model regresi dengan prediktor kuantitatif dan kualitatif . Secara khusus, tiga kelompok umur - - adalah variabel kualitatif dan variabel kuantitatif adalah kebiasaan berbelanja dan penurunan berat badan (saya menduga ini karena Anda menghitung korelasi).1,2,&3

Saya harus menekankan bahwa ini adalah cara pemodelan yang jauh lebih baik daripada menghitung korelasi kelompok-bijaksana yang terpisah karena Anda memiliki lebih banyak data untuk dimodelkan, maka estimasi kesalahan Anda (nilai-p, dll) akan lebih dapat diandalkan. Alasan yang lebih teknis adalah tingkat kebebasan yang dihasilkan lebih tinggi dalam statistik uji-t untuk menguji signifikansi koefisien regresi.

Beroperasi dengan aturan bahwa prediktor kualitatif dapat ditangani oleh variabel indikator , hanya dua variabel indikator, , yang diperlukan di sini yang didefinisikan sebagai berikut:cc1X1,X2

X1=1 if person belongs to group 1;0 otherwise.
X2=1 if person belongs to group 2;0 otherwise.

Ini menyiratkan bahwa grup diwakili oleh X 1 = 0 , X 2 = 0 ; mewakili respons Anda - Kebiasaan belanja sebagai Y dan hilangnya variabel berat badan jelas kuantitatif W . Anda sekarang cocok dengan model linier ini3X1=0,X2=0YW

Pertanyaan yang jelas adalah apakah masalah jika kita mengubah W dan Y (karena saya secara acak memilih kebiasaan berbelanja sebagai variabel respon). Jawabannya adalah ya - perkiraan koefisien regresi akan berubah, tetapi tes untuk "hubungan" antara dikondisikan pada kelompok (di sini uji-t, tetapi sama dengan pengujian korelasi untuk variabel prediktor tunggal) tidak akan perubahan. Secara khusus,

E[Y]=β0+β1X1+β2X2+β3W.
WY

E [ Y ] = ( β 0 + β 2 ) + β 3 W  - untuk kelompok kedua , E [ Y ] = ( β 0 + β 1 ) + β 3 W  - untuk grup pertama , Ini sama dengan memiliki 3 baris terpisah, tergantung pada grup, jika Anda memplot Y

E[Y]=β0+β3W -- for third group,
E[Y]=(β0+β2)+β3W -- for second group,
E[Y]=(β0+β1)+β3W -- for first group,
Yvs . Ini adalah cara yang baik untuk memvisualisasikan apa yang Anda uji masuk akal (pada dasarnya bentuk EDA dan pengecekan model, tetapi Anda perlu membedakan antara pengamatan yang dikelompokkan dengan benar). Tiga garis paralel menunjukkan tidak ada interaksi antara tiga kelompok dan W , dan banyak interaksi menyiratkan garis-garis ini akan saling berpotongan.WW

Bagaimana tes yang Anda minta. Pada dasarnya, setelah Anda cocok dengan model dan memiliki perkiraan, Anda perlu menguji beberapa kontras. Khusus untuk perbandingan Anda:

Group 2 vs Group 3: β2+β0β0=0,
Group 1 vs Group 3: β1+β0β0=0,
Group 2 vs Group 1: β2+β0(β0+β1)=0.
suncoolsu
sumber
Pengujian untuk kesetaraan lereng berbeda dari pengujian untuk kesetaraan korelasi. Lihat, misalnya: jessicagrahn.com/uploads/6/0/8/5/6085172/comparecorrcoeff.doc
Wolfgang
t=ρn21ρ2tn2
Juga, dokumen Anda berbicara tentang membandingkan populasi yang berbeda, yang bukan merupakan kasus satu prediktor.
suncoolsu
H0:β1=β2=β3H0:ρ1=ρ2=ρ3β
Ya Anda benar (seperti yang saya katakan sebelumnya), tetapi tanggapan saya berasumsi bahwa OP tertarik untuk menentukan hubungan antara berat dan kebiasaan berbelanja berdasarkan kelompok (tidak harus berkorelasi). Saya kira saya salah karena OP menerima jawaban yang lain. Meskipun demikian, jawaban ini berfungsi sebagai alternatif yang berguna (saya harap).
suncoolsu
1

Pengujian berpasangan dalam situasi ini tidak (belum) dibenarkan oleh deskripsi data. Anda harus menggunakan metode regresi multi-variabel. Panggilan R mungkin:

lm( weight_end ~ shop_habit + age_grp + weight_begin)

Membangun 3 kategori bukanlah metode terbaik untuk mengontrol usia (atau menganalisis kontribusinya jika itu adalah pertanyaan utama) karena kategorisasi dapat mendistorsi hubungan yang berkelanjutan, dan istilah spline menghapus kebutuhan untuk memilih titik-titik yang sewenang-wenang. Setelah ada bukti yang cukup tentang hubungan perubahan berat badan setelah analisis yang tepat, maka akan ada opsi tes ad-hoc yang dapat digunakan.

(Saya memang setuju dengan sebagian besar dari apa yang @whuber ungkapkan dalam komentar, dan saya biasanya menemukan komentarnya otoritatif, tetapi tidak mengerti pendiriannya mengenai pendekatan regresi.)

DWIN
sumber