Penafian: jika Anda menemukan pertanyaan ini terlalu mirip dengan yang lain, saya senang bisa digabung. Namun, saya tidak menemukan jawaban yang memuaskan di tempat lain (dan belum memiliki "reputasi" untuk berkomentar atau mendukung), jadi saya pikir akan lebih baik untuk mengajukan pertanyaan baru sendiri.
Pertanyaan saya adalah ini. Untuk masing-masing dari 12 subjek manusia, saya telah menghitung koefisien korelasi (Spearman rho) antara 6 level variabel independen X, dan pengamatan yang sesuai dari variabel dependen Y. (Catatan: level X tidak sama di seluruh subjek.) My hipotesis nol adalah bahwa dalam populasi umum, korelasi ini sama dengan nol. Saya telah menguji hipotesis ini dengan dua cara:
Menggunakan uji-satu sampel pada koefisien korelasi yang diperoleh dari 12 subjek saya.
Dengan memusatkan tingkat X saya dan pengamatan Y sedemikian rupa sehingga untuk setiap peserta, rata-rata (X) = 0 dan rata-rata (Y) = 0, dan kemudian menghitung korelasi atas data agregat (72 tingkat X dan 72 pengamatan Y) .
Sekarang, dari membaca tentang bekerja dengan koefisien korelasi (di sini dan di tempat lain) saya sudah mulai ragu apakah pendekatan pertama itu valid. Khususnya, saya telah melihat persamaan berikut muncul di beberapa tempat, disajikan (tampaknya) sebagai uji-t untuk koefisien korelasi rata-rata:
di mana akan menjadi koefisien korelasi rata-rata (dan mari kita asumsikan kita sudah diperoleh ini menggunakan transformasi Fisher pada koefisien per-subjek pertama) dan jumlah observasi. Secara intuitif, ini tampak salah bagi saya karena tidak termasuk ukuran variabilitas antar subjek. Dengan kata lain, jika saya memiliki 3 koefisien korelasi, saya akan mendapatkan statistik t yang sama apakah mereka [0,1, 0,5, 0,9] atau [0,45 0,5 0,55] atau rentang nilai apa pun dengan rata-rata yang sama (dan )n n = 3
Saya menduga, oleh karena itu, bahwa persamaan di atas sebenarnya tidak berlaku ketika menguji signifikansi rata-rata koefisien korelasi, tetapi ketika menguji signifikansi koefisien korelasi tunggal berdasarkan pada pengamatan 2 variabel.
Adakah yang bisa mengonfirmasi intuisi ini atau menjelaskan mengapa ini salah? Juga, jika formula ini tidak berlaku untuk kasus saya, apakah ada yang tahu / pendekatan yang benar? Atau mungkin tes saya sendiri nomor 2 sudah valid? Setiap bantuan sangat dihargai (termasuk petunjuk untuk jawaban sebelumnya yang mungkin saya lewatkan atau salah tafsirkan).
sumber
Jawaban:
Pendekatan yang lebih baik untuk menganalisis data ini adalah dengan menggunakan model campuran (alias model efek campuran, model hierarkis) dengan
subject
sebagai efek acak (mencegat acak atau mencegat acak + kemiringan). Untuk meringkas jawaban saya yang berbeda :Ini pada dasarnya adalah regresi yang memodelkan hubungan tunggal secara keseluruhan sementara memungkinkan hubungan itu berbeda antara kelompok (subyek manusia). Pendekatan ini mendapat manfaat dari pengumpulan sebagian dan menggunakan data Anda lebih efisien.
sumber
Saya berasumsi bahwa variabel ( dan ) adalah sama untuk semua individu (sebenarnya saya tidak yakin saya mengerti apa yang Anda maksud dengan mengatakan bahwa levelnya tidak sama di seluruh mata pelajaran: Saya harap Anda merujuk tentang independensi di antara rentang variabel, bukan tentang variabel mana yang diukur untuk setiap individu). Ya, rumus yang Anda tunjukkan berlaku untuk koefisien korelasi antara dua variabel.6 X 6 Y12 6 X 6 Y
Dalam poin 2 Anda, Anda berbicara tentang normalisasi: Saya pikir ini masuk akal jika Anda melakukannya untuk masing-masing variabel secara terpisah. Namun, meskipun demikian, masalah dengan pendekatan ini adalah bahwa ia tidak mengontrol ketergantungan individu.6 ∗ 2
Saya percaya pendekatan Anda 1 juga tidak valid, karena itu akan menjadi tes di antara variabel dengan distribusi dengan hanya derajat kebebasan, jadi saya tidak berpikir Anda dapat menerapkan Central Limit Theorem dalam kasus ini.t 106 t 10
Mungkin, dengan angka yang lebih besar, Anda bisa menggunakan pendekatan efek acak, memungkinkan untuk kemiringan acak dan secara bersamaan menguji koefisien rata-rata nol (dari pada ) dan tidak adanya koefisien acak. Namun saya percaya 6 variabel dan 12 pengamatan tidak cukup untuk melakukannya.Y iXsaya Ysaya
Saya sarankan Anda melihatnya sebagai tes pada 6 nilai (menjadi 12 jika Anda juga mempertimbangkan nilai di bawah diagonal) dari matriks korelasi di antara variabel (baik dan ), yaitu yang ada di diagonal ke-2 (dan ekuivalen dengan kuadran ketiga). Jadi, saya akan membuat tes rasio kemungkinan antara model terbatas dan tidak terbatas.X Y12 X Y
@Alexis Pemahaman saya adalah bahwa pemusatan , , dengan menggantinya dengan akan masuk akal (saya pikir masuk akal juga untuk membaginya dengan mereka ). Dengan cara ini, variabel dan (dibuat dengan mempertimbangkan seolah-olah merupakan kemunculan variabel unik, dan sama untuk ) semuanya akan memiliki a berarti. Sebaliknya, jika kita membangun dua variabel terlebih dahulu (dibuat dengan mempertimbangkanY 1 , ... , Y 6 X ∗ 1 = X 1 - ¯ X 1 , ... , X ∗ 6 = X 6 - ¯ X 6 , Y ∗ 1 = Y 1 - ¯ Y 1 , ... , Y ∗ 6 = Y 6 - ¯ Y 6X1, ... , X6 Y1, ... , Y6 X∗1= X1- X1¯, ... , X∗6= X6- X6¯, Y∗1= Y1- Y1¯, ... , Y∗6= Y6- Y6¯ X ∗ Y ∗ X ∗ i , 1 ≤ i ≤ 6 Y ∗ i 0 X , Y X i , 1 ≤ i ≤ 6 Y i X YSE X∗ Y∗ X∗saya, 1 ≤ i ≤ 6 Y∗saya 0 X, Y Xsaya, 1 ≤ i ≤ 6 seolah-olah mereka adalah kejadian dari variabel unik, dan sama untuk ), maka tentu saja mengurangi mean (dan juga membagi dengan SE dari dan ) tidak akan mengubah hal-hal.Ysaya X Y
EDIT 01/01/18
Biarkan menunjukkan variabel dan ( ) individu. Maka, misalkan kita memiliki:j 1 ≤ j ≤ 12saya j 1 ≤ j ≤ 12
Korelasi dalam kasus ini harus .0,5428
Jika kita memusatkan setiap variabel, mengingat bahwa, untuk , baik dan tidak memiliki variasi, kita memiliki: . Sedangkan untuk , kita mendapatkan nilai (yaitu, untuk 's: , dan sebaliknya untuk 's). Karena dan , kita mendapatkan: , menyiratkan korelasi .X i Y i X ∗ i j = Y ∗ i j = 0 i = 6 X ∗ 6 j = j - 6.5 , Y ∗ j 6 = ( 13 - j ) - 6.5 = 6.5 - j X - 5.5 , - 4.5 , - 3.5 , - 2.51≤i≤5 Xi Yi X∗ij=Y∗ij=0 i=6 X∗6j=j−6.5,Y∗j6=(13−j)−6.5=6.5−j X −5.5,−4.5,−3.5,−2.5,−1.5,−0.5,0.5,1.5,2.5,3.5,4.5,5.5 Y 0=−0 j−6.5=−(6.5−j) X∗ij=−Y∗ij∀i,j→X∗=−Y∗ −1
sumber