Latar belakang: Saya membaca satu artikel di mana penulis melaporkan korelasi Pearson 0,754 dari ukuran sampel 878. Menghasilkan nilai p untuk uji korelasi adalah signifikansi "bintang dua" (yaitu p <0,01). Namun, saya berpikir bahwa dengan ukuran sampel yang besar, nilai-p yang sesuai harus kurang dari 0,001 (yaitu tiga bintang signifikan).
- Bisakah nilai-p untuk pengujian ini dihitung hanya dari koefisien korelasi Pearson dan ukuran sampel?
- Jika ya, bagaimana ini bisa dilakukan dalam R?
hypothesis-testing
correlation
p-value
fraud
Miroslav Sabo
sumber
sumber
Jawaban:
Ya, itu bisa dilakukan, jika Anda menggunakan transformasi R-to-z Fisher. Metode lain (misalnya bootstrap) dapat memiliki beberapa kelebihan tetapi membutuhkan data asli. Dalam R ( r adalah koefisien korelasi sampel, n adalah jumlah pengamatan):
Lihat juga posting ini di blog saya .
Yang mengatakan, apakah itu 0,01 atau 0,001 tidak masalah banyak. Seperti yang Anda katakan, ini sebagian besar merupakan fungsi dari ukuran sampel dan Anda sudah tahu bahwa ukuran sampelnya besar. Kesimpulan logisnya adalah bahwa Anda mungkin bahkan tidak memerlukan tes sama sekali (terutama bukan tes yang disebut hipotesis 'nil' bahwa korelasinya adalah 0). Dengan N = 878, Anda bisa cukup percaya diri dalam ketepatan estimasi dan fokus pada menafsirkannya secara langsung (yaitu .75 besar di bidang Anda?).
Namun secara formal, ketika Anda melakukan tes statistik dalam kerangka kerja Neyman-Pearson, Anda perlu menentukan tingkat kesalahan terlebih dahulu. Jadi, jika hasil tes benar-benar penting dan penelitian direncanakan dengan 0,01 sebagai ambang batas, itu hanya masuk akal untuk laporan p <0,01 dan Anda tidak harus oportunis membuat p <0,001 berdasarkan diperoleh p value. Jenis fleksibilitas yang tidak diungkapkan ini bahkan merupakan salah satu alasan utama di balik kritik terhadap bintang-bintang kecil dan lebih umum tentang cara pengujian signifikansi nol-hipotesis dipraktikkan dalam ilmu sosial.
Lihat juga Meehl, PE (1978). Risiko teoretis dan tanda bintang: Sir Karl, Sir Ronald, dan lambatnya perkembangan psikologi lunak. Jurnal Konsultasi dan Psikologi Klinis, 46 (4), 806-834. (Judul berisi referensi untuk "bintang-bintang" ini tetapi isinya adalah diskusi yang jauh lebih luas tentang peran pengujian signifikansi.)
sumber
Ada statistik alternatif:
yang memiliki distribusi-t dengan n-2 derajat kebebasan. Begitulah cara kerjanya misalnya: http://www.danielsoper.com/statcalc3/calc.aspx?id=44
sumber