Saya membaca pertanyaan ini mengenai regresi skala besar ( tautan ) di mana whuber menunjukkan poin yang menarik sebagai berikut:
"Hampir semua uji statistik yang Anda jalankan akan sangat kuat sehingga hampir pasti untuk mengidentifikasi efek" signifikan ". Anda harus lebih fokus pada kepentingan statistik, seperti ukuran efek, daripada signifikansi."
--- whuber
Saya bertanya-tanya apakah ini adalah sesuatu yang dapat dibuktikan atau hanya beberapa fenomena umum dalam praktek?
Setiap pointer ke bukti / diskusi / simulasi akan sangat membantu.
regression
statistical-significance
Bayesric
sumber
sumber
Jawaban:
Ini cukup umum.
Bayangkan ada efek kecil, tetapi tidak nol (yaitu beberapa penyimpangan dari nol yang dapat diambil tes).
Pada ukuran sampel yang kecil, kemungkinan penolakan akan sangat dekat dengan tingkat kesalahan tipe I (noise mendominasi efek kecil).
Ketika ukuran sampel bertambah, efek yang diperkirakan akan menyatu dengan efek populasi tersebut, sementara pada saat yang sama ketidakpastian dari efek yang diperkirakan akan menyusut (normalnya ), sampai kemungkinan situasi nol cukup dekat dengan efek yang diperkirakan masih masuk dalam sampel yang dipilih secara acak dari populasi, berkurang menjadi nol secara efektif.n−−√
Yang mengatakan, dengan titik nulls, akhirnya penolakan menjadi tertentu, karena di hampir semua situasi nyata ada yang pada dasarnya selalu akan menjadi beberapa jumlah penyimpangan dari nol.
sumber
Ini bukan bukti, tetapi tidak sulit untuk menunjukkan pengaruh ukuran sampel dalam praktik. Saya ingin menggunakan contoh sederhana dari Wilcox (2009) dengan perubahan kecil:
Kita dapat menggunakan uji-t untuk analisis ini:
Dengan asumsi sampel yang berarti ( ) adalah 45 dan deviasi standar sampel ( s ) adalah 11,X¯ s
Jika Anda melihat tabel yang berisi nilai kritis distribusi Student dengan ν derajat kebebasant ν , Anda akan melihat bahwa untuk , P ( T ≤ - 1,83 ) = 0,05 . Jadi dengan T = - 1,44 , kita gagal menolak hipotesis nol. Sekarang, mari kita asumsikan kita memiliki mean sampel dan standar deviasi yang sama, tetapi sebaliknya 100 observasi:v=10−1 P(T≤−1.83)=.05 T=−1.44
Untuk , P ( T ≤ - 1,66 )v=100−1 P(T≤−1.66)=.05 s/n−−√ T=β^j−β(0)jse(β^j)
Wilcox, RR, 2009. Statistik Dasar: Memahami Metode Konvensional dan Wawasan Modern . Oxford University Press, Oxford.
sumber
Dalam regresi, untuk model keseluruhan, tesnya adalah F. Di sini
sumber