Dalam konteks proposal penelitian dalam ilmu sosial, saya ditanya pertanyaan berikut:
Saya selalu pergi dengan 100 + m (di mana m adalah jumlah prediktor) ketika menentukan ukuran sampel minimum untuk regresi berganda. Apakah ini tepat?
Saya sering mendapat pertanyaan serupa, seringkali dengan aturan praktis yang berbeda. Saya juga membaca aturan praktis seperti itu cukup banyak di berbagai buku pelajaran. Saya kadang bertanya-tanya apakah popularitas aturan dalam hal kutipan didasarkan pada seberapa rendah standar yang ditetapkan. Namun, saya juga menyadari nilai heuristik yang baik dalam menyederhanakan pengambilan keputusan.
Pertanyaan:
- Apa kegunaan aturan sederhana untuk ukuran sampel minimum dalam konteks peneliti terapan yang merancang studi penelitian?
- Apakah Anda menyarankan aturan praktis alternatif untuk ukuran sampel minimum untuk regresi berganda?
- Atau, strategi alternatif apa yang akan Anda sarankan untuk menentukan ukuran sampel minimum untuk regresi berganda? Secara khusus, akan lebih baik jika nilai diberikan ke tingkat di mana strategi apa pun dapat segera diterapkan oleh non-ahli statistik.
sumber
(+1) untuk pertanyaan yang menurut saya krusial.
Sebagian besar ukuran sampel terkait dengan kekuatan tes untuk hipotesis yang akan Anda uji setelah Anda cocok dengan model regresi berganda.
Ada kalkulator bagus yang bisa berguna untuk model regresi berganda dan beberapa rumus di balik layar. Saya pikir kalkulator seperti itu dapat dengan mudah diterapkan oleh non-ahli statistik.
Mungkin artikel K.Kelley dan SEMaxwell mungkin berguna untuk menjawab pertanyaan-pertanyaan lain, tetapi saya perlu lebih banyak waktu pertama untuk mempelajari masalahnya.
sumber
sumber
n=k(m+1)
?Dalam Psikologi:
Aturan lain yang bisa digunakan adalah ...
sumber
N = 50 + 8 m
, meskipun dipertanyakan apakah istilah 50 memang diperlukanSaya setuju bahwa kalkulator daya berguna, terutama untuk melihat pengaruh berbagai faktor terhadap daya. Dalam hal itu, kalkulator yang memasukkan lebih banyak informasi input jauh lebih baik. Untuk regresi linier, saya suka kalkulator regresi di sini yang mencakup faktor-faktor seperti kesalahan dalam Xs, korelasi antara Xs, dan banyak lagi.
sumber
( pdf )
Tentu saja, seperti juga diakui oleh makalah, (relatif) tidak memihak tidak berarti memiliki kekuatan statistik yang cukup. Namun, perhitungan daya dan ukuran sampel biasanya dilakukan dengan menentukan efek yang diharapkan; dalam kasus regresi berganda, ini menyiratkan hipotesis tentang nilai koefisien regresi atau pada matriks korelasi antara regressor dan hasilnya harus dibuat. Dalam praktiknya, itu tergantung pada kekuatan korelasi para regressor dengan hasil dan di antara mereka (jelas, semakin kuat semakin baik untuk korelasi dengan hasilnya, sementara keadaan menjadi lebih buruk dengan multikolinieritas). Sebagai contoh, dalam kasus ekstrim dari dua variabel collinear sempurna, Anda tidak dapat melakukan regresi terlepas dari jumlah pengamatan, dan bahkan dengan hanya 2 kovariat.
sumber