Berapa jumlah observasi minimal yang "masuk akal" untuk mencari tren dari waktu ke waktu dengan regresi linier? bagaimana dengan pemasangan model kuadratik?
Saya bekerja dengan indeks gabungan dari ketidaksetaraan dalam kesehatan (SII, RII), dan hanya memiliki 4 gelombang survei, jadi 4 poin (1997.2001.2004.2008).
Saya bukan ahli statistik, tetapi saya memiliki kesan intuitif 4 poin tidak cukup. Apakah Anda punya jawaban, dan / atau referensi?
Terima kasih banyak,
Françoise
regression
Francoise
sumber
sumber
Jawaban:
Aturan praktis Peters sebesar 10 per kovariat adalah aturan yang masuk akal. Garis lurus bisa pas dengan dua titik terlepas dari jumlah kebisingan dalam nilai respons dan kuadrat bisa cocok dengan hanya dengan 3 poin. Jadi jelas dalam hampir semua keadaan, adalah tepat untuk mengatakan bahwa 4 poin tidak cukup. Namun, seperti kebanyakan aturan praktis, itu tidak mencakup setiap situasi. Kasus-kasus di mana istilah kebisingan dalam model memiliki varians besar akan memerlukan lebih banyak sampel daripada kasus serupa di mana varians kesalahan kecil.
Jumlah titik sampel yang diperlukan tergantung pada objek. Jika Anda melakukan analisis eksplorasi hanya untuk melihat apakah satu model (katakanlah linier dalam kovariat) terlihat lebih baik daripada yang lain (katakanlah fungsi kuadrat kovariat) kurang dari 10 poin mungkin cukup. Tetapi jika Anda menginginkan estimasi yang sangat akurat dari koefisien korelasi dan regresi untuk kovariat, Anda bisa membutuhkan lebih dari 10 per kovariat. Keakuratan kriteria prediksi dapat membutuhkan sampel lebih banyak daripada perkiraan parameter yang akurat. Perhatikan bahwa varian estimasi dan prediksi semua melibatkan varian istilah error model.
sumber