Saya punya beberapa data yang terlihat dari merencanakan grafik residu vs waktu hampir normal tetapi saya ingin memastikan. Bagaimana saya bisa menguji normalitas residu kesalahan?
20
Saya punya beberapa data yang terlihat dari merencanakan grafik residu vs waktu hampir normal tetapi saya ingin memastikan. Bagaimana saya bisa menguji normalitas residu kesalahan?
Jawaban:
Tidak ada tes yang akan memberitahu Anda bahwa residu Anda terdistribusi secara normal. Bahkan, Anda dapat bertaruh andal bahwa itu tidak benar .
Tes hipotesis pada umumnya bukan ide yang bagus untuk memeriksa asumsi Anda. Efek non-normalitas pada inferensi Anda umumnya bukan fungsi dari ukuran sampel *, tetapi hasil uji signifikansi adalah . Penyimpangan kecil dari normalitas akan terlihat jelas pada ukuran sampel yang besar meskipun jawaban untuk pertanyaan yang menarik ('sejauh mana hal ini memengaruhi kesimpulan saya?') Mungkin 'hampir tidak sama sekali'. Sejalan dengan itu, penyimpangan besar dari normalitas pada ukuran sampel kecil mungkin tidak mendekati signifikansi.
* (ditambahkan dalam edit) - sebenarnya itu pernyataan yang terlalu lemah. Dampak ketidaknormalan sebenarnya menurun dengan ukuran sampel cukup banyak setiap kali CLT dan teorema Slutsky akan bertahan, sementara kemampuan untuk menolak normalitas (dan mungkin menghindari prosedur teori normal) meningkat dengan ukuran sampel ... jadi tepat ketika Anda paling mampu mengidentifikasi ketidaknormalan cenderung ketika itu tidak masalah † pokoknya ... dan tes tidak membantu ketika itu benar-benar penting, dalam sampel kecil.†
Apa yang mendekati pengukuran ukuran efek adalah beberapa diagnostik (baik tampilan atau statistik) yang mengukur tingkat ketidaknormalan dalam beberapa cara. Plot QQ adalah tampilan yang jelas, dan plot QQ dari populasi yang sama pada satu ukuran sampel dan pada ukuran sampel yang berbeda setidaknya merupakan perkiraan berisik dari kurva yang sama - menunjukkan 'non-normalitas' yang sama; setidaknya harus kira-kira berhubungan secara monoton dengan jawaban yang diinginkan untuk pertanyaan yang menarik.
Jika Anda harus menggunakan tes, Shapiro-Wilk mungkin sama baiknya dengan yang lain (tes Chen-Shapiro biasanya sedikit lebih baik pada alternatif yang memiliki kepentingan bersama, tetapi lebih sulit untuk menemukan implementasi) - tetapi itu menjawab pertanyaan yang Anda sudah tahu jawabannya; setiap kali Anda gagal menolak, itu memberikan jawaban yang Anda yakin salah.
sumber
Tes Shapiro-Wilk adalah satu kemungkinan.
Tes Shapiro-Wilk
Tes ini diterapkan di hampir semua paket perangkat lunak statistik. Hipotesis nol adalah residu terdistribusi normal, sehingga nilai p kecil menunjukkan Anda harus menolak nol dan menyimpulkan residu tidak terdistribusi normal.
Perhatikan bahwa jika ukuran sampel Anda besar, Anda hampir selalu akan menolak, jadi visualisasi residu lebih penting.
sumber
Dari wikipedia:
Tes normalitas univariat termasuk uji K-kuadrat D'Agostino, tes Jarque-Bera, tes Anderson-Darling, kriteria Cramér-von Mises, tes Lilliefors untuk normalitas (itu sendiri merupakan adaptasi dari tes Kolmogorov-Smirnov), Tes Shapiro-Wilk, uji chi-squared Pearson, dan tes Shapiro-Francia. Sebuah makalah 2011 dari Journal of Statistical Modeling and Analytics [1] menyimpulkan bahwa Shapiro-Wilk memiliki kekuatan terbaik untuk signifikansi yang diberikan, diikuti oleh Anderson-Darling ketika membandingkan Shapiro-Wilk, Kolmogorov-Smirnov, Lilliefors, dan Anderson- Tes sayang.
sumber