Konteks:
Dalam pertanyaan sebelumnya, @Robbie bertanya dalam sebuah penelitian dengan sekitar 600 kasus mengapa tes normalitas menunjukkan non-normal yang signifikan namun plot menyarankan distribusi normal . Beberapa orang menyatakan bahwa uji signifikansi normal tidak terlalu berguna. Dengan sampel kecil, tes semacam itu tidak memiliki banyak kekuatan untuk mendeteksi pelanggaran normalitas ringan dan dengan sampel besar, tes tersebut akan mendeteksi pelanggaran normalitas yang cukup kecil untuk tidak menjadi perhatian.
Tampak bagi saya bahwa masalah ini mirip dengan perdebatan seputar pengujian signifikansi dan ukuran efek. Jika Anda hanya fokus pada uji signifikansi, ketika Anda memiliki sampel besar, Anda dapat mendeteksi efek kecil yang tidak relevan untuk tujuan praktis, dan dengan sampel kecil Anda tidak memiliki kekuatan yang cukup.
Dalam beberapa contoh, saya bahkan melihat buku teks memberi tahu orang-orang bahwa Anda dapat memiliki sampel "terlalu besar", karena efek kecil akan signifikan secara statistik.
Dalam konteks, pengujian signifikansi dan ukuran efek, satu resolusi sederhana adalah untuk fokus pada memperkirakan ukuran efek yang menarik, daripada terobsesi dengan aturan keputusan biner apakah ada atau tidak efek. Interval kepercayaan pada ukuran efek adalah salah satu pendekatan seperti itu, atau Anda bisa mengadopsi beberapa bentuk pendekatan Bayesian. Selain itu, berbagai domain penelitian membangun gagasan tentang arti ukuran efek tertentu dalam arti praktis, baik atau buruk, menerapkan label heuristik seperti "kecil", "sedang", dan "efek besar". Ini juga mengarah pada rekomendasi cerdas untuk memaksimalkan ukuran sampel untuk memaksimalkan akurasi dalam memperkirakan parameter tertentu.
Ini membuat saya bertanya-tanya mengapa pendekatan serupa berdasarkan interval kepercayaan ukuran efek tidak lebih banyak didukung dalam kaitannya dengan pengujian asumsi, dan pengujian normalitas pada khususnya.
Pertanyaan:
- Apa indeks tunggal terbaik sejauh mana data melanggar normalitas?
- Atau apakah lebih baik untuk membicarakan beberapa indeks pelanggaran normalitas (mis. Skewness, kurtosis, prevalensi outlier)?
- Bagaimana interval kepercayaan dapat dihitung (atau mungkin pendekatan Bayesian) untuk indeks?
- Apa jenis label verbal yang dapat Anda tetapkan untuk poin pada indeks itu untuk menunjukkan tingkat pelanggaran normalitas (misalnya, ringan, sedang, kuat, ekstrim, dll.)? Tujuan dari label semacam itu adalah untuk membantu analis yang kurang berpengalaman dalam melatih intuisi mereka ketika pelanggaran normalitas menjadi masalah.
Jawaban:
A) Apa indeks tunggal terbaik sejauh mana data melanggar normalitas?
B) Atau apakah lebih baik untuk membicarakan beberapa indeks pelanggaran normalitas (mis. Skewness, kurtosis, prevalensi outlier)?
Saya akan memilih B. Pelanggaran yang berbeda memiliki konsekuensi yang berbeda. Sebagai contoh, distribusi unimodal, simetris dengan ekor yang berat membuat CI Anda sangat lebar dan mungkin mengurangi kekuatan untuk mendeteksi efek. Namun, rata-rata masih menyentuh nilai "khas". Untuk distribusi yang sangat miring, mean misalnya, mungkin bukan indeks yang sangat masuk akal dari "nilai tipikal".
C) Bagaimana interval kepercayaan dapat dihitung (atau mungkin pendekatan Bayesian) untuk indeks?
Saya tidak tahu tentang statistik Bayesian, tetapi mengenai uji klasik normalitas, saya ingin mengutip Erceg-Hurn et al. (2008) [2]:
D) Apa jenis label verbal yang dapat Anda tetapkan untuk poin pada indeks itu untuk menunjukkan tingkat pelanggaran normalitas (misalnya, ringan, sedang, kuat, ekstrim, dll.)?
Micceri (1989) [1] melakukan analisis terhadap 440 set data skala besar dalam psikologi. Dia menilai simetri dan bobot ekor serta kriteria dan label yang ditentukan. Label untuk rentang asimetri dari 'relatif simetris' ke 'moderat -> ekstrim -> asimetri eksponensial'. Label untuk kisaran berat ekor dari 'Seragam -> kurang dari Gaussian -> Tentang Gaussian -> Sedang -> Ekstrem -> Kontaminasi eksponensial ganda'. Setiap klasifikasi didasarkan pada beberapa kriteria yang kuat.
Dia menemukan, bahwa dari 440 kumpulan data ini hanya 28% yang relatif simetris, dan hanya 15% tentang Gaussian mengenai bobot ekor. Oleh karena itu judul makalah yang bagus:
Saya menulis sebuah
R
fungsi, yang secara otomatis menilai kriteria Micceri dan juga mencetak label:[1] Micceri, T. (1989). Unicorn, kurva normal, dan makhluk mustahil lainnya. Buletin Psikologis, 105 , 156-166. doi: 10.1037 / 0033-2909.105.1.156
[2] Erceg-Hurn, DM, & Mirosevich, VM (2008). Metode statistik kuat modern: Cara mudah untuk memaksimalkan akurasi dan kekuatan penelitian Anda. Psikolog Amerika, 63 , 591-601.
sumber