Tes Sharipo-Wilk, menurut wikipedia , menguji hipotesis nol ( ) "Populasi terdistribusi secara normal".
Saya mencari tes normalitas serupa dengan "Populasi tidak terdistribusi secara normal".
Setelah melakukan tes seperti itu, saya ingin menghitung nilai- untuk menolak pada tingkat signifikansi iff ; membuktikan bahwa populasi saya terdistribusi secara normal.
Harap dicatat bahwa menggunakan uji Sharipo-Wilk dan menerima iff adalah pendekatan yang salah karena secara harfiah berarti "kami tidak memiliki cukup bukti untuk membuktikan bahwa H0 tidak berlaku".
Thread terkait - artinya -value , apakah pengujian normalitas tidak berguna? , tetapi saya tidak dapat melihat solusi untuk masalah saya.
Pertanyaan: Tes mana yang harus saya gunakan? Apakah ini diterapkan dalam R?
Jawaban:
Tidak ada hal seperti tes bahwa data Anda yang terdistribusi normal. Hanya ada tes bahwa data Anda tidak terdistribusi secara normal. Dengan demikian, ada tes seperti Shapiro-Wilk di mana (ada banyak lainnya), tetapi tidak ada tes di mana nol adalah bahwa populasi tidak normal dan hipotesis alternatifnya adalah bahwa populasi normal.H0:normal
Yang bisa Anda lakukan hanyalah mencari tahu penyimpangan seperti apa dari keadaan normal yang Anda pedulikan (mis. Kemiringan), dan seberapa besar penyimpangan yang harus terjadi sebelum itu mengganggu Anda. Kemudian Anda bisa menguji untuk melihat apakah penyimpangan dari normalitas sempurna dalam data Anda kurang dari jumlah kritis. Untuk informasi lebih lanjut tentang ide umum, mungkin membantu untuk membaca jawaban saya di sini: Mengapa ahli statistik mengatakan hasil yang tidak signifikan berarti "Anda tidak dapat menolak nol" sebagai lawan menerima hipotesis nol?
sumber
Distribusi normal muncul ketika data dihasilkan oleh serangkaian peristiwa aditif iid (lihat gambar quincunx di bawah). Itu berarti tidak ada umpan balik dan tidak ada korelasi, apakah itu terdengar seperti proses yang mengarahkan data Anda? Jika tidak, itu mungkin tidak normal.
Ada kemungkinan jenis proses dapat terjadi dalam kasus Anda. Yang paling dekat dengan Anda untuk "membuktikan" itu adalah mengumpulkan cukup data untuk mengesampingkan distribusi lain yang dapat dihasilkan orang (yang mungkin tidak praktis). Cara lain adalah dengan menyimpulkan distribusi normal dari beberapa teori bersama dengan beberapa prediksi lainnya. Jika data konsisten dengan mereka semua dan tidak ada yang bisa memikirkan penjelasan lain maka itu akan menjadi bukti yang baik yang mendukung distribusi normal.
https://en.wikipedia.org/wiki/Bean_machine
Sekarang jika Anda tidak mengharapkan distribusi apriori tertentu, mungkin masih masuk akal untuk menggunakan distribusi normal untuk merangkum data, tetapi menyadari bahwa ini pada dasarnya adalah pilihan karena ketidaktahuan ( https://en.wikipedia.org/wiki/ Principle_of_maximum_entropy ). Dalam hal ini Anda tidak ingin tahu apakah populasi terdistribusi secara normal, tetapi Anda ingin tahu apakah distribusi normal adalah perkiraan yang masuk akal untuk apa pun langkah Anda selanjutnya.
Dalam hal ini Anda harus memberikan data Anda (atau data yang dihasilkan yang serupa) bersama dengan deskripsi tentang apa yang Anda rencanakan untuk dilakukan dengannya, kemudian tanyakan "Dengan cara apa mengasumsikan normalitas dalam kasus ini menyesatkan saya?"
sumber
Anda tidak akan pernah bisa "membuktikan" asumsi Normalitas dalam data Anda. Hanya menawarkan bukti yang menentangnya sebagai asumsi. Tes Shapiro-Wilk adalah salah satu cara untuk melakukan ini dan digunakan setiap saat untuk membenarkan asumsi Normalitas. Alasannya adalah bahwa Anda memulai dengan mengasumsikan Normalitas. Anda kemudian bertanya, apakah data saya menunjukkan saya membuat asumsi konyol? Jadi Anda pergi ke depan dan mengujinya dengan Shapiro-Wilk. Jika Anda gagal menolak hipotesis nol maka data tidak menyarankan Anda membuat asumsi konyol.
Perhatikan, orang menggunakan logika yang sama ini setiap saat dalam praktik - tidak hanya dalam konteks tes Shapiro-Wilk. Mereka ingin menggunakan regresi linier, melihat scatterplot dan melihat apakah regresi linier adalah ide yang konyol. Atau, mereka mengasumsikan heteroskedastisitas dan plot istilah kesalahan untuk melihat apakah ini ide yang konyol.Y,X
sumber