Saya memiliki ukuran sampel 6. Dalam kasus seperti itu, apakah masuk akal untuk menguji normalitas menggunakan tes Kolmogorov-Smirnov? Saya menggunakan SPSS. Saya memiliki ukuran sampel yang sangat kecil karena butuh waktu untuk mendapatkannya. Jika tidak masuk akal, berapa banyak sampel adalah jumlah terendah yang masuk akal untuk diuji?
Catatan: Saya melakukan beberapa percobaan terkait dengan kode sumber. Sampel waktu yang dihabiskan untuk coding dalam versi perangkat lunak (versi A) Sebenarnya, saya memiliki ukuran sampel lain dari 6 yang waktu yang dihabiskan untuk coding di lain versi software (versi B)
Saya ingin melakukan pengujian hipotesis menggunakan one-sample t-test untuk menguji apakah waktu yang dihabiskan dalam kode versi A berbeda dari waktu yang dihabiskan dalam kode versi B atau tidak (Ini adalah H1 saya). Prasyarat uji satu sampel adalah bahwa data yang akan diuji harus didistribusikan secara normal. Itu sebabnya saya perlu menguji normalitas.
Jawaban:
Iya nih.
Semua tes hipotesis memiliki dua sifat yang menonjol : ukurannya (atau "tingkat signifikansi"), angka yang secara langsung terkait dengan kepercayaan dan tingkat positif palsu yang diharapkan, dan kekuatan mereka , yang mengungkapkan kemungkinan negatif palsu. Ketika ukuran sampel kecil dan Anda terus bersikeras pada ukuran kecil (kepercayaan tinggi), kekuatan semakin memburuk. Ini berarti bahwa tes sampel kecil biasanya tidak dapat mendeteksi perbedaan kecil atau sedang. Tetapi mereka masih bermakna .
Tes KS menilai apakah sampel tampaknya berasal dari distribusi Normal. Sampel dari enam nilai harus terlihat sangat tidak normal memang untuk gagal dalam tes ini. Tetapi jika ya, Anda dapat menginterpretasikan penolakan ini dari nol persis seperti yang Anda tafsirkan dengan ukuran sampel yang lebih tinggi. Di sisi lain, jika tes gagal untuk menolak hipotesis nol, itu memberitahu Anda sedikit, karena tingkat negatif palsu yang tinggi. Secara khusus, itu akan relatif berisiko untuk bertindak seolah-olah distribusi yang mendasarinya adalah Normal.
Satu hal lagi yang harus diperhatikan di sini: beberapa perangkat lunak menggunakan perkiraan untuk menghitung nilai-p dari statistik uji. Seringkali perkiraan ini bekerja dengan baik untuk ukuran sampel yang besar tetapi bertindak buruk untuk ukuran sampel yang sangat kecil. Ketika hal ini terjadi, Anda tidak dapat mempercayai bahwa nilai-p telah dihitung dengan benar, yang berarti Anda tidak dapat memastikan bahwa ukuran pengujian yang diinginkan telah tercapai. Untuk detailnya, bacalah dokumentasi perangkat lunak Anda.
Beberapa saran: Tes KS secara substansial kurang kuat untuk menguji normalitas daripada tes lain yang dibuat khusus untuk tujuan ini. Yang terbaik dari mereka mungkin adalah tes Shapiro-Wilk , tetapi yang lain yang biasa digunakan dan hampir sama kuatnya adalah Shapiro-Francia dan Anderson-Darling .
Plot ini menampilkan distribusi statistik uji Kolmogorov-Smirnov dalam 10.000 sampel dari enam varian yang terdistribusi normal:
Statistik uji adalah 0,5 (yang kurang dari nilai kritis). Sampel semacam itu akan ditolak menggunakan tes normalitas lainnya.
sumber
set.seed(140);x=rnorm(6);ks.test(x,pnorm)
menghasilkanp-value = 0.0003255
. Tentu saja saya harus mencobanya dengan 140 biji sebelum saya menemukan ini ...Seperti @whuber tanyakan dalam komentar, validasi untuk kategori saya NO. sunting: dengan uji shapiro, karena uji satu sampel ks sebenarnya salah digunakan. Whuber benar: Untuk penggunaan yang benar dari tes Kolmogorov-Smirnov, Anda harus menentukan parameter distribusi dan tidak mengekstraknya dari data. Namun ini adalah apa yang dilakukan dalam paket statistik seperti SPSS untuk uji satu sampel KS.
Anda mencoba mengatakan sesuatu tentang distribusi, dan Anda ingin memeriksa apakah Anda dapat menerapkan uji-t. Jadi tes ini dilakukan untuk mengkonfirmasi bahwa data tidak menyimpang dari normalitas cukup signifikan untuk membuat asumsi yang mendasari analisis tidak valid. Oleh karena itu, Anda tidak tertarik pada kesalahan tipe I, tetapi kesalahan tipe II.
Sekarang kita harus mendefinisikan "sangat berbeda" untuk dapat menghitung minimum n untuk daya yang dapat diterima (katakanlah 0.8). Dengan distribusi, itu tidak mudah untuk didefinisikan. Karenanya, saya tidak menjawab pertanyaan itu, karena saya tidak dapat memberikan jawaban yang masuk akal selain dari aturan praktis yang saya gunakan: n> 15 dan n <50. Berdasarkan apa? Pada dasarnya perasaan Gut, jadi saya tidak bisa mempertahankan pilihan itu selain dari pengalaman.
Tapi saya tahu bahwa dengan hanya 6 nilai kesalahan tipe II Anda pasti hampir 1, membuat kekuatan Anda mendekati 0. Dengan 6 pengamatan, tes Shapiro tidak dapat membedakan antara distribusi normal, poisson, seragam, atau bahkan eksponensial. Dengan kesalahan tipe II hampir 1, hasil tes Anda tidak berarti.
Untuk menggambarkan pengujian normalitas dengan uji shapiro:
Satu-satunya di mana sekitar setengah dari nilai lebih kecil dari 0,05, adalah yang terakhir. Yang juga merupakan kasus paling ekstrem.
jika Anda ingin mencari tahu berapa n minimum yang memberi Anda kekuatan yang Anda sukai dengan tes shapiro, orang dapat melakukan simulasi seperti ini:
yang memberi Anda analisis kekuatan seperti ini:
dari mana saya menyimpulkan bahwa Anda memerlukan sekitar 20 nilai minimum untuk membedakan eksponensial dari distribusi normal di 80% kasus.
plot kode:
sumber
Pertanyaan yang diajukan di sini memiliki beberapa kesalahpahaman bahwa mengapa pemeriksaan Normal diperlukan untuk ukuran sampel 6. Di sini tujuan utamanya adalah "untuk menguji apakah waktu yang dihabiskan dalam kode A berbeda dari waktu yang dihabiskan dalam kode B versi atau tidak ( Ini H1 saya) ”. Ketika kata "berbeda" digunakan, apakah itu tes satu ekor? Namun pengujian Normalitas adalah langkah kedua. Langkah pertama adalah memeriksa kecukupan kekuatan uji (1-β) yang telah ditentukan untuk ukuran sampel tertentu ketika daya sangat buruk lalu apa gunanya pengujian kondisi normalitas ?. Pemeriksaan kondisi normal akan membantu kami dalam memutuskan apakah akan mengikuti tes Parametrik atau Non-Parametrik ?. Jika ukuran sampel Anda tidak memiliki kekuatan yang memadai mengapa orang harus memikirkan pengujian Normalitas ?.
sumber