Berbagai tes hipotesis, seperti tes GOF, Kolmogorov-Smirnov, Anderson-Darling, dll., Ikuti format dasar ini:
: Data mengikuti distribusi yang diberikan.
: Data tidak mengikuti distribusi yang diberikan.
Biasanya, seseorang menilai klaim bahwa beberapa data yang diberikan mengikuti beberapa distribusi yang diberikan, dan jika seseorang menolak , data tersebut tidak cocok untuk distribusi yang diberikan pada tingkat α tertentu.
Tetapi bagaimana jika kita tidak menolak ? Saya selalu diajari bahwa seseorang tidak dapat "menerima" H 0 , jadi pada dasarnya, kami tidak bukti untuk menolak H 0 . Artinya, tidak ada bukti bahwa kami menolak bahwa data mengikuti distribusi yang diberikan.
Jadi, pertanyaan saya adalah, apa gunanya melakukan pengujian seperti itu jika kita tidak dapat menyimpulkan apakah data mengikuti distribusi yang diberikan atau tidak?
sumber
Jawaban:
Secara umum (tidak hanya dalam uji kelaikan, tetapi dalam banyak situasi lain), Anda tidak dapat menyimpulkan bahwa nol itu benar, karena ada alternatif yang secara efektif tidak dapat dibedakan dari nol pada ukuran sampel yang diberikan.
Berikut adalah dua distribusi, standar normal (garis solid hijau), dan yang tampak serupa (standar 90% normal, dan beta standar 10% (2,2), ditandai dengan garis putus-putus merah):
Yang merah tidak normal. Pada katakanlah , kita memiliki sedikit peluang untuk menemukan perbedaannya, jadi kita tidak dapat menyatakan bahwa data diambil dari distribusi normal - bagaimana jika itu berasal dari distribusi non-normal seperti yang merah?n = 100
Fraksi yang lebih kecil dari beta standar dengan parameter yang sama tetapi lebih besar akan jauh lebih sulit untuk dilihat sebagai berbeda dari normal.
Tetapi mengingat bahwa data nyata hampir tidak pernah dari beberapa distribusi sederhana, jika kita memiliki oracle yang sempurna (atau ukuran sampel efektif tak terbatas), kita pada dasarnya akan selalu menolak hipotesis bahwa data tersebut berasal dari beberapa bentuk distribusi sederhana.
Seperti George Box terkenal mengatakan , " Semua model salah, tetapi beberapa berguna. "
Pertimbangkan, misalnya, menguji normalitas. Ini mungkin bahwa data benar-benar datang dari sesuatu yang dekat dengan normal, tetapi akan mereka pernah menjadi persis yang normal? Mereka mungkin tidak pernah ada.
Alih-alih, yang terbaik yang bisa Anda harapkan dengan bentuk pengujian itu adalah situasi yang Anda gambarkan. (Lihat, misalnya, posting Apakah pengujian normal pada dasarnya tidak berguna?, Tetapi ada sejumlah posting lain di sini yang membuat poin terkait)
Perhatikan gambar di atas lagi. Distribusi merah adalah non-normal, dan dengan sampel yang sangat besar kita bisa menolak uji normalitas berdasarkan sampel dari itu ... tetapi pada ukuran sampel yang jauh lebih kecil, regresi dan dua sampel t-tes (dan banyak tes lainnya selain itu) akan berperilaku sangat baik sehingga tidak ada gunanya untuk khawatir tentang ketidak normalan itu bahkan sedikit.
Anda mungkin dapat menentukan beberapa bentuk penyimpangan tertentu dan melihat sesuatu seperti pengujian kesetaraan, tetapi agak rumit dengan goodness of fit karena ada banyak cara untuk distribusi yang dekat tetapi berbeda dari yang dihipotesiskan, dan berbeda bentuk perbedaan dapat memiliki dampak berbeda pada analisis. Jika alternatifnya adalah keluarga yang lebih luas yang memasukkan nol sebagai kasus khusus, pengujian kesetaraan lebih masuk akal (misalnya, menguji eksponensial terhadap gamma) - dan memang, pendekatan "dua uji satu sisi" dijalankan, dan itu mungkin menjadi cara untuk memformalkan "cukup dekat" (atau itu akan terjadi jika model gamma benar, tetapi pada kenyataannya itu sendiri akan hampir pasti akan ditolak oleh tes goodness of fit biasa,
Pengujian goodness of fit (dan seringkali lebih luas, pengujian hipotesis) benar-benar hanya cocok untuk berbagai situasi yang cukup terbatas. Pertanyaan yang biasanya ingin dijawab orang tidak begitu tepat, tetapi agak lebih kabur dan lebih sulit dijawab - tetapi seperti yang dikatakan John Tukey, " Jauh lebih baik jawaban perkiraan untuk pertanyaan yang tepat, yang seringkali tidak jelas, daripada jawaban yang tepat untuk pertanyaan itu. pertanyaan yang salah, yang selalu bisa dibuat tepat. "
Pendekatan yang masuk akal untuk menjawab pertanyaan yang lebih tidak jelas dapat mencakup simulasi dan penyelidikan ulang untuk menilai sensitivitas analisis yang diinginkan terhadap asumsi yang Anda pertimbangkan, dibandingkan dengan situasi lain yang juga cukup konsisten dengan data yang tersedia.
sumber
sumber
Pandangan yang menurut saya dibagikan oleh kebanyakan orang adalah bahwa pengujian hipotesis adalah adaptasi probabilistik dari prinsip pemalsuan .
sumber
Saya pikir ini adalah contoh sempurna untuk menggambarkan perbedaan antara pekerjaan akademik dan pengambilan keputusan praktis. Dalam pengaturan akademik (di mana saya), Anda dapat berdebat dengan cara apa pun yang Anda inginkan selama itu dianggap masuk akal oleh orang lain. Oleh karena itu, pada dasarnya kita berakhir dengan bertengkar saling bertubi-tubi tanpa akhir, terkadang melingkar, satu sama lain. Dalam hal ini, ini memberi orang sesuatu untuk dikerjakan.
Namun, jika Anda benar-benar berada dalam posisi untuk benar-benar membuat keputusan, maka jawabannya adalah ya atau tidak. Keragu-raguan akan merusak reputasi Anda sebagai pengambil keputusan. Tentu saja, membuat pilihan tidak hanya melibatkan statistik tetapi juga terkadang elemen pertaruhan dan lompatan iman. Singkatnya, latihan semacam ini sedikit banyak berguna untuk pengambilan keputusan. Namun, apakah hanya mengandalkan keputusan Anda pada tes hipotesis ini adalah cerita yang sama sekali berbeda.
sumber
Intinya adalah bahwa dari sudut pandang statistik murni Anda tidak dapat menerima , tetapi dalam praktiknya Anda lakukan. Misalnya, jika Anda memperkirakan risiko suatu portofolio menggunakan nilai-berisiko atau tindakan-tindakan serupa, distribusi pengembalian portofolio cukup penting. Itu karena risiko ditentukan oleh ekor distribusi Anda.
Dalam kasus-kasus buku teks, distribusi normal sering digunakan sebagai contoh. Namun, jika pengembalian portofolio Anda memiliki masalah besar (yang sering terjadi), perkiraan distribusi normal akan meremehkan risiko. Karena itu, penting untuk memeriksa pengembalian dan memutuskan apakah Anda akan menggunakan perkiraan normal atau tidak. Catatan, ini tidak berarti menjalankan uji statistik, itu bisa berupa QQ-plot atau cara lain. Namun, Anda harus membuat keputusan di beberapa titik berdasarkan analisis pengembalian dan model pengembalian Anda, dan apakah menggunakan normal atau tidak.
Oleh karena itu, untuk semua tujuan praktis tidak menolak benar-benar berarti menerima walaupun tidak dalam arti statistik yang ketat. Anda akan menerima yang normal dan menggunakannya dalam perhitungan Anda, yang akan ditampilkan kepada manajemen puncak setiap hari, kepada regulator Anda, auditor, dll. Tidak menolak dalam kasus ini memiliki konsekuensi yang jauh dalam segala hal, jadi sama atau lebih kuat daripada hasil statistik konyol.
sumber
Tidak ada terdakwa di pengadilan yang tidak bersalah. Mereka salah (menolak hipotesis nol tidak bersalah) atau tidak bersalah (tidak menolak anggapan tidak bersalah).
Tidak adanya bukti bukanlah bukti ketidakhadiran.
sumber
Jika Anda memiliki distribusi alternatif (atau set distribusi) untuk dibandingkan maka itu bisa menjadi alat yang berguna.
Beberapa Kesulitan Penafsiran yang Dihadapi dalam Penerapan Uji Chi-Square. Joseph Berkson. Jurnal Asosiasi Statistik Amerika. Vol. 33, No. 203 (Sep., 1938), hlm. 526-536
sumber