Menafsirkan pengujian parametrik dan non-parametrik

8

Saya mencari melalui pertanyaan tentang perbedaan uji parametrik dan non-parametrik dan tampaknya semua pertanyaan difokuskan pada tes yang sangat spesifik, masalah data, atau beberapa perbedaan teknis. Saya tidak tertarik dengan masalah asumsi pengujian (jangan; tanyakan sebagai gantinya), atau masalah tingkat daya atau kesalahan.

Pertanyaan saya adalah tentang interpretasi dari dua jenis tes. Apakah ada perbedaan antara bagaimana seseorang menginterpretasikan hasil tes antara parametrik dan non-parametrik? Jika Anda menjalankan tes non-parametrik, Anda memperlemah (menghilangkan) jalur untuk berdiskusi tentang populasi yang tidak dikenal sehingga tampaknya Anda mungkin lebih terbatas dalam hal bagaimana Anda dapat mendiskusikan hasil tes. Jika Anda menjalankan uji parametrik, koneksi Anda ke populasi tergantung pada asumsi. Apa interpretasi yang tepat dari setiap tes dan apakah perbedaan ini penting?

John
sumber

Jawaban:

6

Ini adalah kesempatan yang baik untuk membahas dan mengklarifikasi apa arti model statistik dan bagaimana kita harus memikirkannya. Mari kita mulai dengan definisi, sehingga ruang lingkup jawaban ini tidak diragukan lagi, dan beralih dari sana. Untuk membuat posting ini singkat, saya akan membatasi contoh dan melupakan semua ilustrasi, mempercayai pembaca untuk dapat memasok mereka dari pengalaman.

Definisi

Tampaknya mungkin untuk memahami "tes" dalam arti yang sangat umum sebagai makna segala jenis prosedur statistik: tidak hanya tes hipotesis nol, tetapi juga estimasi, prediksi, dan pengambilan keputusan, dalam kerangka kerja Frequentist atau Bayesian. Itu karena perbedaan antara "parametrik" dan "non-parametrik" terpisah dari perbedaan antara jenis prosedur atau perbedaan antara kerangka kerja ini.

Bagaimanapun, apa yang membuat prosedur statistik adalah bahwa ia memodelkan dunia dengan distribusi probabilitas yang karakteristiknya tidak sepenuhnya diketahui. Cukup abstrak, kami menganggap data sebagai timbul dengan secara numerik mengkode nilai-nilai objek ; data tertentu yang kami gunakan sesuai dengan tertentu ; dan ada hukum probabilitas yang entah bagaimana menentukan sebenarnya kita miliki.XωΩωFω

Hukum probabilitas ini dianggap milik beberapa set . Dalam pengaturan parametrik , elemen sesuai dengan koleksi terbatas angka , parameter. Dalam pengaturan non-parametrik , tidak ada korespondensi seperti itu. Hal ini biasanya karena kita tidak mau membuat asumsi yang kuat tentang .ΘFΘθ(F)F

Sifat Model

Tampaknya bermanfaat untuk membuat perbedaan lebih lanjut yang jarang dibahas. Dalam beberapa keadaan, pasti menjadi model yang sepenuhnya akurat untuk data. Daripada mendefinisikan apa yang saya maksud dengan "sepenuhnya akurat," izinkan saya memberi contoh. Lakukan survei terhadap populasi yang terbatas dan terdefinisi dengan baik di mana pengamatannya adalah biner, tidak ada yang akan hilang, dan tidak ada kemungkinan kesalahan pengukuran. Contohnya mungkin pengujian destruktif dari sampel acak objek yang berasal dari jalur perakitan, misalnya. Kontrol yang kami miliki atas situasi ini - mengetahui populasi dan mampu memilih sampel secara benar-benar acak - memastikan kebenaran model Binomial untuk jumlah yang dihasilkan.F

Dalam banyak - mungkin sebagian besar - kasus lain, tidak "sepenuhnya akurat." Sebagai contoh, banyak analisis mengasumsikan (baik secara implisit atau eksplisit) bahwa adalah distribusi normal. Itu selalu mustahil secara fisik, karena setiap pengukuran aktual tunduk pada batasan fisik pada kisaran kemungkinannya, sedangkan tidak ada kendala seperti itu pada distribusi Normal. Kita tahu sejak awal bahwa asumsi normal salah!ΘF

Sejauh mana model yang tidak sepenuhnya akurat merupakan masalah? Pertimbangkan apa yang dilakukan fisikawan yang baik. Ketika seorang fisikawan menggunakan mekanika Newton untuk memecahkan masalah, itu karena ia tahu bahwa pada skala khusus ini - massa ini, jarak ini, kecepatan ini - mekanika Newton lebih dari cukup akurat untuk bekerja. Dia akan memilih untuk memperumit analisisnya dengan mempertimbangkan efek kuantum atau relativistik (atau keduanya) hanya ketika masalah itu memerlukannya. Dia akrab dengan teorema yang menunjukkan, secara kuantitatif, bagaimana mekanika Newton adalah kasus yang membatasi mekanika kuantum dan relativitas khusus. Teorema-teorema itu membantunya memahami teori mana yang harus dipilih. Pilihan ini biasanya tidak didokumentasikan atau bahkan dipertahankan; bahkan mungkin terjadi tanpa sadar: pilihannya jelas.

Seorang ahli statistik yang baik selalu memiliki pertimbangan yang sebanding. Ketika dia memilih prosedur yang pembenarannya didasarkan pada asumsi Normalitas, misalnya, dia menimbang sejauh mana sebenarnya mungkin berangkat dari perilaku Normal dan bagaimana hal itu dapat memengaruhi prosedur. Dalam banyak kasus, efek yang mungkin terjadi sangat kecil sehingga tidak perlu dikuantifikasi: ia "mengasumsikan Normalitas". Dalam kasus lain, kemungkinan efeknya tidak diketahui. Dalam keadaan seperti itu dia akan menjalankan tes diagnostik untuk mengevaluasi keberangkatan dari Normalitas dan efeknya pada hasilnya.F

Konsekuensi

Itu mulai terdengar seperti pengaturan yang tidak sepenuhnya akurat hampir tidak berbeda dari yang nonparametrik: apakah benar-benar ada perbedaan antara mengasumsikan model parametrik dan mengevaluasi bagaimana kenyataan berganti dari itu, satu sisi, dan mengasumsikan model non-parametrik di samping itu? Jauh di lubuk hati, keduanya bersifat non-parametrik.

Dalam terang diskusi ini, mari kita pertimbangkan kembali perbedaan konvensional antara prosedur parametrik dan non-parametrik.

  • "Prosedur non-parametrik kuat." Jadi, sampai batas tertentu, semua prosedur harus. Masalahnya bukan kekokohan vs non-kekokohan, tetapi seberapa kuat prosedur apa pun. Seberapa banyak, dan dengan cara apa, apakah sebenarnya menyimpang dari distribusi di diasumsikan ? Sebagai fungsi dari keberangkatan tersebut, seberapa besar pengaruh hasil tes? Ini adalah pertanyaan dasar yang berlaku dalam pengaturan apa pun, parametrik atau tidak.FΘ

  • "Prosedur non-parametrik tidak memerlukan pengujian good-of-fit atau pengujian distribusi." Ini umumnya tidak benar. "Non-parametrik" sering keliru dicirikan sebagai "bebas-distribusi," dalam arti memungkinkan untuk secara harfiah distribusi apa pun, tetapi ini hampir tidak pernah terjadi. Hampir semua prosedur non-parametrik membuat asumsi yang membatasi . Misalnya, dapat dibagi menjadi dua set untuk perbandingan, dengan distribusi mengatur satu set dan distribusi lain mengatur yang lain. Mungkin tidak ada asumsi yang dibuat sama sekali tentang , tetapi diasumsikan versi terjemahanFΘXF0F1F0F1F0. Itulah yang banyak diperbandingkan oleh kecenderungan kecenderungan sentral. Intinya adalah bahwa ada adalah asumsi yang pasti dibuat tentang dalam tes tersebut dan layak untuk diperiksa seperti halnya setiap asumsi parametrik mungkin.F

  • "Prosedur non-parametrik tidak membuat asumsi." Kami telah melihat bahwa mereka melakukannya. Mereka hanya cenderung membuat asumsi yang kurang membatasi daripada prosedur parametrik.

Fokus yang tidak semestinya pada parametrik vs non-parametrik mungkin merupakan pendekatan kontraproduktif. Ini mengabaikan tujuan utama dari prosedur statistik, yaitu untuk meningkatkan pemahaman, membuat keputusan yang baik, atau mengambil tindakan yang sesuai. Prosedur statistik dipilih berdasarkan seberapa baik mereka dapat diharapkan untuk melakukan dalam konteks masalah, mengingat semua informasi lain dan asumsi tentang masalah, dan berkaitan dengan konsekuensi kepada semua pemangku kepentingan dalam hasil.

Karena itu, jawaban untuk "lakukan perbedaan ini penting" tampaknya tidak benar-benar.

whuber
sumber