Tes seperti Z, t, dan beberapa lainnya mengasumsikan bahwa data didasarkan pada pengambilan sampel acak. Mengapa?
Misalkan saya sedang melakukan penelitian eksperimental, di mana saya lebih peduli untuk validitas internal daripada yang eksternal. Jadi, jika sampel saya mungkin sedikit bias, oke, karena saya telah menerima untuk tidak menyimpulkan hipotesis untuk seluruh populasi. Dan pengelompokan akan tetap acak, yaitu, saya akan memilih untuk kenyamanan peserta sampel, tetapi saya akan secara acak menugaskan mereka ke kelompok yang berbeda.
Mengapa saya tidak bisa mengabaikan asumsi ini?
Jawaban:
Jika Anda tidak membuat kesimpulan untuk kelompok yang lebih luas dari sampel Anda yang sebenarnya, maka tidak ada aplikasi tes statistik di tempat pertama, dan pertanyaan "bias" tidak muncul. Dalam hal ini Anda hanya akan menghitung statistik deskriptif dari sampel Anda, yang diketahui. Demikian pula, tidak ada pertanyaan tentang model "validitas" dalam kasus ini - Anda hanya mengamati variabel dan mencatat nilainya, dan deskripsi aspek dari nilai-nilai tersebut.
Setelah Anda memutuskan untuk melampaui sampel Anda, untuk membuat kesimpulan tentang beberapa kelompok yang lebih besar, maka Anda akan memerlukan statistik dan Anda perlu mempertimbangkan masalah-masalah seperti bias pengambilan sampel, dll. Dalam aplikasi ini, pengambilan sampel acak menjadi properti yang berguna untuk membantu mendapatkan keandalan. kesimpulan dari kelompok kepentingan yang lebih luas. Jika Anda tidak memiliki pengambilan sampel acak (dan Anda tidak tahu probabilitas sampel Anda berdasarkan populasi) maka menjadi sulit / tidak mungkin untuk membuat kesimpulan yang dapat diandalkan tentang populasi.
sumber
Dalam penelitian ilmiah sungguhan, sangat jarang memiliki data yang berasal dari true random sampling. Data hampir selalu merupakan sampel kenyamanan. Ini terutama memengaruhi populasi yang dapat Anda generalisasikan. Yang mengatakan, bahkan jika mereka adalah sampel kenyamanan, mereka memang datang dari suatu tempat, Anda hanya perlu jelas tentang di mana dan batasan-batasan yang menyiratkan. Jika Anda benar-benar percaya bahwa data Anda tidak mewakili apa pun, maka studi Anda tidak akan bermanfaat pada level apa pun, tetapi itu mungkin tidak benar 1 . Dengan demikian, sering kali masuk akal untuk menganggap sampel Anda diambil dari suatu tempat dan menggunakan tes standar ini, setidaknya dalam pengertian lindung nilai atau kualifikasi.
Namun, ada filosofi pengujian yang berbeda, yang berpendapat bahwa kita harus menjauh dari asumsi-asumsi itu dan tes yang bergantung padanya. Tukey adalah pendukung ini. Sebaliknya, sebagian besar penelitian eksperimental dianggap (secara internal) valid karena unit studi (misalnya, pasien) secara acak ditugaskan ke lengan. Dengan ini, Anda dapat menggunakan tes permutasi , yang sebagian besar hanya menganggap pengacakan dilakukan dengan benar. Pertimbangan yang terlalu mengkhawatirkan tentang hal ini adalah bahwa tes permutasi biasanya akan menunjukkan hal yang sama dengan tes klasik yang sesuai, dan lebih banyak pekerjaan yang harus dilakukan. Jadi sekali lagi, tes standar dapat diterima.
1. Untuk lebih lanjut di bawah ini, mungkin membantu untuk membaca jawaban saya di sini: Mengidentifikasi populasi dan sampel dalam suatu penelitian .
sumber
Tes seperti Z, t, dan beberapa lainnya didasarkan pada distribusi sampling yang diketahui dari statistik yang relevan. Distribusi sampling tersebut, seperti yang umumnya digunakan, didefinisikan untuk statistik yang dihitung dari sampel acak.
Terkadang dimungkinkan untuk merancang distribusi pengambilan sampel yang relevan untuk pengambilan sampel non-acak, tetapi secara umum itu mungkin tidak mungkin.
sumber