Bagaimana cara menguji perbedaan antara dua kelompok berarti ketika data tidak terdistribusi secara normal?

19

Saya akan menghilangkan semua detail biologis dan eksperimen dan hanya mengutip masalah yang ada dan apa yang telah saya lakukan secara statistik. Saya ingin tahu apakah itu benar, dan jika tidak, bagaimana melanjutkan. Jika data (atau penjelasan saya) tidak cukup jelas, saya akan mencoba menjelaskan lebih baik dengan mengedit.

Misalkan saya memiliki dua kelompok / pengamatan, X dan Y, dengan ukuran dan . Saya ingin tahu apakah cara kedua pengamatan ini sama. Pertanyaan pertama saya adalah:N y = 40Nx=215Ny=40

  1. Jika asumsi puas, apakah relevan untuk menggunakan uji t dua sampel parametrik di sini? Saya bertanya ini karena dari pemahaman saya biasanya diterapkan ketika ukurannya kecil?

  2. Saya merencanakan histogram baik X dan Y dan mereka tidak terdistribusi secara normal, salah satu asumsi dari uji-t dua sampel. Kebingungan saya adalah, saya menganggap mereka sebagai dua populasi dan itu sebabnya saya memeriksa distribusi normal. Tapi kemudian saya akan melakukan uji-dua SAMPEL ... Apakah ini benar?

  3. Dari teorema limit pusat, saya mengerti bahwa jika Anda melakukan pengambilan sampel (dengan / tanpa pengulangan tergantung pada ukuran populasi Anda) beberapa kali dan menghitung rata-rata sampel setiap kali, maka itu akan didistribusikan secara normal. Dan, rata-rata dari variabel acak ini akan menjadi estimasi yang baik dari rata-rata populasi. Jadi, saya memutuskan untuk melakukan ini pada X dan Y, 1000 kali, dan memperoleh sampel, dan saya menetapkan variabel acak ke rata-rata setiap sampel. Plotnya terdistribusi normal. Rerata X dan Y adalah 4.2 dan 15.8 (yang sama dengan populasi + - 0.15) dan variansnya adalah 0.95 dan 12.11.
    Saya melakukan uji-t pada dua pengamatan ini (masing-masing 1000 poin data) dengan varians yang tidak sama, karena mereka sangat berbeda (0,95 dan 12,11). Dan hipotesis nol ditolak.
    Apakah ini masuk akal? Apakah pendekatan ini benar / bermakna atau uji-dua sampel cukup atau benar-benar salah?

  4. Saya juga melakukan tes Wilcoxon non-parametrik hanya untuk memastikan (pada X asli dan Y) dan hipotesis nol ditolak dengan meyakinkan di sana juga. Jika metode saya sebelumnya benar-benar salah, saya kira melakukan tes non-parametrik baik, kecuali kekuatan statistik mungkin?

Dalam kedua kasus tersebut, rata-rata berbeda nyata. Namun, saya ingin tahu apakah salah satu atau kedua pendekatan tersebut salah / benar-benar salah dan jika demikian, apa alternatifnya?

Arun
sumber

Jawaban:

21

Gagasan bahwa uji-t hanya untuk sampel kecil adalah pegangan sejarah. Ya itu pada awalnya dikembangkan untuk sampel kecil, tetapi tidak ada dalam teori yang membedakan kecil dari besar. Pada hari-hari sebelum komputer adalah umum untuk melakukan statistik t-tabel sering hanya naik sekitar 30 derajat kebebasan dan normal digunakan di luar itu sebagai perkiraan dekat distribusi t. Ini untuk kenyamanan agar ukuran t-tabel masuk akal. Sekarang dengan komputer kita dapat melakukan uji-t untuk ukuran sampel apa pun (meskipun untuk sampel yang sangat besar perbedaan antara hasil uji-z dan uji-t sangat kecil). Gagasan utamanya adalah menggunakan uji-t ketika menggunakan sampel untuk memperkirakan standar deviasi dan uji-z jika standar deviasi populasi diketahui (sangat jarang).

Teorema Limit Sentral memungkinkan kita menggunakan inferensi teori normal (uji-t dalam kasus ini) bahkan jika populasi tidak terdistribusi normal selama ukuran sampel cukup besar. Ini berarti bahwa pengujian Anda merupakan perkiraan (tetapi dengan ukuran sampel Anda, penilaiannya harus sangat baik).

Tes Wilcoxon bukan tes sarana (kecuali Anda tahu bahwa populasinya simetris sempurna dan asumsi tidak mungkin lainnya berlaku). Jika mean adalah poin utama yang menarik maka uji-t mungkin adalah yang terbaik untuk dikutip.

Mengingat standar deviasi Anda sangat berbeda, dan bentuknya tidak normal dan mungkin berbeda satu sama lain, perbedaan dalam cara mungkin bukan hal yang paling menarik yang terjadi di sini. Pikirkan tentang sains dan apa yang ingin Anda lakukan dengan hasil Anda. Apakah keputusan dibuat pada tingkat populasi atau tingkat individu? Pikirkan contoh ini: Anda membandingkan 2 obat untuk penyakit tertentu, pada obat Setengah sampel meninggal dengan segera setengah lainnya pulih dalam waktu sekitar satu minggu; pada obat B semua selamat dan pulih, tetapi waktu untuk pemulihan lebih dari satu minggu. Dalam hal ini apakah Anda benar-benar peduli yang berarti waktu pemulihan lebih singkat? Atau ganti setengah mati di A dengan hanya mengambil waktu yang sangat lama untuk pulih (lebih lama daripada siapa pun dalam kelompok B).

Greg Snow
sumber
Greg terima kasih. Saya berasumsi tidak ada yang salah dengan prosedur itu sendiri? Saya mengerti bahwa saya mungkin tidak mengajukan pertanyaan yang tepat, tetapi perhatian saya sama tentang uji statistik / prosedur dan pemahaman itu sendiri diberikan dua sampel. Saya akan memeriksa apakah saya mengajukan pertanyaan yang tepat dan kembali dengan pertanyaan, jika ada. Mungkin jika saya menjelaskan masalah biologisnya, itu akan membantu dengan lebih banyak saran. Terima kasih lagi.
Arun
5

Satu tambahan untuk jawaban Greg sudah sangat komprehensif.

Jika saya memahami Anda dengan cara yang benar, poin 3 Anda menyatakan prosedur berikut:

  • Amati sampel dari distribusi .XnX
  • Kemudian, menarik dari mereka nilai-nilai dan menghitung rata-rata mereka.nmn
  • Ulangi ini 1000 kali, simpan cara yang sesuai
  • Akhirnya, hitung rata-rata dari rata-rata tersebut dan asumsikan bahwa rata-rata sama dengan rata-rata yang dihitung dengan cara itu.X

Sekarang asumsi Anda adalah, bahwa untuk ini berarti teorema limit pusat berlaku dan variabel acak yang sesuai akan terdistribusi secara normal.

Mungkin mari kita lihat matematika di balik perhitungan Anda untuk mengidentifikasi kesalahan:

Kami akan memanggil sampel dari , atau, dalam terminologi statistik, Anda memiliki . Sekarang, kita menggambar sampel ukuran dan menghitung rata-rata mereka. Huruf dari sarana tersebut terlihat seperti ini:X 1 , ... , X n X 1 , ... , X nX m kX X1,,XnX1,,XnXmk

Yk=1mi=1mXμik

di mana menunjukkan nilai antara 1 dan yang telah ditarik pada saat menggambar . Menghitung nilai rata-rata dari semua nilai tersebut akan menghasilkan n iμikni

11000k=110001mi=1mXμik

Untuk menyisakan Anda terminologi matematika yang tepat, lihat saja jumlah ini. Yang terjadi adalah bahwa baru saja ditambahkan beberapa kali ke penjumlahan. Semua dalam semua, Anda menambahkan hingga angka dan membaginya dengan . Bahkan, Anda menghitung rata-rata tertimbang dari dengan bobot acak. 1000 m 1000 m X iXi1000m1000mXi

Namun, sekarang, Teorema Limit Sentral menyatakan bahwa jumlah dari banyak variabel acak independen adalah mendekati normal. (Yang menghasilkan juga kira-kira rata-rata normal).

Jumlah Anda di atas tidak menghasilkan sampel independen. Anda mungkin memiliki bobot acak, tetapi itu tidak membuat sampel Anda independen sama sekali. Dengan demikian, prosedur yang ditulis dalam 3 ini tidak sah.

Namun, seperti yang sudah dinyatakan Greg, menggunakan uji- pada data asli Anda mungkin kira-kira benar - jika Anda benar-benar tertarik pada nilai rata-rata.t

Thilo
sumber
Terima kasih. Tampaknya uji-t sudah menangani masalah menggunakan CLT (dari balasan greg yang saya abaikan). Terima kasih telah menunjukkan itu dan untuk penjelasan yang jelas dari 3) yang sebenarnya ingin saya ketahui. Saya harus menginvestasikan lebih banyak waktu untuk memahami konsep-konsep ini.
Arun
2
Perlu diingat bahwa CLT berkinerja berbeda dengan baik tergantung pada distribusi yang ada (atau, lebih buruk lagi, nilai yang diharapkan atau varian dari distribusi tidak ada - maka CLT bahkan tidak valid). Jika ragu, selalu merupakan ide bagus untuk menghasilkan distribusi yang terlihat mirip dengan yang Anda amati dan kemudian mensimulasikan pengujian Anda menggunakan distribusi ini beberapa ratus kali. Anda akan merasakan kualitas perkiraan persediaan CLT.
Thilo