Bisakah saya menggunakan skor-Z dengan data yang miring dan tidak normal? [Tutup]

12

Ditutup . Pertanyaan ini membutuhkan detail atau kejelasan . Saat ini tidak menerima jawaban.

Ingin meningkatkan pertanyaan ini? Tambahkan detail dan jelaskan masalahnya dengan mengedit posting ini .

Ditutup 5 tahun yang lalu .

Saya telah bekerja dengan beberapa data waktu siklus proses dan penskalaan menggunakan skor-z standar untuk membandingkan antara bagian-bagian dari waktu siklus penuh.

Haruskah saya menggunakan beberapa transformasi lain karena datanya sangat miring / tidak normal? ('pencilan' tidak pernah dapat mengambil waktu negatif dan seringkali membutuhkan waktu lebih lama dari 'rata-rata')

Menggunakan z-score sepertinya masih "berfungsi" ...

###############
# R code    
###############
mydata <- rweibull(1000,1,1.5)
hist(mydata)
hist(scale(mydata))

normality-assumption standardization weibull TMOD
sumber

5

z

$z$

z

$z$

5

Jika X sangat miring maka statistik Z tidak akan terdistribusi secara normal (atau t jika standar deviasi harus diestimasi. Jadi persentil Z tidak akan menjadi standar normal. Jadi dalam arti itu tidak berfungsi.

Michael R. Chernick
sumber

Untuk pemahaman saya, X yang sangat condong berarti ukuran sampel tidak cukup besar (teorema batas pusat). Namun saya tidak yakin, apakah populasi itu sendiri harus normal, agar statistik Z berfungsi. Melakukannya?

Andrzej Gis

1

OP berbicara tentang distribusi populasi dan bukan distribusi mean. Jadi ukuran sampel dan teorema batas pusat tidak berlaku.

Michael R. Chernick

2

Kode R akan berfungsi, tetapi skor-z akan sama bermakna dengan kalimat "Anggur menelpon pulpen ringan." Ini adalah kalimat yang valid, tetapi tidak menyampaikan sesuatu yang berarti.

Dilihat oleh kode R Anda, sepertinya Anda berpikir data Anda didistribusikan Weibull. Dalam hal ini, saya hanya akan menggunakan statistik Weibull dan tidak skala apa pun kecuali Anda benar-benar harus. Meskipun skor-z diajarkan di setiap kelas statistik intro, itu tidak berarti Anda harus menggunakannya setiap saat, dan terutama tidak jika Anda tidak memiliki data simetris.

Brandon Sherman
sumber

1

Jika populasi tidak terdistribusi secara normal. Dalam hal itu, distribusi batang (X) {mean sampel} mendekati distribusi normal sesuai teorema batas pusat; untuk ukuran sampel besar. Meskipun secara teoritis kami katakan kami menggunakan Student's-t tetapi untuk nilai n yang lebih tinggi (ukuran sampel atau tingkat kebebasan), distribusi t & distribusi Z hampir sama.

Arpan Halder
sumber

-4

DATA ANDA TIDAK HARUS NORMAL UNTUK Z-TEST. (TOWNEND, 2002) NAMUN, VARIASI HARUS TEPAT. UNTUK MEMERIKSA YANG MELAKUKAN F-TEST PADA DATASET DUA ANDA, DAN JIKA VARIASI ANDA SESUNGGUHNYA SESUAI, HASIL UJI Z HASIL BERMANFAAT. JIKA TIDAK, TRANSFORMASI DATA.

pengguna24546
sumber

9

Pertanyaannya adalah tentang transformasi variabel bukan tes, jadi saya tidak berpikir jawaban Anda berlaku. Juga, mungkin lebih informatif jika Anda memberikan referensi lengkap, bukan hanya referensi nama-tahun dan beberapa orang keberatan terhadap SHOUTING.

Maarten Buis

Saya setuju dengan @MaartenBuis tetapi tidak seperti dia saya akan menurunkan ini.

Erik

Bisakah saya menggunakan skor-Z dengan data yang miring dan tidak normal? [Tutup]

Jawaban: