Saya telah bekerja dengan beberapa data waktu siklus proses dan penskalaan menggunakan skor-z standar untuk membandingkan antara bagian-bagian dari waktu siklus penuh.
Haruskah saya menggunakan beberapa transformasi lain karena datanya sangat miring / tidak normal? ('pencilan' tidak pernah dapat mengambil waktu negatif dan seringkali membutuhkan waktu lebih lama dari 'rata-rata')
Menggunakan z-score sepertinya masih "berfungsi" ...
###############
# R code
###############
mydata <- rweibull(1000,1,1.5)
hist(mydata)
hist(scale(mydata))
Jawaban:
Jika X sangat miring maka statistik Z tidak akan terdistribusi secara normal (atau t jika standar deviasi harus diestimasi. Jadi persentil Z tidak akan menjadi standar normal. Jadi dalam arti itu tidak berfungsi.
sumber
Kode R akan berfungsi, tetapi skor-z akan sama bermakna dengan kalimat "Anggur menelpon pulpen ringan." Ini adalah kalimat yang valid, tetapi tidak menyampaikan sesuatu yang berarti.
Dilihat oleh kode R Anda, sepertinya Anda berpikir data Anda didistribusikan Weibull. Dalam hal ini, saya hanya akan menggunakan statistik Weibull dan tidak skala apa pun kecuali Anda benar-benar harus. Meskipun skor-z diajarkan di setiap kelas statistik intro, itu tidak berarti Anda harus menggunakannya setiap saat, dan terutama tidak jika Anda tidak memiliki data simetris.
sumber
Jika populasi tidak terdistribusi secara normal. Dalam hal itu, distribusi batang (X) {mean sampel} mendekati distribusi normal sesuai teorema batas pusat; untuk ukuran sampel besar. Meskipun secara teoritis kami katakan kami menggunakan Student's-t tetapi untuk nilai n yang lebih tinggi (ukuran sampel atau tingkat kebebasan), distribusi t & distribusi Z hampir sama.
sumber
DATA ANDA TIDAK HARUS NORMAL UNTUK Z-TEST. (TOWNEND, 2002) NAMUN, VARIASI HARUS TEPAT. UNTUK MEMERIKSA YANG MELAKUKAN F-TEST PADA DATASET DUA ANDA, DAN JIKA VARIASI ANDA SESUNGGUHNYA SESUAI, HASIL UJI Z HASIL BERMANFAAT. JIKA TIDAK, TRANSFORMASI DATA.
sumber