Bagaimana saya bisa menghitung interval kepercayaan rata-rata dalam sampel yang terdistribusi tidak normal?
Saya mengerti metode bootstrap yang biasa digunakan di sini, tetapi saya terbuka untuk opsi lain. Sementara saya mencari opsi non-parametrik, jika seseorang dapat meyakinkan saya bahwa solusi parametrik valid, itu akan baik-baik saja. Ukuran sampel> 400.
Kalau ada yang bisa memberikan sampel dalam R itu akan sangat dihargai.
Jawaban:
Pertama-tama, saya akan memeriksa apakah mean adalah indeks yang tepat untuk tugas yang dihadapi. Jika Anda mencari "nilai tipikal / atau sentral" dari distribusi miring, mean mungkin mengarahkan Anda ke nilai yang agak tidak representatif. Pertimbangkan distribusi log-normal:
Rerata (garis merah) agak jauh dari sebagian besar data. 20% rata-rata yang dipangkas (hijau) dan median (biru) lebih dekat dengan nilai "tipikal".
Hasilnya tergantung pada jenis distribusi "tidak normal" Anda (histogram dari data aktual Anda akan sangat membantu). Jika tidak miring, tetapi memiliki ekor yang berat, CI Anda akan sangat lebar.
Bagaimanapun, saya pikir bootstrap memang merupakan pendekatan yang baik, karena juga dapat memberi Anda CI asimetris. The
R
paketsimpleboot
adalah awal yang baik:... memberi Anda hasil berikut:
sumber
kappa = (exp(1)+2)*sqrt( exp(1) - 1) = 6.184877
s = sqrt( (exp(1)-1)*exp(1) ) = 2.161197
2*s*qnorm(0.975)/sqrt(n) = 0.2678999
kappa*s/(6*n) = 0.00222779
kappa
sumber
Coba distribusi log-normal, hitung:
Anda akan berakhir dengan interval kepercayaan asimetris di sekitar nilai yang diharapkan (yang bukan berarti dari data mentah).
sumber