Saat melakukan beberapa simulasi, saya menyadari bahwa sampel kuantil adalah penaksir yang bias dari kuantil yang sebenarnya. Dan, menurut simulasi saya, yang berpotensi sangat bias.
Saya terkejut dengan hasil itu karena CDF empiris tidak bias, tetapi setelah beberapa penelitian internet, saya menemukan itu benar .
Saya mencoba mencari tahu dari mana bias itu berasal, tetapi bekerja dengan sampel kuantil cukup sulit. Adakah yang memiliki demonstrasi bias itu (dan, idealnya, kuantifikasi)?
estimation
quantiles
Thomas
sumber
sumber
Jawaban:
Bias dalam memperkirakan quantiles diselidiki dengan cara bebas distribusi dip
http://www.sciencedirect.com/science/article/pii/S016771520000242X
(pdf dapat ditemukan di halaman yang sama). Penulis fokus pada estimator kuantil berdasarkan inversi ECDF. Tidak ada asumsi pada distribusi yang mendasarinya dibuat (kecuali momen kedua terbatas), dengan demikian juga distribusi diskrit disertakan.
Beberapa hal penting:
Bias sebanding dengan standar deviasi dari distribusi yang mendasariσ
Bias lebih kecil dalam kuantil pusat daripada yang ekstrim. Ini berasal dari fakta bahwa di antara semua distribusi dengan standar deviasi , bias terombang-ambing dalam interval panjang . Yang mengejutkan, ini tidak tergantung pada ukuran sampel .σ<∞ σp(1−p)√ n
Untuk , di antara semua distribusi standar (rata-rata 0, standar deviasi 1), bias terburuk dikaitkan dengan distribusi yang memiliki atom probabilitas at dan atom probabilitas di .np>3 p −(1−p)/p−−−−−−−−√ 1−p p/(1−p)−−−−−−−−√
sumber
Hanya untuk menambah posting lama ini, ECDF hanya tidak memihak pada ukuran sampel tinggi. Pada nilai rendah N itu bias. Ambil kasus sepele N = 1 dan ECDF mengambil nilai 1 pada dan di atas nilai sampel. Tanyakan pada diri sendiri apa nilai distribusi yang mendasari yang memberikan probabilitas 1?
Bias sebenarnya melebihi sqrt (2 * pi) / (2N) * SD atau 1,25 / N * SD jadi untuk N dari 5 ini adalah bias 0,25 SD.
Alih-alih ECDF berdasarkan k / N, coba (k-0,5) / N untuk mendapatkan ECDF yang tidak bias. Itu mungkin memberi Anda jumlah sampel yang tidak bias. Ini juga memastikan bahwa ECDF (x) = 1-ECDF (-x) yang dinikmati oleh semua distribusi kumulatif lainnya.
Menurut pendapat saya yang sangat sederhana, ECDF sebagaimana didefinisikan dan digunakan adalah keliru besar. Ini bias Kolmogorov Smirnov, Lilliefors dan tes standar lainnya di N. rendah
Lihat Gilchrist "Pemodelan statistik dengan Fungsi Kuantil"
sumber
Ada definisi kuantil sampel benar unik (yang bukan yang biasanya disajikan). Lihat: http://dx.doi.org/10.1155/2014/326579
sumber