Demonstrasi sampel bias kuantitatif

8

Saat melakukan beberapa simulasi, saya menyadari bahwa sampel kuantil adalah penaksir yang bias dari kuantil yang sebenarnya. Dan, menurut simulasi saya, yang berpotensi sangat bias.

Saya terkejut dengan hasil itu karena CDF empiris tidak bias, tetapi setelah beberapa penelitian internet, saya menemukan itu benar .

Saya mencoba mencari tahu dari mana bias itu berasal, tetapi bekerja dengan sampel kuantil cukup sulit. Adakah yang memiliki demonstrasi bias itu (dan, idealnya, kuantifikasi)?

Thomas
sumber
2
ECDF tidak memihak untuk cdf tetapi bagaimana Anda akan mendapatkan dari ECDF ke sampel kuantil?
Glen_b -Reinstate Monica
3
Tidak ada yang namanya "sampel kuantil". Ada banyak definisi kuantil sampel. Anda harus menentukan yang mana yang Anda maksud.
Rob Hyndman

Jawaban:

3

Bias dalam memperkirakan quantiles diselidiki dengan cara bebas distribusi dip

http://www.sciencedirect.com/science/article/pii/S016771520000242X

(pdf dapat ditemukan di halaman yang sama). Penulis fokus pada estimator kuantil berdasarkan inversi ECDF. Tidak ada asumsi pada distribusi yang mendasarinya dibuat (kecuali momen kedua terbatas), dengan demikian juga distribusi diskrit disertakan.

Beberapa hal penting:

  • Bias sebanding dengan standar deviasi dari distribusi yang mendasariσ

  • Bias lebih kecil dalam kuantil pusat daripada yang ekstrim. Ini berasal dari fakta bahwa di antara semua distribusi dengan standar deviasi , bias terombang-ambing dalam interval panjang . Yang mengejutkan, ini tidak tergantung pada ukuran sampel .σ<σp(1p)n

  • Untuk , di antara semua distribusi standar (rata-rata 0, standar deviasi 1), bias terburuk dikaitkan dengan distribusi yang memiliki atom probabilitas at dan atom probabilitas di .np>3p(1p)/p1pp/(1p)

Michael M.
sumber
1

Hanya untuk menambah posting lama ini, ECDF hanya tidak memihak pada ukuran sampel tinggi. Pada nilai rendah N itu bias. Ambil kasus sepele N = 1 dan ECDF mengambil nilai 1 pada dan di atas nilai sampel. Tanyakan pada diri sendiri apa nilai distribusi yang mendasari yang memberikan probabilitas 1?

Bias sebenarnya melebihi sqrt (2 * pi) / (2N) * SD atau 1,25 / N * SD jadi untuk N dari 5 ini adalah bias 0,25 SD.

Alih-alih ECDF berdasarkan k / N, coba (k-0,5) / N untuk mendapatkan ECDF yang tidak bias. Itu mungkin memberi Anda jumlah sampel yang tidak bias. Ini juga memastikan bahwa ECDF (x) = 1-ECDF (-x) yang dinikmati oleh semua distribusi kumulatif lainnya.

Menurut pendapat saya yang sangat sederhana, ECDF sebagaimana didefinisikan dan digunakan adalah keliru besar. Ini bias Kolmogorov Smirnov, Lilliefors dan tes standar lainnya di N. rendah

Lihat Gilchrist "Pemodelan statistik dengan Fungsi Kuantil"

pengguna2092957
sumber
1
Ini adalah poin yang menarik, tetapi secara teknis, ECDF tidak bias! Anda merujuk pada fakta bahwa, katakanlah, setelah melihat bahwa ECDF (x) = 1, Anda tahu kesalahan hanya dapat memiliki satu tanda, sehingga Anda memiliki bias semacam kondisional. Tetapi sifat ketidakberpihakan yang kerap merujuk pada situasi sebelum melihat data apa pun, bukan bias kondisional yang Anda rujuk.
kjetil b halvorsen
0

Ada definisi kuantil sampel benar unik (yang bukan yang biasanya disajikan). Lihat: http://dx.doi.org/10.1155/2014/326579

pengguna153836
sumber
Artikel ini menarik tetapi banyak pembaca akan mendapat manfaat dari ringkasan argumen dan mengapa banyak definisi yang ada salah arah.
mdewey