Hitung kuantil jumlah distribusi dari kuantil tertentu

9

Mari kita asumsikan variabel acak independen yang pada tingkat tertentu diketahui melalui estimasi dari data: , ..., . Sekarang mari kita mendefinisikan variabel acak sebagai jumlah . Apakah ada cara untuk menghitung nilai kuantil dari jumlah pada level , yaitu, di ?NX1,...,XNαα=P(X1<q1)α=P(XN<qN)ZZ=i=1NXiαqzα=P(Z<qZ)

Saya berpikir bahwa dalam kasus-kasus tertentu, seperti jika mengikuti distribusi Gaussian ini mudah, tapi aku tidak begitu yakin untuk kasus di mana distribusi tidak diketahui. Ada ide?XiiXi

albarji
sumber
1
apakah ini diperkirakan dari data atau diketahui secara teoritis? qi
chuse
Hal ini tidak mungkin tanpa membuat asumsi tertentu tentang distribusi dari . Apakah Anda memiliki keluarga distribusi dalam pikiran? Xi
whuber
@ chuse the diperkirakan dari data, karena distribusi tidak diketahui tetapi sampel tersedia. Saya telah memperbarui pertanyaan dengan fakta ini. X iqiXi
albarji
@whuber Saya tidak memiliki pengetahuan sebelumnya tentang keluarga distribusi yang mungkin oleh , meskipun sampel data tersedia. Apakah dengan asumsi keluarga distribusi (selain dari Gaussian) membuat ini lebih mudah? Xi
albarji

Jawaban:

4

qZ bisa apa saja.


Untuk memahami situasi ini, mari kita buat penyederhanaan awal. Dengan bekerja dengan kita memperoleh karakterisasi yang lebih seragamYi=Xiqi

α=Pr(Xiqi)=Pr(Yi0).

Artinya, setiap memiliki probabilitas yang sama untuk menjadi negatif. KarenaYi

W=iYi=iXiiqi=Ziqi,

persamaan mendefinisikan untuk sama denganqZ

α=Pr(ZqZ)=Pr(ZiqiqZiqi)=Pr(WqW)

dengan .qZ=qW+iqi


Apa nilai yang mungkin dari ? Pertimbangkan kasus di mana semuanya memiliki distribusi yang sama dengan semua probabilitas pada dua nilai, satu di antaranya negatif ( ) dan yang lainnya positif ( ). Nilai yang mungkin dari jumlah terbatas pada untuk . Masing-masing terjadi dengan probabilitasY i y - y + W k y - + ( n - k ) y + k = 0 , 1 , , nqWYiyy+Wky+(nk)y+k=0,1,,n

PrW(ky+(nk)y+)=(nk)αk(1α)nk.

Ekstrem dapat ditemukan oleh

  1. Memilih dan sehingga ; dan akan mencapai ini. Ini menjamin bahwa akan negatif kecuali ketika semua positif. Kesempatan ini sama dengan . Itu melebihi ketika , menyiratkan quantile dari harus benar-benar negatif. y + y - + ( n - 1 ) y + < 0 y - = - n y + = 1 W Y i 1 - ( 1 - α ) n α n > 1 α Wyy+y+(n1)y+<0y=ny+=1WYi1(1α)nαn>1αW

  2. Memilih dan sehingga ; dan akan mencapai ini. Ini menjamin bahwa akan menjadi negatif hanya ketika semua negatif. Kesempatan ini sama dengan . Itu kurang dari ketika , menyiratkan quantile dari harus benar-benar positif. y + ( n - 1 ) y - + y + > 0 y - = - 1 y + = n W Y i α n α n > 1 α Wyy+(n1)y+y+>0y=1y+=nWYiαnαn>1αW

Ini menunjukkan bahwa quantile dari dapat berupa negatif atau positif, tetapi tidak nol. Berapa ukurannya? Itu harus sama dengan beberapa kombinasi linear integral dari dan . Membuat kedua nilai integer ini memastikan semua nilai adalah integral. Setelah skala oleh angka positif sewenang-wenang , kami dapat menjamin bahwa semua kombinasi linear integral dari dan merupakan kelipatan integral dari . Sejak , itu harus setidaknya dalam ukuran . Karena itu,W y - y + W y ± s y - y + s q W0 s q W q Z n > 1αWyy+Wy±syy+sqW0snilai yang mungkin dari (dan dari mana ) tidak terbatas,qWqZ tidak peduli apa dapat sama.n>1


Satu- satunya cara untuk memperoleh informasi tentang adalah dengan membuat batasan spesifik dan kuat pada distribusi , untuk mencegah dan membatasi jenis distribusi tidak seimbang yang digunakan untuk memperoleh hasil negatif ini.X iqZXi

whuber
sumber
Terima kasih banyak @whuber, untuk penjelasan dan contoh ilustrasinya. Meskipun jawabannya negatif, saya tidak bisa mengatakan ini tidak terduga. Kemudian saya akan mencoba mencari tahu keluarga distribusi mana yang cocok dengan data saya dan melihat apakah dengan itu saya bisa menghitung jumlah.
albarji