Saya mencoba membuat lompatan dari gagasan persentil, katakanlah, di atas garis bilangan real (di mana persentil ke-n hanyalah posisi di mana n% titik data berada di bawahnya, dan 100-n% di atasnya ), dengan gagasan daerah di bawah fungsi kepadatan probabilitas.
Jika saya ingin mengetahui persentil 50% dari satu set angka, saya akan menemukan titik di mana setengah angka di bawah, setengah angka di atas. Itu persentil 50%, dan saya selesai.
Jika saya ingin mengetahui persentil 50% dari distribusi, katakanlah, skor-Z, saya akan mengevaluasi cdf dari 0 - 50, dan saya sudah selesai. Apakah saya mengatakan ini dengan benar?
Ini terasa benar secara intuisi, tetapi saya perlu beberapa diskusi untuk memalu rumah. Atau, saya bisa benar-benar pergi ...
sumber
Tidak. Pada dasarnya, menghitung persentil (atau p-kuantil) sama dengan menemukan kebalikan dari CDF.
Perhatikan bahwa invers, dalam arti biasa, dari CDF mungkin tidak ada dan gagasan invers umum harus diperkenalkan. Untuk membuat diskusi tepat, kami mengklarifikasi semua definisi.
Definisi: CDF adalah suatu fungsiF: [ - ∞ , ∞ ] → [ 0 , 1 ]
yang memenuhi ketentuan berikut:
(Meningkat) Untuk apa punx , y∈ [ - ∞ , ∞ ] , jika x < y , kemudian
F( x ) ≤ F( y) ,
(Kontinuitas kanan) Untuk apa puna ∈ R , kita memilikinya F( a ) =limx → a +F( x ) ,
Kami memiliki setidaknya dua versi invers general dari , dilambangkan dengan dan , yang didefinisikan sebagai berikut.F sayanv1F sayanv2F
Di sini, kami mengadopsi konvensi yang .inf ( ∅ ) = ∞
Jika saya ingat dengan benar, mengingat , -quantile didefinisikan sebagai .p ∈ [ 0 , 1 ] hal sayanv1F( p )
Tentu saja, jika benar-benar meningkat dan kontinu, kedua versi invers umum adalah sama dan mengurangi ke fungsi invers yang biasaF F- 1: [ 0 , 1 ] → [ - ∞ , ∞ ] .
Untuk informasi lebih lanjut: https://people.math.ethz.ch/~embrecht/ftp/generalized_inverse.pdf
sumber