Fungsi Kerugian Persentil

11

Solusi untuk masalah ini:

minmE[|mX|]

dikenal sebagai median X , tetapi seperti apa fungsi kerugian untuk persentil lainnya? Contoh: persentil X ke-25 adalah solusi untuk:

minmE[L(m,X)]

Apa L dalam kasus ini?

Cam.Davidson.Pilon
sumber

Jawaban:

12

Biarkan I menjadi fungsi indikator: itu sama dengan 1 untuk argumen benar dan 0 sebaliknya. Pilih 0<α<1 dan atur

Λα(x)=αxI(x0)(1α)xI(x<0).

Angka

Angka ini menggambarkan Λ1/5 . Ini menggunakan rasio aspek yang akurat untuk membantu Anda mengukur lereng, yang sama dengan 4/5 di sisi kiri dan +1/5 di kanan. Dalam hal ini kunjungan di atas 0 mengalami penurunan berat dibandingkan dengan kunjungan di bawah 0 .

Ini adalah fungsi alami untuk dicoba karena bobot nilai yang melebihi berbeda dari yang kurang dari . Mari kita menghitung kerugian yang terkait dan kemudian mengoptimalkannya.0 x 0x0x0

Menulis untuk fungsi distribusi dan pengaturan , hitungX L α ( m , x ) = Λ α ( x - m )FXLα(m,x)=Λα(xm)

EF(Lα(m,X))=RΛα(xm)dF(x)=αRI(xm)(xm)dF(x)(1α)R(xm)I(x<m)dF(x)=αm(xm)dF(x)(1α)m(xm)dF(x).

Gambar 2

Karena bervariasi dalam ilustrasi ini dengan distribusi Normal Standar , area tertimbang probabilitas total dari diplot. (Kurva adalah grafik .) Plot sebelah kanan untuk paling jelas menunjukkan efek menurunkan bobot nilai-nilai positif, karena tanpa menurunkan plot ini plot akan simetris tentang asalnya. Plot tengah menunjukkan yang optimal, di mana jumlah total tinta biru (mewakili ) sekecil mungkin.F Λ 1 / 5 Λ 1 / 5 ( x - m ) d F ( x ) m = 0mFΛ1/5Λ1/5(xm)dF(x)m=0EF(L1/5(m,X)) 

Fungsi ini dapat dibedakan sehingga ekstremanya dapat ditemukan dengan memeriksa titik-titik kritis. Menerapkan Aturan Rantai dan Teorema Dasar Kalkulus untuk mendapatkan turunan sehubungan dengan memberim

mEF(Lα(m,X))=α(0mdF(x))(1α)(0mdF(x))=F(m)α.

Untuk distribusi kontinu ini selalu memiliki solusi yang, menurut definisi, adalah setiap kuantil dari . Untuk distribusi non-kontinu ini mungkin tidak memiliki solusi tetapi akan ada setidaknya satu yang mana untuk semua dan untuk semua : ini juga (dengan definisi) adalah kuantil dari .α X m F ( x ) - α < 0 x < m F ( x ) - α 0 x m α XmαXmF(x)α<0x<mF(x)α0xmαX

Akhirnya, karena dan , jelas bahwa atau akan meminimalkan kehilangan ini. Itu melelahkan pemeriksaan titik-titik kritis, menunjukkan bahwa sesuai dengan tagihan.α 1 m - m Λ αα0α1mmΛα

Sebagai kasus khusus, adalah kerugian yang ditunjukkan dalam pertanyaan.EF(2L1/2(m,X))=EF(|mx|)

whuber
sumber
Saya menghargai upaya yang Anda lakukan untuk menunjukkan kerugian yang diharapkan diminimalkan pada titik yang benar . Saya ingin tahu bagaimana melakukannya sendiri untuk jawaban saya sendiri, tetapi penjelasan Anda bagus. (+1)m
2
Anda telah membuktikan bahwa gambar bernilai 1000 kata. Terima kasih @whuber =)
Cam.Davidson.Pilon
8

Artikel ini memiliki jawaban Anda. Untuk lebih spesifik, Fungsi kerugian dapat diartikan sebagai 'menyeimbangkan' wilayah massa probabilitas yang berbeda di sekitar melalui pengurangan . Untuk median, wilayah massa ini sama: menjadikan fungsi kerugian proporsional (dengan harapan konstanta diabaikan) ke yang memberikan kesimpulan yang diinginkan untuk median.

L0.25(m,X)=|(Xm)(0.251{X>m})|.
0.250.251{X>m}| X - m | ,
L0.5(m,X)=|(Xm)(0.51{X>m})|=|(Xm)×±0.5|,
|Xm|,

sumber
(+1) Bagus! - tidak jelas ke mana harus mencari artikel Wikipedia itu; Anda harus memikirkan regresi kuantil.
whuber
Terima kasih, @Matthew, ini merupakan penemuan yang bagus. Saya suka menyeimbangkan interpretasi
Cam.Davidson.Pilon
Saya masih gagal memahami. Dari mana ini berasal? Jika X di atas jumlah, mendapat bobot 0,75, jika tidak 0,25? Hanya itu? ( X - m )|(0.25)1X>m)|(Xm)
IcannotFixIni