Contoh menghitung harapan RV diskrit menggunakan Riemann-Stieltjes integral?

8

Notasi integral Riemann-Stieltjes digunakan dalam ekspresi ekspektasi dalam beberapa teks probabilitas. Pada dasarnya, dF (x) muncul dalam integral daripada f (x) dx dalam integral, karena CDF F (x) mungkin tidak dapat dibedakan untuk distribusi diskrit.

Motivasi yang saya dengar untuk ini biasanya untuk memberikan definisi harapan yang terpadu daripada memperlakukannya dengan kasus diskrit dan kasus kontinu. Hal ini juga dimaksudkan untuk membuatnya lebih mudah untuk memikirkan campuran diskrit dan kontinu. Tetapi saya belum pernah melihat contoh penghitungan ekspektasi dengan integral Riemann-Stieltjes untuk distribusi diskrit (atau untuk distribusi yang merupakan campuran titik-massa dan distribusi kontinu).

Bisakah seseorang memberikan contoh keduanya atau salah satunya? Terima kasih!

frelk
sumber
3
Sebuah pencarian dari situs kami untuk "Stieltjes" akan muncul contoh. Misalnya, saya menghitung integral seperti itu di stats.stackexchange.com/a/108220 . (Meskipun saya menyebutnya sebagai integral Legesgue-Stieltjes di sana, generalisasi itu tidak diperlukan dan perhitungannya jelas bekerja untuk integral Riemann-Stieltjes.) Contoh khusus tersebut menyangkut distribusi yang tidak kontinu maupun diskrit.
whuber

Jawaban:

12

Karena Anda tidak terdengar seperti Anda telah melakukan banyak hal dengan integral, saya akan membahas ini dengan cara yang sangat dasar (dan sedikit handwavy) yang harus menyampaikan sesuatu tentang apa yang terjadi. Namun, Anda mungkin ingin memulai dengan pengingat, dengan melihat definisi integral Stieltjes, lihat, misalnya Mathworld atau Wikipedia . Melakukan integral dengan baik melibatkan mempertimbangkan batasan dalam definisi, dan pada kesempatan di mana hal itu tidak jelas, itulah yang benar-benar perlu Anda lakukan.

Jika distribusinya murni diskrit maka adalah 0 kecuali pada lompatan, di mana - jadi untuk kasus diskrit integral adalah jumlah yang biasa.dFp(x)

Sama seperti contoh, pertimbangkan Bernoulli (0,4).

! [masukkan deskripsi gambar di sini

Jadi untuk contoh ini, . (Itu bukan hanya "mereka sama nilainya" tetapi "hal-hal itu adalah cara berbeda untuk mengekspresikan hal yang sama"; Saya mungkin harus menggunakan simbol yang lebih tepat.)E(X)=xdF=xxp(x)

Jadi di sini adalah mana-mana tetapi pada (di mana adalah ) dan (di mana itu ). Jadi ungkapan itu hanya .dF0x=0dF0.6x=10.400.6+10.4

Meskipun formula yang menyatu dan terus menerus menyatu rapi, itu tidak benar-benar di mana sebagian besar nilainya masuk ke pikiran saya. Saya melihat lebih banyak nilai dalam kenyataan bahwa itu berlaku untuk kasus-kasus di mana Anda tidak memiliki variabel acak diskrit atau kontinu - dan ada banyak contoh di mana itu adalah sesuatu yang Anda temui dengan data aktual, jadi itu bukan masalah teoritis esoterik. Memiliki notasi yang dapat dengan lancar menangani kasus-kasus "baik diskrit maupun kontinu" serta dengan kasus khusus diskrit dan kontinu semuanya pada saat yang sama, di situlah terdapat beberapa manfaat nyata.

Ambil contoh sederhana yang tidak ada, misalnya, distribusi curah hujan harian untuk bulan dan lokasi tertentu, mungkin dimodelkan sebagai campuran probabilitas dari nol hujan, dan jumlah hujan bukan nol adalah lognormal (di mana , dan ) (yang mungkin disebut sebagai model "lognormal berlipat nol")0.6(μ,σ2)μ=1.384σ=1.823

masukkan deskripsi gambar di sini

Maka dalam hal ini, integral seperti itu untuk ekspektasi, dapat ditangani dengan cukup mudah, karena ia bekerja seperti definisi diskrit naik ke dan pada lompatan itu (hanya menambahkan pada lompatan, yang ternyata menambahkan ke integral, karena semua probabilitas itu pada ) dan kemudian dalam hal ini di mana-mana di atas (karena fungsinya adalah cukup bagus sehingga Stieltjes sama dengan Riemann biasa) sisanya berfungsi seperti integral Riemann dari atas , selama kita ingat bahwa lebih kecil daripada lognormal (di atasE(X)=xdFx.p(x)00.6x=00xf(x)0dF0Anda dapat melihat "diperas" relatif terhadap cdf murni-lognormal), tepatnya memperhitungkan probabilitas ( ) melebihi sini.F0.40

Tentu saja, ini bekerja dengan baik untuk lebih dari sekedar ; Saya hanya membawa kasing sederhana untuk menunjukkan apa yang sedang terjadi. (Whuber menunjuk contoh yang bagus dalam komentar, di mana ia melakukan perhitungan MGF untuk masalah yang tidak sederhana, di mana distribusi berakhir sebagai distribusi campuran)g(x)=x

Bahkan hanya dengan fungsi-fungsi yang sangat bagus ini (di mana Anda dapat memperlakukannya seperti Riemann di mana mereka kontinu, yang merupakan bagian dari kasus-kasus yang dicakup oleh Stieltjes) ada banyak kasus dalam campuran seperti itu (bukan hanya 'diskrit' atau 'kontinu' ) yang dapat ditangani oleh notasi yang satu ini.

Referensi yang berguna yang menggunakan integral ini secara luas untuk menunjukkan atau mendiskusikan berbagai hasil adalah Teori Statistik Lanjut (Kendall dan Stuart - atau dalam edisi yang lebih baru, Stuart dan Ord). Jangan biarkan judul itu membuat Anda takut, itu buku yang sangat mudah dibaca.

Jadi jika Anda (misalnya) bermain-main dengan integral sambil melihat katakanlah ketidaksetaraan Chebyshev, Anda tidak hanya melakukan kasing disk dan kasing kontinu pada saat yang sama ... Anda sedang meliput distribusi apa pun yang dipadukan oleh integral Stieltjes untuk - jadi jika Anda bertanya-tanya tentang apa yang terjadi di Chebyshev jika Anda memiliki distribusi seperti mengatakan bahwa curah hujan satu, lihatlah, semuanya ditangani oleh perkembangan yang sama. Dan jika besok, teman Anda muncul dengan beta nol-satu yang digelembungkan, Anda sudah membahasnya juga. Dan seterusnya ...

[Jika Anda masuk ke situasi di mana Anda tidak bisa langsung melihat apa arti integralnya, kembali ke definisi dan ikuti terus.]

(Integral yang bagus ini dapat digantikan oleh hal-hal yang mampu menangani situasi yang lebih luas - untuk tujuan statistik, umumnya ke integral Lebesgue atau Lesbesgue-Stieltjes )

Glen_b -Reinstate Monica
sumber
1
Terima kasih, itu sangat membantu. Contoh apa pun dari kasus "baik diskrit maupun kontinu" akan sangat dihargai, karena ini tampaknya merupakan bagian terbesar dari nilai notasi ini (sering kali tidak tepat).
frelk