Bagaimana misalnya distribusi Gamma menyimpang mendekati nol (untuk seperangkat skala dan parameter bentuk yang sesuai, katakanlah bentuk dan skala ), dan masih memiliki luas yang sama dengan satu?
Seperti yang saya pahami, area distribusi kepadatan probabilitas harus selalu sama dengan satu. Jika Anda mengambil distribusi dirac delta, yang menyimpang dari nol tetapi nol di tempat lain, Anda memiliki luas yang sama dengan satu.
Entah bagaimana, jika Anda akan mengambil area distribusi Gamma yang berbeda, Anda dapat mengekspresikannya sebagai area distribusi dirac delta, ditambah sesuatu yang lebih karena memiliki bobot bukan nol pada , jadi itu akan lebih besar dari satu.
Adakah yang bisa menjelaskan mengapa alasan saya salah?
probability
distributions
Delphine
sumber
sumber
Jawaban:
Di situlah alasan Anda salah: Anda tidak dapat secara otomatis mengekspresikan fungsi apa pun yang tak terbatasx = 0 sebagai distribusi delta plus sesuatu yang lebih. Lagi pula, jika Anda bisa melakukan ini denganδ(x ) , siapa bilang Anda tidak bisa melakukannya dengan 2 δ( x) ? Atau10- 10δ( x ) ? Atau koefisien lainnya? Sama validnya dengan mengatakan bahwa distribusi itu nol untukx ≠ 0 dan tak terbatas pada x = 0 ; mengapa tidak menggunakan alasan yang sama dengan mereka?
Sebenarnya, distribusi (dalam arti matematika dari teori distribusi) harus dianggap lebih mirip fungsi fungsi - Anda memasukkan fungsi dan keluar nomor. Untuk distribusi delta secara khusus, jika Anda memasukkan fungsif , kamu keluar nomornya f( 0 ) . Distribusi bukanlah fungsi angka-ke-angka yang normal. Mereka lebih rumit, dan lebih mampu, daripada fungsi "biasa" seperti itu.
Gagasan mengubah fungsi menjadi angka cukup akrab bagi siapa saja yang terbiasa berurusan dengan probabilitas. Sebagai contoh, rangkaian momen distribusi - mean, standar deviasi, skewness, kurtosis, dan sebagainya - semuanya dapat dianggap sebagai aturan yang mengubah fungsi (distribusi probabilitas) menjadi angka (momen yang sesuai). Ambil nilai mean / ekspektasi, misalnya. Aturan ini mengubah distribusi probabilitasP( x ) ke dalam nomor EP[ x ] , dihitung sebagai
Anda mungkin memperhatikan persamaan yang dimiliki oleh aturan-aturan ini: pada semuanya, cara yang Anda dapatkan dari fungsi ke angka adalah dengan mengintegrasikan fungsi kali beberapa fungsi pembobotan lainnya. Ini adalah cara yang sangat umum untuk mewakili distribusi matematika. Jadi wajar bertanya-tanya, apakah ada fungsi pembobotanδ(x) yang memungkinkan Anda untuk mewakili aksi distribusi delta seperti ini?
Alasan untuk itu adalah bahwa ada lebih banyak distribusi delta daripada hanya ini:
Rincian teknis
1 Sebenarnya, Anda dapat membalikkan keadaan dan memikirkan distribusi probabilitas itu sendiri sebagai distribusi matematika. Dalam pengertian ini, distribusi probabilitas adalah aturan yang membutuhkan fungsi pembobotanx atau (x−E[x])2 ke suatu nomor, E[x] atau σ2x masing-masing. Jika Anda berpikir seperti itu, notasi standar lebih masuk akal, tapi saya pikir ide keseluruhannya agak kurang alami untuk posting tentang distribusi matematika.
2 Secara khusus, dengan "ide standar integrasi" Saya membahas tentang integrasi Riemann dan integrasi Lebesgue , yang keduanya memiliki properti bahwa dua fungsi yang berbeda hanya pada satu titik harus memiliki integral yang sama (diberi batas yang sama). Jika ada fungsiδ(x) , itu akan berbeda dari fungsinya 0 hanya pada satu titik, yaitu x=0 , dan dengan demikian integral kedua fungsi harus selalu sama.
sumber
Dirac delta adalah benar-benar tidak terlalu berguna di sini (meskipun adalah menarik), karena distribusi Gamma memiliki kepadatan terus menerus, sedangkan Dirac adalah sebagai non-kontinyu seperti yang Anda dapatkan.
Anda benar bahwa integral dari probabilitas kepadatan harus satu (saya akan tetap pada kepadatan yang ditentukan hanya pada sumbu positif),
Dalam kasus Gamma, kepadatanf(x) menyimpang sebagai x→0 , jadi kita memiliki apa yang disebut integral yang tidak tepat . Dalam kasus seperti itu, integral didefinisikan sebagai batas ketika batas-batas integrasi mendekati titik di mana integand tidak didefinisikan,
selama batas ini ada .
(Kebetulan, kami menggunakan penyalahgunaan notasi yang sama untuk memberi makna pada simbol "∫∞ ", yang didefinisikan sebagai batas integral ∫b sebagai b→∞ , lagi selama batas ini ada . Jadi dalam kasus khusus ini, kami memiliki dua poin bermasalah -0 , di mana integand tidak didefinisikan, dan ∞ , di mana kita tidak dapat mengevaluasi integral secara langsung. Kita perlu bekerja dengan batasan dalam kedua kasus.)
Khusus untuk distribusi Gamma, kami agak mengesampingkan masalahnya. Kami pertama-tama mendefinisikan fungsi Gamma sebagai berikut:
Kami selanjutnya membuktikan bahwa definisi ini benar-benar masuk akal, dalam arti batas yang berbeda yang diuraikan di atas. Untuk kesederhanaan, di sini kita bisa berpegang teguhk>0 , meskipun definisi dapat diperluas ke (banyak) nilai kompleks k demikian juga. Pemeriksaan ini adalah aplikasi standar kalkulus dan latihan yang bagus.
Selanjutnya, kita gantikanx:=θy untuk θ>0 dan dengan perubahan variabel rumus dapatkan
dari mana kita mendapatkannya
Yaitu, integrand terintegrasi ke satu dan karenanya merupakan kepadatan probabilitas. Kami menyebutnya distribusi Gamma dengan bentukk dan skala θ .
Sekarang, saya menyadari bahwa saya benar-benar berhasil dalam hal ini. Argumennya terletak pada fakta bahwa definisi fungsi Gamma di atas memang masuk akal. Namun, ini adalah kalkulus langsung, bukan statistik, jadi saya hanya merasa sedikit bersalah dalam merujuk Anda ke buku teks kalkulus favorit Anda dan tag fungsi gamma di Math.SO , terutama pertanyaan ini dan pertanyaan ini .
sumber
Pertimbangkan kepadatan eksponensial standarf(x)=exp(−x),x>0 dan pertimbangkan sebidang y=f(x) vs. x (panel kiri pada diagram di bawah).
Mungkin Anda tidak menemukan bahwa ada kepadatan positif untuk semuax>0 namun demikian daerah tersebut masih demikian 1 .
Sekarang mari kita tukarx dan y ... biarkan saja x=exp(−y) , atau y=−ln(x) , untuk 0<x≤1 . Sekarang ini adalah kepadatan yang valid, yang asimtot key sumbu (jadi tidak dibatasi sebagai x→0 ), tetapi areanya jelas identik dengan eksponensial (yaitu area di bawah kurva harus tetap 1 - yang kami lakukan hanyalah merefleksikan bentuknya, dan refleksinya adalah melestarikan area).
Jelas, kemudian, kepadatan bisa tidak terbatas tetapi memiliki luas 1.
sumber
Ini benar-benar pertanyaan kalkulus, bukan statistik. Anda bertanya bagaimana fungsi yang tidak terhingga pada beberapa nilai argumennya masih dapat memiliki area terbatas di bawah kurva?
Itu pertanyaan yang valid. Misalnya, jika alih-alih fungsi Gamma Anda mengambil hiperbola:y=1/x , untuk x=[0,∞) maka area di bawah kurva tidak konvergen, tidak terbatas.
Jadi, cukup ajaib bahwa jumlah tertimbang dari angka yang sangat besar atau bahkan tak terbatas beberapa cara menyatu ke angka yang terbatas. Jumlahnya ditimbang karena jika Anda melihat definisi integral Riemann, itu bisa menjadi jumlah seperti ini:
Untuk distribusi Gamma terjadi begitu sajaΔxi menyusut lebih cepat daripada Gamma PDF tumbuh, dan daerah itu akhirnya menjadi terbatas. Ini kalkulus langsung untuk melihat bagaimana tepatnya konvergen menjadi 1.
sumber
Lihatlah contoh berikut. Perhatikan bahwa untuk apa pun yang terbatasN ,
tapilog(0) tidak terdefinisi sehingga integral adalah ∞ dalam arti tertentu (ini memiliki batas di sana, tetapi abaikan saja). Tapi
Secara umum, ini didasarkan pada gagasan itu
jadi jika1−p>0 teorema dasar kalkulus memberi tahu Anda bahwa integralnya terbatas. Jadi idenya adalah bahwa ia menyimpang cukup lambat (di manap adalah kecepatan) bahwa area tersebut masih dibatasi.
Ini mirip dengan konvergensi seri. Ingat bahwa dengan uji-p kita memilikinya
konvergen jika dan hanya jikap>1 . Dalam hal ini kita perluxp→∞ cukup cepat, dimana sekali lagi p adalah kecepatan dan 1 adalah titik baliknya.
Mengapa ini bisa menjadi hal yang aktual? Pikirkan tentang kepingan salju Koch . Dalam contoh ini Anda terus menambahkan perimeter kepingan salju sedemikian rupa sehingga area tersebut tumbuh perlahan. Ini disebabkan oleh fakta bahwa jika Anda membuat segitiga sama sisi dengan ukuran sisi13 , kelilingnya adalah 1 saat luasnya 1123√∼0.05 . Karena area tersebut jauh lebih kecil daripada perimeter (ini adalah perkalian dua angka kecil daripada penambahan!), Anda dapat memilih untuk menambahkan segitiga sedemikian rupa sehingga perimeter menjadi tak terhingga sementara area tetap terbatas. Untuk melakukannya, Anda harus memilih kecepatan di mana segitiga menjadi nol, dan seperti yang mungkin Anda duga sekarang, ada kecepatan di mana segitiga berubah dari terlalu lambat dan memberikan area tak terbatas menjadi cukup cepat untuk memberikan area terbatas.
Secara total, kalkulus memberi tahu kita bahwa tidak semua singularitas (bahwa "titik-titik tak terhingga" seperti nol adalah sama). Ada perbedaan besar berdasarkan "kecepatan lokal" singularitas.Γ hanya memiliki singularitas yang "cukup lambat" sehingga area tersebut terbatas. Jika Anda ingin mempelajari lebih lanjut tentang singularitas "mengapa" bekerja seperti ini, Anda dapat mempelajari lebih banyak detail dalam Analisis Kompleks dan studi tentang singularitas fungsi analitik kompleks (di antaranyaΓ adalah).
sumber