Bagaimana distribusi probabilitas berbeda?

8

Bagaimana misalnya distribusi Gamma menyimpang mendekati nol (untuk seperangkat skala dan parameter bentuk yang sesuai, katakanlah bentuk =0.1dan skala ), dan masih memiliki luas yang sama dengan satu?=10

Seperti yang saya pahami, area distribusi kepadatan probabilitas harus selalu sama dengan satu. Jika Anda mengambil distribusi dirac delta, yang menyimpang dari nol tetapi nol di tempat lain, Anda memiliki luas yang sama dengan satu.

Entah bagaimana, jika Anda akan mengambil area distribusi Gamma yang berbeda, Anda dapat mengekspresikannya sebagai area distribusi dirac delta, ditambah sesuatu yang lebih karena memiliki bobot bukan nol padax0 , jadi itu akan lebih besar dari satu.

Adakah yang bisa menjelaskan mengapa alasan saya salah?

Delphine
sumber
1
Ada banyak distribusi (seperti distribusi normal) yang didefinisikan pada seluruh garis nyata, adalah>0di mana-mana, namun memiliki area yang terbatas. Ambil (kuadran utama) dari distribusi itu dan balikkan ke garisx=y. Sekarang Anda memiliki distribusi dengan area yang sama yang menyimpang dix=0.
BlueRaja - Danny Pflughoeft
Lihat "Zeno's Paradox" - mungkin menarik bagi Anda di sini
shadowtalker
@Delphine Saatnya mengambil teori ukuran! semoga berhasil!
bdeonovic

Jawaban:

8

Entah bagaimana, jika Anda akan mengambil area dari distribusi Gamma yang berbeda, Anda dapat mengekspresikannya sebagai area dari distribusi dirac delta, ditambah sesuatu yang lebih karena memiliki bobot tidak nol pada x0, jadi itu akan lebih besar dari satu.

Di situlah alasan Anda salah: Anda tidak dapat secara otomatis mengekspresikan fungsi apa pun yang tak terbatas x=0sebagai distribusi delta plus sesuatu yang lebih. Lagi pula, jika Anda bisa melakukan ini denganδ(x), siapa bilang Anda tidak bisa melakukannya dengan 2δ(x)? Atau1010δ(x)? Atau koefisien lainnya? Sama validnya dengan mengatakan bahwa distribusi itu nol untukx0 dan tak terbatas pada x=0; mengapa tidak menggunakan alasan yang sama dengan mereka?

Sebenarnya, distribusi (dalam arti matematika dari teori distribusi) harus dianggap lebih mirip fungsi fungsi - Anda memasukkan fungsi dan keluar nomor. Untuk distribusi delta secara khusus, jika Anda memasukkan fungsif, kamu keluar nomornya f(0). Distribusi bukanlah fungsi angka-ke-angka yang normal. Mereka lebih rumit, dan lebih mampu, daripada fungsi "biasa" seperti itu.

Gagasan mengubah fungsi menjadi angka cukup akrab bagi siapa saja yang terbiasa berurusan dengan probabilitas. Sebagai contoh, rangkaian momen distribusi - mean, standar deviasi, skewness, kurtosis, dan sebagainya - semuanya dapat dianggap sebagai aturan yang mengubah fungsi (distribusi probabilitas) menjadi angka (momen yang sesuai). Ambil nilai mean / ekspektasi, misalnya. Aturan ini mengubah distribusi probabilitasP(x) ke dalam nomor EP[x], dihitung sebagai

EP[x]=P(x)x dx
Atau aturan untuk varian berubah P(x) ke dalam nomor σP2dimana
σP2[x]=P(x)(xEP[x])2 dx
Notasi saya sedikit aneh di sini, tetapi mudah-mudahan Anda mendapatkan idenya. 1

Anda mungkin memperhatikan persamaan yang dimiliki oleh aturan-aturan ini: pada semuanya, cara yang Anda dapatkan dari fungsi ke angka adalah dengan mengintegrasikan fungsi kali beberapa fungsi pembobotan lainnya. Ini adalah cara yang sangat umum untuk mewakili distribusi matematika. Jadi wajar bertanya-tanya, apakah ada fungsi pembobotanδ(x) yang memungkinkan Anda untuk mewakili aksi distribusi delta seperti ini?

fδ(x)f(x) dx
Anda dapat dengan mudah menetapkan bahwa jika ada fungsi seperti itu, itu harus sama dengan0 di setiap x0. Tetapi Anda tidak bisa mendapatkan nilaiδ(0)lewat sini. Anda dapat menunjukkan bahwa itu lebih besar dari angka berhingga apa pun, tetapi tidak ada nilai aktual untukδ(0)yang membuat persamaan ini berhasil, menggunakan ide-ide standar integrasi. 2

Alasan untuk itu adalah bahwa ada lebih banyak distribusi delta daripada hanya ini:

{0,x0,x=0
Itu ""Menyesatkan. Ini berarti seluruh rangkaian informasi tambahan tentang distribusi delta yang tidak bisa diwakili oleh fungsi normal. Dan itulah mengapa Anda tidak dapat mengatakan dengan bermakna bahwa distribusi gamma" lebih "daripada distribusi delta. Tentu , apapun x>0, nilai distribusi gamma lebih dari nilai distribusi delta, tetapi semua informasi yang berguna tentang distribusi delta terkunci pada titik tersebut di x=0, dan informasi itu terlalu kaya dan kompleks untuk memungkinkan Anda mengatakan bahwa satu distribusi lebih dari yang lain.

Rincian teknis

1 Sebenarnya, Anda dapat membalikkan keadaan dan memikirkan distribusi probabilitas itu sendiri sebagai distribusi matematika. Dalam pengertian ini, distribusi probabilitas adalah aturan yang membutuhkan fungsi pembobotanx atau (xE[x])2ke suatu nomor, E[x] atau σx2masing-masing. Jika Anda berpikir seperti itu, notasi standar lebih masuk akal, tapi saya pikir ide keseluruhannya agak kurang alami untuk posting tentang distribusi matematika.

2 Secara khusus, dengan "ide standar integrasi" Saya membahas tentang integrasi Riemann dan integrasi Lebesgue , yang keduanya memiliki properti bahwa dua fungsi yang berbeda hanya pada satu titik harus memiliki integral yang sama (diberi batas yang sama). Jika ada fungsiδ(x), itu akan berbeda dari fungsinya 0 hanya pada satu titik, yaitu x=0, dan dengan demikian integral kedua fungsi harus selalu sama.

abδ(x)f(x) dx=ab(0)f(x) dx=0
Jadi tidak ada nomor yang dapat Anda berikan δ(0) yang membuatnya mereproduksi efek dari distribusi delta.
David Z
sumber
10

Dirac delta adalah benar-benar tidak terlalu berguna di sini (meskipun adalah menarik), karena distribusi Gamma memiliki kepadatan terus menerus, sedangkan Dirac adalah sebagai non-kontinyu seperti yang Anda dapatkan.

Anda benar bahwa integral dari probabilitas kepadatan harus satu (saya akan tetap pada kepadatan yang ditentukan hanya pada sumbu positif),

0f(x)dx=1.

Dalam kasus Gamma, kepadatan f(x) menyimpang sebagai x0, jadi kita memiliki apa yang disebut integral yang tidak tepat . Dalam kasus seperti itu, integral didefinisikan sebagai batas ketika batas-batas integrasi mendekati titik di mana integand tidak didefinisikan,

0f(x)dx:=lima0af(x)dx,

selama batas ini ada .

(Kebetulan, kami menggunakan penyalahgunaan notasi yang sama untuk memberi makna pada simbol "", yang didefinisikan sebagai batas integral b sebagai b, lagi selama batas ini ada . Jadi dalam kasus khusus ini, kami memiliki dua poin bermasalah -0, di mana integand tidak didefinisikan, dan , di mana kita tidak dapat mengevaluasi integral secara langsung. Kita perlu bekerja dengan batasan dalam kedua kasus.)

Khusus untuk distribusi Gamma, kami agak mengesampingkan masalahnya. Kami pertama-tama mendefinisikan fungsi Gamma sebagai berikut:

Γ(k):=0yk1eydy.

Kami selanjutnya membuktikan bahwa definisi ini benar-benar masuk akal, dalam arti batas yang berbeda yang diuraikan di atas. Untuk kesederhanaan, di sini kita bisa berpegang teguhk>0, meskipun definisi dapat diperluas ke (banyak) nilai kompleks kdemikian juga. Pemeriksaan ini adalah aplikasi standar kalkulus dan latihan yang bagus.

Selanjutnya, kita gantikan x:=θy untuk θ>0 dan dengan perubahan variabel rumus dapatkan

Γ(k)=0xk1exθθkdx,

dari mana kita mendapatkannya

1=0xk1exθΓ(k)θkdx.

Yaitu, integrand terintegrasi ke satu dan karenanya merupakan kepadatan probabilitas. Kami menyebutnya distribusi Gamma dengan bentukk dan skala θ.

Sekarang, saya menyadari bahwa saya benar-benar berhasil dalam hal ini. Argumennya terletak pada fakta bahwa definisi fungsi Gamma di atas memang masuk akal. Namun, ini adalah kalkulus langsung, bukan statistik, jadi saya hanya merasa sedikit bersalah dalam merujuk Anda ke buku teks kalkulus favorit Anda dan tag fungsi gamma di Math.SO , terutama pertanyaan ini dan pertanyaan ini .

Stephan Kolassa
sumber
Aku memang harus kembali ke buku-bukuku, sudah lama! Terima kasih atas jawaban terinci!
Delphine
7

Pertimbangkan kepadatan eksponensial standar f(x)=exp(x),x>0 dan pertimbangkan sebidang y=f(x) vs. x (panel kiri pada diagram di bawah).

Mungkin Anda tidak menemukan bahwa ada kepadatan positif untuk semua x>0 namun demikian daerah tersebut masih demikian 1.

Sekarang mari kita tukar x dan y ... biarkan saja x=exp(y), atau y=ln(x), untuk 0<x1. Sekarang ini adalah kepadatan yang valid, yang asimtot key sumbu (jadi tidak dibatasi sebagai x0), tetapi areanya jelas identik dengan eksponensial (yaitu area di bawah kurva harus tetap 1 - yang kami lakukan hanyalah merefleksikan bentuknya, dan refleksinya adalah melestarikan area).

masukkan deskripsi gambar di sini

Jelas, kemudian, kepadatan bisa tidak terbatas tetapi memiliki luas 1.

Glen_b -Reinstate Monica
sumber
4

Ini benar-benar pertanyaan kalkulus, bukan statistik. Anda bertanya bagaimana fungsi yang tidak terhingga pada beberapa nilai argumennya masih dapat memiliki area terbatas di bawah kurva?

Itu pertanyaan yang valid. Misalnya, jika alih-alih fungsi Gamma Anda mengambil hiperbola:y=1/x, untuk x=[0,) maka area di bawah kurva tidak konvergen, tidak terbatas.

masukkan deskripsi gambar di sini

Jadi, cukup ajaib bahwa jumlah tertimbang dari angka yang sangat besar atau bahkan tak terbatas beberapa cara menyatu ke angka yang terbatas. Jumlahnya ditimbang karena jika Anda melihat definisi integral Riemann, itu bisa menjadi jumlah seperti ini:

01/xdx=limni=0nΔxixi
Jadi, tergantung poin mana xi Anda memilih, bobot Δxibisa kecil atau besar. Saat Anda mendekati 0,1/xi menjadi lebih besar, tetapi begitu juga Δximenjadi lebih kecil. Dalam kompetisi ini1/xi menang, dan integral tidak bertemu.

Untuk distribusi Gamma terjadi begitu saja Δximenyusut lebih cepat daripada Gamma PDF tumbuh, dan daerah itu akhirnya menjadi terbatas. Ini kalkulus langsung untuk melihat bagaimana tepatnya konvergen menjadi 1.

Aksakal
sumber
0

Lihatlah contoh berikut. Perhatikan bahwa untuk apa pun yang terbatasN,

0N1xdx=log(N)log(0)

tapi log(0) tidak terdefinisi sehingga integral adalah dalam arti tertentu (ini memiliki batas di sana, tetapi abaikan saja). Tapi

0N1xdx=N0=N

Secara umum, ini didasarkan pada gagasan itu

1xpdx=x1p

jadi jika 1p>0teorema dasar kalkulus memberi tahu Anda bahwa integralnya terbatas. Jadi idenya adalah bahwa ia menyimpang cukup lambat (di manap adalah kecepatan) bahwa area tersebut masih dibatasi.

Ini mirip dengan konvergensi seri. Ingat bahwa dengan uji-p kita memilikinya

01xp

konvergen jika dan hanya jika p>1. Dalam hal ini kita perluxp cukup cepat, dimana sekali lagi p adalah kecepatan dan 1 adalah titik baliknya.

Mengapa ini bisa menjadi hal yang aktual? Pikirkan tentang kepingan salju Koch . Dalam contoh ini Anda terus menambahkan perimeter kepingan salju sedemikian rupa sehingga area tersebut tumbuh perlahan. Ini disebabkan oleh fakta bahwa jika Anda membuat segitiga sama sisi dengan ukuran sisi13, kelilingnya adalah 1 saat luasnya 11230.05. Karena area tersebut jauh lebih kecil daripada perimeter (ini adalah perkalian dua angka kecil daripada penambahan!), Anda dapat memilih untuk menambahkan segitiga sedemikian rupa sehingga perimeter menjadi tak terhingga sementara area tetap terbatas. Untuk melakukannya, Anda harus memilih kecepatan di mana segitiga menjadi nol, dan seperti yang mungkin Anda duga sekarang, ada kecepatan di mana segitiga berubah dari terlalu lambat dan memberikan area tak terbatas menjadi cukup cepat untuk memberikan area terbatas.

Secara total, kalkulus memberi tahu kita bahwa tidak semua singularitas (bahwa "titik-titik tak terhingga" seperti nol adalah sama). Ada perbedaan besar berdasarkan "kecepatan lokal" singularitas.Γhanya memiliki singularitas yang "cukup lambat" sehingga area tersebut terbatas. Jika Anda ingin mempelajari lebih lanjut tentang singularitas "mengapa" bekerja seperti ini, Anda dapat mempelajari lebih banyak detail dalam Analisis Kompleks dan studi tentang singularitas fungsi analitik kompleks (di antaranyaΓ adalah).

Chris Rackauckas
sumber
Itu banyak poin bagus, terima kasih! Saya akan mengingat ini
Delphine