Baru-baru ini saya merasa perlu untuk mendapatkan pdf untuk kuadrat dari variabel acak normal dengan rata-rata 0. Untuk alasan apa pun, saya memilih untuk tidak menormalkan varians sebelumnya. Jika saya melakukan ini dengan benar maka pdf ini adalah sebagai berikut:
Saya perhatikan ini sebenarnya hanyalah parametrisasi dari distribusi gamma:
Dan kemudian, dari fakta jumlah dua gammas (dengan parameter skala yang sama) sama dengan gamma lain, berarti bahwa gamma setara dengan jumlah kuadrat variabel acak normal.
Ini agak mengejutkan bagi saya. Meskipun saya tahu - distribusi jumlah kuadrat standar RV normal - adalah kasus khusus dari gamma, saya tidak menyadari bahwa gamma pada dasarnya hanya generalisasi yang memungkinkan penjumlahan jumlah normal variabel acak dari varian apa pun . Ini juga mengarah pada karakterisasi lain yang belum pernah saya temui sebelumnya, seperti distribusi eksponensial yang setara dengan jumlah dari dua distribusi normal kuadrat.
Ini agak misterius bagiku. Apakah distribusi normal penting untuk derivasi distribusi gamma, dengan cara yang saya uraikan di atas? Sebagian besar sumber daya yang saya periksa tidak menyebutkan bahwa kedua distribusi secara intrinsik terkait seperti ini, atau bahkan dalam hal ini menggambarkan bagaimana gamma diturunkan. Ini membuat saya berpikir bahwa kebenaran tingkat rendah sedang berperan yang saya soroti dengan cara berbelit-belit?
Jawaban:
Seperti komentar Prof. Sarwate mencatat, hubungan antara kuadrat normal dan chi-square adalah fakta yang sangat tersebar luas - sebagaimana seharusnya juga fakta bahwa chi-square hanyalah kasus khusus dari distribusi Gamma:
kesetaraan terakhir berikut dari properti scaling dari Gamma.
Berkenaan dengan hubungan dengan eksponensial, untuk menjadi akurat itu adalah jumlah dari dua kuadrat rata-rata nol rata-rata masing-masing diskalakan oleh varians yang lain , yang mengarah ke distribusi Eksponensial:
Tetapi kecurigaan bahwa ada "sesuatu yang istimewa" atau "lebih dalam" dalam jumlah dua kuadrat rata-rata berarti bahwa "membuat mereka model yang baik untuk waktu tunggu" tidak berdasar: Pertama-tama, apa yang istimewa tentang distribusi eksponensial yang membuat itu model yang bagus untuk "waktu tunggu"? Memorylessness tentu saja, tetapi apakah ada sesuatu yang "lebih dalam" di sini, atau hanya bentuk fungsional sederhana dari fungsi distribusi Eksponensial, dan sifat-sifat ? Properti unik tersebar di seluruh Matematika, dan sebagian besar waktu, mereka tidak mencerminkan beberapa "intuisi yang lebih dalam" atau "struktur" - mereka hanya ada (untungnya).e
Kedua, kuadrat variabel memiliki hubungan yang sangat kecil dengan levelnya. Pertimbangkan saja in, katakanlah, [ - 2 ,f( x ) = x :[ - 2 ,2 ]
... atau grafik kerapatan normal standar terhadap kerapatan chi-kuadrat: mereka mencerminkan dan mewakili perilaku stokastik yang sama sekali berbeda, meskipun mereka sangat terkait erat, karena yang kedua adalah kerapatan variabel yang merupakan kuadrat dari yang pertama. Normal mungkin merupakan pilar yang sangat penting dari sistem matematika yang telah kami kembangkan untuk memodelkan perilaku stokastik - tetapi begitu Anda menyamakannya, itu menjadi sesuatu yang sama sekali berbeda.
sumber
Mari kita menjawab pertanyaan yang diajukan, Ini semua agak misterius bagiku. Apakah distribusi normal penting untuk derivasi distribusi gamma ...? Tidak ada misteri sebenarnya, itu hanya bahwa distribusi normal dan distribusi gamma adalah anggota, antara lain dari keluarga distribusi eksponensial , yang keluarga didefinisikan oleh kemampuan untuk mengkonversi antara bentuk-bentuk persamaan dengan mengganti parameter dan / atau variabel. Sebagai akibatnya, ada banyak konversi dengan substitusi antar distribusi, beberapa di antaranya dirangkum dalam gambar di bawah ini.
LEEMIS, Lawrence M .; Jacquelyn T. MCQUESTON (Februari 2008). "Hubungan Distribusi Univariat" (PDF). Ahli Statistik Amerika. 62 (1): 45–53. doi: 10.1198 / 000313008x270448 mengutip
Berikut adalah dua hubungan distribusi normal dan gamma secara lebih terperinci (di antara jumlah yang tidak diketahui lainnya, seperti via chi-squared dan beta).
Pertama Hubungan yang lebih langsung antara distribusi gamma (GD) dan distribusi normal (ND) dengan mean nol mengikuti. Sederhananya, GD menjadi normal karena parameter bentuknya diizinkan untuk meningkat. Membuktikan bahwa itulah masalahnya lebih sulit. Untuk GD,
Ketika parameter bentuk GD , bentuk GD menjadi lebih simetris dan normal, namun, ketika rerata meningkat dengan bertambahnya a , kita harus meninggalkan pergeseran GD dengan ( a - 1 ) √a → ∞ Sebuah untuk menahannya stasioner, dan akhirnya, jika kita ingin mempertahankan standar deviasi yang sama untuk GD bergeser kita, kita harus mengurangi parameter skala (b) sebanding dengan√( a - 1 ) 1Sebuah--√k b .1Sebuah--√
Intinya, untuk mengubah GD menjadi ND kasus pembatas, kami menetapkan standar deviasi menjadi konstanta ( ) dengan membiarkan b = √k dan geser GD ke kiri untuk memiliki mode nol dengan menggantiz=(a-1)√b = 1Sebuah--√k KemudianGD((a-1)√z= ( a - 1 ) 1Sebuah--√k + x .
Perhatikan bahwa dalam batas sebagai nilai negatif sebagian x yang GD ini adalah nol → - ∞ . Artinya, dukungan GD semi-tak terbatas menjadi tak terbatas . Mengambil batas sebagai suatu → ∞ dari reparameterized GD, kita menemukana → ∞ x → - ∞ a → ∞
Kedua Mari kita tegaskan bahwa karena kesamaan bentuk antara distribusi-distribusi ini, orang dapat cukup banyak mengembangkan hubungan antara gamma dan distribusi normal dengan menariknya keluar dari udara tipis. Selanjutnya, kami mengembangkan generalisasi distribusi gamma "tidak dilipat" dari distribusi normal.
Perhatikan terlebih dahulu bahwa itu adalah dukungan semi-tak terbatas dari distribusi gamma yang menghambat hubungan yang lebih langsung dengan distribusi normal. Namun, halangan itu dapat dihilangkan ketika mempertimbangkan distribusi setengah normal, yang juga memiliki dukungan setengah tak terbatas. Dengan demikian, seseorang dapat menggeneralisasi distribusi normal (ND) dengan terlebih dahulu melipatnya menjadi setengah normal (HND), terkait dengan distribusi gamma umum (GD), maka untuk tour de force kami , kami "membuka" keduanya (HND dan GD) untuk membuat ND umum (GND), karenanya.
Distribusi gamma umum
Dapat dikalibrasi ulang menjadi distribusi setengah normal ,
yang menyiratkan itu
Di atas dapat dilihat sebagai distribusi normal umum 1 dan dalam parameterisasi yang berbeda dikenal sebagai distribusi daya eksponensial, dan distribusi kesalahan umum, yang pada gilirannya merupakan salah satu dari beberapa distribusi normal umum lain .
sumber
Derivasi distribusi chi-squared dari distribusi normal jauh analog dengan derivasi distribusi gamma dari distribusi eksponensial.
Kita harus dapat menggeneralisasi ini:
Analoginya adalah sebagai berikut:
Distribusi normal dan Chi-kuadrat berhubungan dengan jumlah kuadrat
Distribusi eksponensial dan gamma berhubungan dengan jumlah reguler
Untuk distribusi gamma:
Seperti yang sudah dicatat oleh Alecos Papadopoulos, tidak ada koneksi yang lebih dalam yang membuat jumlah variabel normal kuadrat 'model yang baik untuk waktu tunggu'. Distribusi gamma adalah distribusi untuk sejumlah variabel terdistribusi normal umum. Begitulah cara keduanya bersatu.
Tetapi jenis jumlah dan jenis variabel mungkin berbeda. Sementara distribusi gamma, ketika diturunkan dari distribusi eksponensial (p = 1), mendapatkan interpretasi dari distribusi eksponensial (waktu tunggu), Anda tidak dapat mundur dan kembali ke sejumlah variabel Gaussian kuadrat dan menggunakan interpretasi yang sama.
Distribusi kepadatan untuk waktu tunggu yang jatuh secara eksponensial, dan distribusi kepadatan untuk kesalahan Gaussian jatuh secara eksponensial (dengan kuadrat). Itu adalah cara lain untuk melihat keduanya terhubung.
sumber