Bagaimana Anda menjelaskan Moment Generating Function (MGF) dalam istilah awam?

15

Apa itu Moment Generating Function (MGF)?

Bisakah Anda menjelaskannya dalam istilah awam dan bersama dengan contoh sederhana & mudah?

Tolong, batasi penggunaan notasi matematika formal sejauh mungkin.

pengguna366312
sumber
1
Anda ingin contoh sederhana, mudah ... tetapi tanpa notasi matematika? Saya tidak yakin hal seperti itu akan sangat mudah dilakukan - setidaknya tanpa risiko memberikan kesan menyesatkan tentang apa yang Anda hadapi. Saya kira kita bisa memberikan mgf dari variabel acak degenerasi yang selalu tanpa perlu banyak cara notasi matematika, tetapi itu akan menjadi tidak mencerahkan jika Anda benar-benar ingin memahami mgfs. 0
Glen_b -Reinstate Monica
1
Saya tidak yakin apakah ada cara intuitif untuk memahaminya, Anda mungkin menganggapnya sebagai cara "menyandikan" distribusi (setidaknya ketika itu ada, ide ini bekerja sedikit lebih baik dengan fungsi karakteristik).
dsaxton
1
Fungsi menghasilkan momen - ketika ada - adalah cara untuk menyandikan semua momen non-negatif-integer dari variabel acak ke dalam fungsi, dan dari mana mereka dapat diekstraksi lagi; mgfs dapat digunakan untuk melakukan perhitungan tertentu yang terkadang tidak begitu mudah dilakukan dengan cara lain. Saya tidak berharap itu banyak membantu.
Glen_b -Reinstate Monica
1
Saya yakin Anda telah melihat jawaban Joe Blitztein untuk pertanyaan yang sama tentang Quora
Antoni Parellada

Jawaban:

18

Mari kita asumsikan bahwa intuisi bebas persamaan tidak mungkin, dan masih bersikeras untuk menurunkan matematika sampai ke tingkat yang paling penting untuk mendapatkan gambaran tentang apa yang terjadi: kita sedang berusaha mendapatkan momen statistik , yang, setelah referensi wajib fisika , kami mendefinisikan sebagai nilai yang diharapkan dari kekuatan variabel acak. Untuk variabel acak kontinu, momen -th mentah adalah dengan LOTUS :k

(1)E[Xk]=Xkpdfdx

The fungsi pembangkit momen , adalah cara untuk berjalan di sekitar terpisahkan ini (Eq.1) oleh, sebaliknya, melaksanakan:

MX(t):=E[etX],

(2)E[etX]=etXpdfdx

Mengapa? Karena lebih mudah dan ada properti fantastis dari MGF yang dapat dilihat dengan memperluas rangkaian Maclaurin darietX

etX=1+X1!t+X22!t2+X33!t3+

Mengambil harapan dari kedua sisi seri kekuatan ini:

MX(t)=E[etX](3)=1+E[X]1!t+E[X2]2!t2+E[X3]3!t3+

momen tampak "bertengger" pada "jemuran" polinomial ini, siap untuk dimusnahkan hanya dengan membedakan waktu dan mengevaluasi nol begitu kita melewati integrasi yang lebih mudah (misalnya (2)) hanya sekali untuk semua momen! Fakta bahwa itu adalah integrasi yang lebih mudah paling terlihat ketika pdf adalah eksponensial.k

Untuk memulihkan momen ke- :k

MX(k)(0)=dkdtkMX(t)|t=0

Fakta bahwa pada akhirnya ada kebutuhan untuk membedakan menjadikannya bukan makan siang gratis - pada akhirnya itu adalah transformasi Laplace dua sisi dari pdf dengan tanda yang berubah dalam eksponen:

L{pdf(x)}(s)=esxpdf(x)dx

sedemikian rupa sehingga

(4)MX(t)=L{pdf(x)}(s).

Ini, pada dasarnya, memberi kita jalan fisika ke intuisi. Transformasi Laplace bertindak pada dan menguraikannya menjadi momen. The kesamaan dengan transformasi Fourier adalah tak terhindarkan : memetakan sebuah FT fungsi untuk fungsi baru pada baris nyata, dan peta Laplace fungsi untuk fungsi baru pada bidang kompleks. Transformasi Fourier mengekspresikan fungsi atau sinyal sebagai serangkaian frekuensi, sedangkan transformasi Laplace menyelesaikan fungsi menjadi momen - momennya . Bahkan, cara berbeda untuk memperoleh momen adalah melalui transformasi Fourier ( fungsi karakteristik ). Istilah eksponensial dalam transformasi Laplace secara umum adalah dari bentuk withpdfe - s t s =ests=σ+iω , sesuai dengan eksponensial nyata dan sinusoidal imajiner , dan menghasilkan plot seperti ini :


[ Dari Panduan Ilmuwan dan Insinyur untuk Pemrosesan Sinyal oleh Steven W. Smith ]


Karenanya fungsi menguraikan entah bagaimana menjadi "frekuensi konstituennya" ketikaDari eq. (4):MX(t)pdfσ=0.

MX(t)=E[esX]=esxpdf(x)dx=e(σ+iω)xpdf(x)dx=eσxeiωxpdf(x)dx

yang meninggalkan kita dengan integral yang tidak tepat dari bagian dari ekspresi berwarna merah, sesuai dengan transformasi Fourier dari pdf.

Secara umum, intuisi kutub transformasi Laplace dari suatu fungsi adalah bahwa mereka memberikan informasi komponen eksponensial (peluruhan) dan frekuensi fungsi (dalam hal ini, pdf).


Menanggapi pertanyaan di bawah komentar tentang beralih dari ke , ini adalah langkah yang sepenuhnya strategis: satu ungkapan tidak mengikuti dari yang lain. Berikut ini sebuah analogi: Kami memiliki mobil sendiri dan kami bebas berkendara ke kota setiap kali kami perlu mengurus beberapa bisnis (baca, mengintegrasikan Persamaan tidak peduli betapa sulitnya untuk setiap momen, momen tunggal) . Sebaliknya, kita bisa melakukan sesuatu yang sama sekali berbeda: kita dapat pergi ke stasiun kereta bawah tanah terdekat (baca, memecahkan Persamaan hanya sekali), dan dari sana menggunakan transportasi umum untuk mencapai setiap tempat kita perlu kunjungan (baca, mendapatkan turunan dari integral dalam Persamaan untuk mengekstraksi mana sajaXketx(1)(2)k(2)k-waktu yang kita butuhkan, mengetahui (terima kasih kepada Persamaan ) bahwa semua momen "bersembunyi" di sana dan diisolasi dengan mengevaluasi pada ).(3)0

Antoni Parellada
sumber
2
Bagaimana cara menggantikan ? (Tiba-tiba?)E [ X k ]E[etX]E[Xk]
user366312
2
Saya berharap orang awam yang mengerti jawaban ini adalah murid-murid saya :)
Aksakal
3

Dalam istilah awam, ini adalah cara untuk menyandikan semua karakteristik distribusi probabilitas ke dalam satu kalimat pendek. Sebagai contoh, jika saya tahu bahwa MGF dari distribusi adalah Saya dapat mengetahui rata-rata distribusi ini dengan mengambil istilah pertama ekspansi Taylor : Jika Anda tahu apa yang Anda lakukan, itu jauh lebih cepat daripada mengambil ekspektasi dari fungsi probabilitas.

M(t)=etμ+1/2σ2t2
ddtM(t)|t=0=μ+σ2t|t=0=μ

Selain itu, karena MGF ini menyandikan segala sesuatu tentang distribusi, jika Anda tahu cara memanipulasi fungsi, Anda dapat menerapkan operasi pada semua karakteristik distribusi sekaligus! Kenapa kita tidak selalu menggunakan MGF? Pertama, itu tidak dalam setiap situasi MGF adalah alat yang paling mudah. Kedua, MGF tidak selalu ada.

Di atas orang awam

Misalkan Anda memiliki distribusi normal standar. Anda dapat mengekspresikan semua yang Anda ketahui tentangnya dengan menyatakan PDF-nya:

f(x)=12πex2/2

Anda dapat menghitung momennya seperti mean dan standar deviasi, dan menggunakannya pada variabel yang diubah dan fungsi pada normals acak dll.

Anda dapat menganggap MGF dari distribusi normal sebagai alternatif untuk PDF. Ini berisi jumlah informasi yang sama. Saya sudah menunjukkan cara mendapatkan mean.

Mengapa kita membutuhkan cara alternatif? Seperti yang saya tulis, kadang lebih nyaman. Misalnya, coba hitung varian standar normal dari PDF: Ini tidak terlalu sulit, tetapi jauh lebih mudah untuk melakukannya dengan MGF :

σ2=x212πex2/2dx=?
M(t)=et2/2
σ2=d2dt2M(t)|t=0=ddtt|t=0=1

Aksakal
sumber
1
Bisakah Anda memperluas "segalanya" yang disandikan tentang distribusi?
ColorStatistics
2
Untuk menghargai poin yang dibuat oleh @ColorStatistics, silakan lihat stats.stackexchange.com/questions/25010 .
whuber
@whuber: Terima kasih, whuber. Saya akan mempelajari referensi itu. Ini adalah topik yang saya ingin mengerti lebih baik.
ColorStatistics
Bagaimana kami dapat membuktikan bahwa MGF & PDF berisi jumlah informasi yang sama?
Aerin