Dari mana fungsi Gaussian berasal?

9

Saya telah membaca banyak halaman di google dan tidak dapat menemukan jawaban yang memuaskan. Saya juga membaca http://castatistics.wikispaces.com/file/view/normal+der..pdf , tapi saya ragu itu adalah motivasi asli untuk fungsi Gaussian. Saat ini saya seorang sarjana dan buku teks saya hanya memberi tahu saya fungsi f (x) = ae - (x - b) ^ 2 / c digunakan sebagai fungsi kepadatan probabilitas untuk kurva normal. Tetapi buku teks saya tidak memberi saya petunjuk dari mana fungsi ini sebenarnya berasal. Apa motivasi asli untuk pengembangan fungsi seperti itu? Bisakah seseorang menawarkan bukti bahwa saya benar-benar dapat undertsand dengan langkah-langkah berlabel jelas? Saya memiliki pengetahuan tentang kalkulus dasar dan saya pemula dalam hal statistik. Tolong, tidak ada bukti yang rumit.

Andrew Kudwitt
sumber
2
Menanggapi pertanyaan yang sangat mirip, saya menawarkan stats.stackexchange.com/a/3904 , yang mungkin berguna bagi Anda. Sebenarnya, itu tidak menjawab pertanyaan Anda tentang "motivasi": yang datang beberapa generasi setelah de Moivre, dengan pengembangan Gauss tentang metode kuadrat terkecil.
whuber

Jawaban:

4

Distribusi normal adalah distribusi yang diharapkan ketika pengukuran terdiri dari sejumlah besar komponen 'noise' yang semuanya didistribusikan dengan cara yang sama satu sama lain.

Prinsipnya terkadang diilustrasikan dengan contoh menggunakan dadu. Lempar satu kali mati dalam jumlah besar dan plot distribusi nilai. Dengan menganggap bahwa dadu itu adil, Anda akan mendapatkan distribusi seragam (diskrit) dari 1 hingga 6. Sekarang lakukan itu lagi tetapi gunakan dua dadu. Anda mendapatkan distribusi segitiga bertahap 2 hingga 12. Tambahkan die ketiga dan distribusinya sedikit berbentuk lonceng dan langkah-langkahnya kecil karena sekarang ada 17 nilai yang berbeda. Dengan empat dadu distribusi tampak sangat mirip dengan distribusi normal, dan dengan jumlah dadu yang tak terbatas itu adalah distribusi normal. Di suatu tempat antara empat dan jumlah kematian yang tak terbatas (saya sering mengatakan 12) diperlukan untuk distribusi yang, untuk tujuan praktis, tidak dapat dibedakan dari distribusi normal yang diberikan oleh rumus normal.

Banyak pengukuran biologis dan fisik memiliki banyak sumber ketidaktelitian dan kebisingan sehingga distribusi pengukuran tersebut akan mendekati normal, selama distribusi komponen-komponen tersebut serupa. Jika satu komponen noise jauh lebih besar daripada yang lain maka distribusi normal tidak akan menghasilkan. Bayangkan jika satu mati dari satu set selusin memiliki wajah yang ditandai dari 100 hingga 600 daripada 1 sampai 6. Bahwa mati akan mendominasi sebelas lainnya dan distribusi jumlah wajah atas mereka akan menjadi campuran yang jelas dari (diskrit) seragam 100 hingga 600 dan hampir kontinu hampir normal 11 hingga 66. Distribusi variasi komponen harus serupa, bahkan jika tidak perlu normal (tidak harus bahkan hampir normal jika ada banyak dari mereka).

(Perlu dicatat bahwa banyak sumber variabilitas memiliki distribusi logaritmik dan begitu banyak pengukuran dalam biologi dan fisika lebih mendekati log-normal daripada normal.)

Michael Lew
sumber