Bagaimana para ilmuwan mengetahui bentuk fungsi kepadatan probabilitas distribusi normal?

36

Ini mungkin pertanyaan amatir, tetapi saya tertarik pada bagaimana para ilmuwan menghasilkan bentuk fungsi kepadatan probabilitas distribusi normal? Pada dasarnya yang menggangguku adalah bahwa bagi seseorang mungkin akan lebih intuitif bahwa fungsi probabilitas dari data yang terdistribusi secara normal memiliki bentuk segitiga sama kaki dan bukan kurva lonceng, dan bagaimana Anda membuktikan kepada orang tersebut bahwa fungsi kepadatan probabilitas dari semua data yang didistribusikan secara normal memiliki bentuk lonceng? Dengan eksperimen? Atau oleh beberapa derivasi matematika?

Lagi pula, apa yang sebenarnya kita anggap data terdistribusi normal? Data yang mengikuti pola probabilitas distribusi normal, atau sesuatu yang lain?

Pada dasarnya pertanyaan saya adalah mengapa fungsi kepadatan probabilitas distribusi normal memiliki lonceng dan bukan yang lain? Dan bagaimana para ilmuwan mencari tahu skenario kehidupan nyata mana yang distribusi normal dapat diterapkan, dengan percobaan atau dengan mempelajari sifat dari berbagai data itu sendiri?

Jadi saya telah menemukan tautan ini sangat membantu dalam menjelaskan derivasi bentuk fungsional dari kurva distribusi normal, dan dengan demikian menjawab pertanyaan "Mengapa distribusi normal terlihat seperti itu dan bukan yang lain?". Pemikiran yang benar-benar menghebohkan, setidaknya untukku.

normal-distribution history ahra
sumber

2

Lihat pertanyaan ini - tidak benar untuk mengklaim bahwa hanya distribusi normal yang "berbentuk lonceng".

Silverfish

11

Distribusi normal memiliki beberapa sifat statistik yang sangat penting, yang menjadikannya objek studi khusus dan juga berarti sering muncul "secara alami", misalnya sebagai kasus pembatas distribusi lainnya. Lihat khususnya Teorema Limit Pusat . Namun, itu bukan satu-satunya distribusi yang memuncak di tengah dan memiliki ekor di kedua sisi. Orang-orang sering menganggap data seperti itu normal karena histogram "terlihat seperti lonceng", tetapi jawaban saya yang terhubung menunjukkan bagaimana ada banyak distribusi kandidat lainnya untuk kumpulan data tersebut.

Silverfish

4

Perhatikan bahwa ahli statistik tidak menemukan distribusi normal dengan melihat banyak dataset dan menyadari fungsi kepadatan ini secara empiris cocok untuk banyak dari mereka. Ketika Anda bertanya-tanya dalam pertanyaan Anda, ada proses investigasi matematis dari masalah-masalah tertentu dalam teori probabilitas, di mana distribusi normal "muncul" sebagai jawaban. Ini dijelaskan dengan baik dalam misalnya jawaban ini di sini .

Silverfish

3

Dan pada dasarnya jika seseorang meminta saya untuk menjelaskan kepada mereka mengapa distribusi normal "normal", saya perlu menjelaskan kepada mereka sejarah distribusi normal yang panjang dan kompleks dengan sendirinya mulai dari distribusi binomial dan sebagainya, dan kemudian mungkin buktikan teorema batas pusat, dan tunjukkan bahwa distribusi normal dapat diterapkan dalam mempelajari banyak situasi dalam kehidupan nyata.

ahra

5

Anda dapat memvisualisasikan bentuk distribusi normal menggunakan salah satu dari perangkat bagus ini yang disebut papan Galton. Sebenarnya itu distribusi binomial, tetapi, Anda tahu, teorema limit pusat.

Federico Poloni

21

" Evolusi Distribusi Normal " oleh SAUL STAHL adalah sumber informasi terbaik untuk menjawab hampir semua pertanyaan di pos Anda. Saya akan melafalkan beberapa poin untuk kenyamanan Anda saja, karena Anda akan menemukan pembahasan terperinci di dalam makalah.

Ini mungkin pertanyaan amatir

Tidak, ini pertanyaan menarik bagi siapa saja yang menggunakan statistik, karena ini tidak dibahas secara detail di mana pun dalam kursus standar.

Pada dasarnya yang menggangguku adalah bahwa bagi seseorang mungkin akan lebih intuitif bahwa fungsi probabilitas dari data yang terdistribusi secara normal memiliki bentuk segitiga sama kaki dan bukan kurva lonceng, dan bagaimana Anda membuktikan kepada orang tersebut bahwa fungsi kepadatan probabilitas dari semua data yang didistribusikan secara normal memiliki bentuk lonceng?

Lihatlah gambar ini dari kertas. Ini menunjukkan kurva kesalahan yang dibuat Simpson sebelum Gaussian (Normal) ditemukan untuk menganalisis data eksperimental. Jadi, intuisi Anda tepat.

Dengan eksperimen?

Ya, itu sebabnya mereka disebut "kurva kesalahan". Percobaan adalah pengukuran astronomi. Para astronom berjuang dengan kesalahan pengukuran selama berabad-abad.

Atau oleh beberapa derivasi matematika?

Lagi, YA! Singkat cerita: analisis kesalahan dalam data astronomi mengarahkan Gauss ke distribusinya (alias Normal). Ini adalah asumsi yang dia gunakan:

Omong-omong, Laplace menggunakan beberapa pendekatan berbeda, dan juga muncul dengan distribusinya juga ketika bekerja dengan data astronomi:

Mengenai mengapa distribusi normal menunjukkan dalam percobaan sebagai kesalahan pengukuran, berikut adalah penjelasan fisikawan "tangan-bergelombang" yang biasa digunakan untuk memberikan (kutipan dari Gerhard Bohm, Günter Zech, Pengantar Statistik dan Analisis Data untuk Fisikawan hal.85):

Banyak sinyal eksperimental mengikuti perkiraan yang sangat baik dari distribusi normal. Ini disebabkan oleh fakta bahwa mereka terdiri dari jumlah dari banyak kontribusi dan konsekuensi dari teorema limit pusat.

Aksakal
sumber

2

Referensi Stahl menjawab pertanyaan asli dari sudut pertanyaan itu - itu adalah penemuan yang sangat bagus.

Silverfish

44

Anda tampaknya berasumsi dalam pertanyaan Anda bahwa konsep distribusi normal sudah ada sebelum distribusi diidentifikasi, dan orang-orang mencoba mencari tahu apa itu. Tidak jelas bagi saya bagaimana cara kerjanya. [Sunting: setidaknya ada satu indra yang mungkin kami anggap sebagai "pencarian distribusi" tapi itu bukan "pencarian distribusi yang menggambarkan banyak dan banyak fenomena"]

Ini bukan kasusnya; distribusi diketahui sebelum disebut distribusi normal.

bagaimana Anda membuktikan kepada orang tersebut bahwa fungsi kepadatan probabilitas semua data yang terdistribusi normal memiliki bentuk bel

Fungsi distribusi normal adalah benda yang memiliki apa yang biasanya disebut "bentuk lonceng" - semua distribusi normal memiliki "bentuk" yang sama (dalam arti bahwa mereka hanya berbeda dalam skala dan lokasi).

Data dapat terlihat kurang lebih "berbentuk lonceng" dalam distribusi tetapi itu tidak membuatnya normal. Banyak distribusi tidak normal terlihat serupa "berbentuk lonceng".

Distribusi populasi aktual yang diambil dari data kemungkinan tidak pernah benar - benar normal, meskipun kadang-kadang perkiraan yang cukup masuk akal.

Ini biasanya berlaku untuk hampir semua distribusi yang kami terapkan pada hal-hal di dunia nyata - mereka adalah model , bukan fakta tentang dunia. [Sebagai contoh, jika kita membuat asumsi tertentu (yang untuk proses Poisson), kita dapat memperoleh distribusi Poisson - distribusi yang banyak digunakan. Tetapi apakah asumsi-asumsi itu pernah benar - benar dipenuhi? Secara umum yang terbaik yang bisa kita katakan (dalam situasi yang tepat) adalah bahwa mereka hampir benar.]

apa yang sebenarnya kita anggap data terdistribusi normal? Data yang mengikuti pola probabilitas distribusi normal, atau sesuatu yang lain?

Ya, untuk benar - benar terdistribusi secara normal, populasi sampel diambil dari harus memiliki distribusi yang memiliki bentuk fungsional yang tepat dari distribusi normal. Akibatnya, populasi terbatas apa pun tidak dapat menjadi normal. Variabel yang harus dibatasi tidak boleh normal (misalnya, waktu yang diambil untuk tugas-tugas tertentu, panjang hal-hal tertentu tidak boleh negatif, sehingga mereka sebenarnya tidak dapat didistribusikan secara normal).

mungkin akan lebih intuitif bahwa fungsi probabilitas dari data yang terdistribusi normal memiliki bentuk segitiga sama kaki

Saya tidak mengerti mengapa ini selalu lebih intuitif. Ini tentu saja lebih sederhana.

Ketika pertama kali mengembangkan model untuk distribusi kesalahan (khusus untuk astronomi pada periode awal), matematikawan mempertimbangkan berbagai bentuk dalam kaitannya dengan distribusi kesalahan (termasuk pada satu titik awal distribusi segitiga), tetapi dalam banyak pekerjaan ini adalah matematika (bukan dari intuisi) yang digunakan. Laplace melihat distribusi eksponensial ganda dan normal (antara beberapa lainnya), misalnya. Demikian pula Gauss menggunakan matematika untuk menurunkannya di sekitar waktu yang sama, tetapi dalam kaitannya dengan serangkaian pertimbangan yang berbeda dari yang dilakukan Laplace.

Dalam arti sempit bahwa Laplace dan Gauss sedang mempertimbangkan "distribusi kesalahan", kita bisa menganggapnya sebagai "pencarian distribusi", setidaknya untuk sementara waktu. Keduanya mendalilkan beberapa properti untuk distribusi kesalahan yang mereka anggap penting (Laplace dianggap sebagai urutan kriteria yang agak berbeda dari waktu ke waktu) menyebabkan distribusi yang berbeda.

Pada dasarnya pertanyaan saya adalah mengapa fungsi kepadatan probabilitas distribusi normal memiliki lonceng dan bukan yang lain?

Bentuk fungsional dari benda yang disebut fungsi kerapatan normal memberinya bentuk itu. Pertimbangkan standar normal (untuk kesederhanaan; setiap normal lainnya memiliki bentuk yang sama, hanya berbeda dalam skala dan lokasi):

f_{Z} (z) = k \cdot e^{- \frac{1}{2} z^{2}}; - \infty < z < \infty

$f_Z(z) = k \cdot e^{-\frac12 z^2};\;-\infty<z<\infty$

(di mana hanyalah sebuah konstanta yang dipilih untuk membuat total area 1) $k$

ini mendefinisikan nilai kerapatan pada setiap nilai , sehingga itu benar-benar menggambarkan bentuk kerapatan. Objek matematika itulah yang kami lampirkan label "distribusi normal". Tidak ada yang istimewa dari namanya; itu hanya label yang kami lampirkan ke distribusi. Ada banyak nama (dan masih disebut hal yang berbeda oleh orang yang berbeda). $x$

Sementara beberapa orang menganggap distribusi normal sebagai sesuatu yang "biasa" itu sebenarnya hanya dalam set situasi tertentu yang Anda bahkan cenderung melihatnya sebagai perkiraan.

Penemuan distribusi biasanya dikreditkan ke de Moivre (sebagai perkiraan untuk binomial). Dia pada dasarnya memperoleh bentuk fungsional ketika mencoba untuk memperkirakan koefisien binomial (/ probabilitas binomial) untuk memperkirakan perhitungan yang membosankan, tetapi - sementara dia memang secara efektif menurunkan bentuk distribusi normal - dia tampaknya tidak memikirkan perkiraannya sebagai suatu distribusi probabilitas, meskipun beberapa penulis menyarankan agar ia melakukannya. Diperlukan sejumlah interpretasi tertentu sehingga ada ruang untuk perbedaan dalam interpretasi itu.

Gauss dan Laplace mengerjakannya pada awal 1800-an; Gauss menulis tentang itu pada 1809 (sehubungan dengan itu menjadi distribusi yang rerata adalah MLE pusat) dan Laplace pada 1810, sebagai perkiraan untuk distribusi jumlah variabel acak simetris. Satu dekade kemudian Laplace memberikan bentuk awal teorema limit pusat, untuk diskrit dan variabel kontinu.

Nama awal untuk distribusi termasuk hukum kesalahan , hukum frekuensi kesalahan , dan itu juga dinamai Laplace dan Gauss, kadang-kadang bersama-sama.

Istilah "normal" digunakan untuk menggambarkan distribusi secara independen oleh tiga penulis berbeda pada tahun 1870-an (Peirce, Lexis, dan Galton), yang pertama pada 1873 dan dua lainnya pada 1877. Ini lebih dari enam puluh tahun setelah karya Gauss dan Laplace dan lebih dari dua kali sejak aproksimasi de Moivre. Penggunaannya oleh Galton mungkin paling berpengaruh tetapi ia menggunakan istilah "normal" dalam kaitannya dengan itu hanya sekali dalam pekerjaan 1877 (kebanyakan menyebutnya "hukum penyimpangan").

Namun, pada tahun 1880-an Galton menggunakan kata sifat "normal" dalam kaitannya dengan distribusi berkali-kali (misalnya sebagai "kurva normal" pada tahun 1889), dan ia pada gilirannya memiliki banyak pengaruh pada ahli statistik kemudian di Inggris (terutama Karl Pearson ). Dia tidak mengatakan mengapa dia menggunakan istilah "normal" dengan cara ini, tetapi mungkin berarti dalam arti "khas" atau "biasa".

Penggunaan eksplisit pertama dari frasa "distribusi normal" tampaknya oleh Karl Pearson; dia pasti menggunakannya pada tahun 1894, meskipun dia mengaku telah menggunakannya jauh sebelumnya (klaim yang akan saya lihat dengan hati-hati).

Referensi:

Miller, Jeff
"Penggunaan Awal Beberapa Kata Matematika:"
Distribusi normal (Entri oleh John Aldrich)
http://jeff560.tripod.com/n.html

Stahl, Saul (2006),
"Evolusi Distribusi Normal",
Majalah Matematika , Vol. 79, No. 2 (April), hal 96-113
https://www.maa.org/sites/default/files/pdf/upload_library/22/Allendoerfer/stahl96.pdf

Distribusi normal, (2016, 1 Agustus).
Di Wikipedia, Ensiklopedia Gratis.
Diperoleh 12:02, 3 Agustus 2016, dari
https://en.wikipedia.org/w/index.php?title=Normal_distribution&oldid=732559095#History

Hald, A (2007),
"Perkiraan Normal De Moivre terhadap Binomial, 1733, dan Generalisasi-nya",
Dalam: Sejarah Kesimpulan Statistik Parametrik dari Bernoulli ke Fisher, 1713–1935; hlm 17-24

[Anda mungkin mencatat perbedaan besar antara sumber-sumber ini sehubungan dengan akun de Moivre mereka]

Glen_b -Reinstate Monica
sumber

Terima kasih atas jawaban mendalamnya! Saya telah melihat lebih jauh bagaimana bentuk distribusi normal diturunkan dan saya telah menemukan dokumen ini courses.ncssm.edu/math/Talks/PDFS/normal.pdf , dan saya memiliki masalah dalam memahami bagaimana kita dapat mengasumsikan bahwa kesalahan tidak tergantung pada orientasi sistem koordinat (asumsi yang memungkinkan kesimpulan penting di kemudian hari), ketika menurut saya asumsi seperti itu hanya akan berlaku pada contoh panah, tetapi tidak pada contoh kesalahan eksperimental yang tidak disengaja. .

ahra

Sebenarnya seluruh pendekatan panah membingungkan saya karena saya sedang belajar distribusi normal dalam konteks kesalahan eksperimental yang tidak disengaja. Saya menduga bahwa pendekatan panah mengasumsikan bahwa Anda dapat membuat kesalahan independen dalam dua dimensi yang baik-baik saja dalam konteks yang digunakan tetapi tidak jelas bagi saya apa yang akan diterjemahkan dalam konteks kesalahan eksperimental di mana Anda memiliki variabel dependen dan independen yang berarti Anda dapat membuat kesalahan hanya dalam satu dimensi.

ahra

1

Sangat banyak menggunakan referensi. +1

Aaron Hall

2

Saya pikir "teorema limit pusat" harus disebutkan di sini di suatu tempat, karena OP tampaknya (setidaknya sebagian) bertanya mengapa distribusi khusus ini begitu lazim.

Bercanda

1

@ joc Saya tidak melihat pertanyaan tentang prevalensi atau bahkan menyarankan pertanyaan tentang itu. Namun, saya berbicara tentang karya de Moivre yang berkaitan dengan binomial dan tentang pekerjaan Laplace yang berkaitan dengan perkiraan normal untuk jumlah variabel acak simetris ... yang lebih langsung terkait dengan pertanyaan. Namun, saya akan menambahkan kalimat yang berkaitan dengan pekerjaan Laplace tentang masalah tersebut (meskipun tidak akan disebut seperti itu untuk abad berikutnya).

Glen_b -Reinstate Monica

11

Distribusi "normal" didefinisikan sebagai distribusi tertentu.

Pertanyaannya adalah mengapa kita mengharapkan distribusi khusus ini menjadi umum di alam, dan mengapa begitu sering digunakan sebagai perkiraan bahkan ketika data nyata tidak persis mengikuti distribusi itu? (Data nyata sering ditemukan memiliki "ekor gemuk", yaitu nilai-nilai yang jauh dari rata-rata jauh lebih umum daripada yang diprediksi oleh distribusi normal).

Dengan kata lain, apa yang istimewa dari distribusi normal?

Normal memiliki banyak sifat statistik "bagus", (lihat mis. Https://en.wikipedia.org/wiki/Central_limit_theorem ), tetapi IMO yang paling relevan adalah fakta yang merupakan fungsi "entropi maksimum" untuk distribusi apa pun dengan mean dan varian yang diberikan. https://en.wikipedia.org/wiki/Maximum_entropy_probability_distribution

Untuk mengekspresikan ini dalam bahasa biasa, jika Anda hanya diberi mean (titik pusat) dan varians (lebar) dari suatu distribusi, dan Anda tidak menganggap hal lain apa pun tentangnya, Anda akan dipaksa untuk menggambar distribusi normal. Hal lain memerlukan informasi tambahan (dalam pengertian teori informasi Shannon ), misalnya kemiringan, untuk menentukannya.

Prinsip entropi maksimum diperkenalkan oleh ET Jaynes sebagai cara menentukan prior yang wajar dalam inferensi Bayesian, dan saya pikir dia adalah yang pertama yang menarik perhatian pada properti ini.

Lihat ini untuk diskusi lebih lanjut: http://www.inf.fu-berlin.de/inst/ag-ki/rojas_home/documents/tutorials/Gaussian-distribution.pdf

Gareth
sumber

6

"Dengan kata lain jika Anda hanya diberi mean (titik pusat) dan varians (lebar) dari suatu distribusi, dan Anda tidak berasumsi apa pun tentangnya, Anda akan dipaksa untuk menggambar distribusi normal." Saya kira itu tergantung pada apa definisi "terpaksa". Anda mungkin dipaksa. Aku tidak akan. Apa yang telah Anda gambarkan adalah persamaan moral dengan "dipaksa" untuk menganggap suatu fungsi linear ketika Anda tidak tahu bentuknya, atau bahwa variabel acak independen ketika Anda tidak tahu ketergantungan mereka yang sebenarnya. Saya belum, tidak, dan tidak akan dipaksa untuk membuat asumsi-asumsi ini.

Mark L. Stone

5

@Neil Saya percaya bagian dari poin Markus adalah bahwa pembenaran bukanlah paksaan.

whuber

5

@Neil Jauh dari itu! Pertama, Anda harus menganggap prinsip entropi maksimum berguna dan dapat diterapkan pada masalah statistik Anda. Selanjutnya Anda harus benar-benar yakin tidak ada lagi yang dapat Anda asumsikan tentang distribusi. Keduanya bermasalah. (Dalam sebagian besar masalah statistik yang saya temui - di luar bidang fisika teoretis - yang pertama belum benar; dan saya belum pernah melihat masalah dunia nyata di mana yang terakhir adalah kasusnya.)

whuber

1

@Neil Mark dan whuber. Saya telah mencoba mengklarifikasi paragraf itu. Saya pikir "menganggap tidak ada yang lain sama sekali" adalah penjelasan bahasa biasa yang wajar tentang apa yang coba dilakukan prinsip entropi maksimum. Menjadi bahasa yang biasa Anda tentu saja dapat menempatkan interpretasi yang berbeda padanya Itu sebabnya kita membutuhkan matematika. Pernyataan yang lebih tepat adalah bahwa kami tidak menambahkan informasi, dalam arti Shannon. Tautan menjelaskan hal ini lebih lanjut.

Gareth

1

@gareth distribusi seragam pada semua real (yang saya pikir Anda maksud dalam komentar terbaru Anda) akan menjadi distribusi yang sangat tidak pantas. Klaim entropi maksimum Anda sebagai pendorong Anda menuju distribusi normal membuat asumsi besar; mengapa itu lebih kuat daripada mengasumsikan sesuatu yang lain, seperti rentang minimum?

Henry

3

The Distribusi Normal (alias " Gaussian Distribution ") memiliki dasar matematika yang kuat. The Central Teorema Limit mengatakan bahwa jika Anda memiliki satu set terbatas n independen dan identik didistribusikan variabel acak yang memiliki mean spesifik dan varians, dan Anda mengambil rata-rata dari variabel acak, distribusi hasilnya akan berkumpul untuk Distribusi Gaussian sebagai n pergi hingga tak terbatas. Tidak ada dugaan di sini, karena derivasi matematika mengarah ke fungsi distribusi khusus ini dan tidak ada yang lain.

Untuk memasukkan ini ke dalam istilah yang lebih nyata, pertimbangkan variabel acak tunggal, seperti membalik koin yang adil (2 hasil yang sama-sama mungkin). Peluang mendapatkan hasil tertentu adalah 1/2 untuk kepala dan 1/2 untuk ekor.

Jika Anda menambah jumlah koin dan melacak jumlah total kepala yang diperoleh pada setiap percobaan, maka Anda akan mendapatkan Distribusi Binomial , yang memiliki bentuk lonceng kasar. Cukup gambarkan dengan jumlah kepala di sepanjang sumbu x, dan berapa kali Anda membalik banyak kepala di sepanjang sumbu-y.

Semakin banyak koin yang Anda gunakan, dan semakin sering Anda membalik koin, semakin dekat grafik akan tampak seperti kurva lonceng Gaussian. Itulah yang ditegaskan oleh Teorema Limit Pusat.

Hal yang menakjubkan adalah bahwa teorema tidak bergantung pada bagaimana variabel-variabel acak terdistribusi, asalkan masing-masing variabel acak memiliki distribusi yang sama. Satu ide kunci dalam teorema adalah bahwa Anda menambah atau membuat rata - rata variabel acak. Konsep kunci lainnya adalah bahwa teorema tersebut menggambarkan batas matematika karena jumlah variabel acak menjadi lebih besar dan lebih besar. Semakin banyak variabel yang Anda gunakan, semakin dekat distribusi akan mendekati Distribusi Normal.

Saya sarankan Anda mengambil kelas dalam Statistik Matematika jika Anda ingin melihat bagaimana matematikawan menentukan bahwa Distribusi Normal sebenarnya adalah fungsi yang benar secara matematis untuk kurva lonceng.

pengguna126665
sumber

Terima kasih atas kontribusi anda. Adalah benar jika Anda menjelaskan bahwa distribusi jumlah (atau rata-rata) harus distandarisasi. Jika tidak, distribusi jumlah tidak mendekati batas dan distribusi rata-rata mendekati konstan. Tetapi bagaimana posting ini menjawab pertanyaan yang diajukan? (Harus diakui, ada berbagai pertanyaan yang diajukan dan mereka semua bingung dan tidak jelas, tetapi mereka tampaknya bertanya tentang bagaimana formula untuk Gaussian PDF ditemukan atau diturunkan.)

whuber

2

Ada beberapa jawaban bagus untuk utas ini. Saya merasa OP tidak menanyakan pertanyaan yang sama seperti semua orang ingin menjawab. Saya mengerti, karena ini hampir menjadi salah satu pertanyaan paling menarik untuk dijawab - saya benar-benar menemukannya karena saya berharap seseorang mempunyai pertanyaan "Bagaimana kita tahu bahwa PDF normal adalah PDF?" dan saya mencarinya. Tapi saya pikir jawaban untuk pertanyaan itu mungkin untuk menunjukkan asal dari distribusi normal.

$n$ $n$ $np$ $np(1-p)$ $n\to\infty$

$n\to\infty$ $p\to0$ $np=1$

$n=10$ $p=0.5$ $n=100$ $p=0.5$ $n$

Jika saya membuang 100 koin di tanah sekarang dan menghitung berapa banyak kepala yang saya dapatkan, saya mungkin menghitung 0 kepala, atau saya mungkin menghitung 100 kepala, tetapi saya jauh lebih mungkin untuk menghitung angka di suatu tempat di antaranya. Apakah Anda melihat mengapa histogram ini harus berbentuk lonceng?

sangkar burung
sumber

+1 - namun, perhatikan bahwa saya membahas de Moivre di beberapa bagian jawaban saya. Anda mungkin menemukan catatan akhir dalam jawaban saya sehubungan dengan perbedaan dalam referensi yang menarik - layak untuk melihat apa yang ditulis de Moivre untuk melihat sejauh mana penokohan yang berbeda dari karyanya tampaknya bertahan. Diskusi khusus tentang mengapa cdf binomial menjadi sangat baik oleh cdf normal dalam kondisi yang sesuai dibahas dalam Mengapa lonceng distribusi binomial berbentuk?

Glen_b -Reinstate Monica

1

Juga akan menyebutkan derivasi Maxwell-Herschel dari distribusi normal multivariat independen dari dua asumsi:

Distribusi tidak terpengaruh oleh rotasi vektor.
Komponen vektor independen.

Ini adalah eksposisi oleh Jaynes

Roah
sumber

Bagaimana para ilmuwan mengetahui bentuk fungsi kepadatan probabilitas distribusi normal?

Jawaban: