Apakah ada contoh variabel yang terdistribusi normal yang * tidak * karena teorema Limit Pusat?

11

Distribusi normal tampaknya tidak intuitif sampai Anda mempelajari CLT, yang menjelaskan mengapa begitu lazim dalam kehidupan nyata. Tetapi apakah itu pernah muncul sebagai distribusi "alami" untuk jumlah tertentu?

kepala kebun
sumber
4
Teori fisik difusi, sejauh itu berlaku untuk sistem apa pun, memprediksi distribusi normal kuantitas (seperti suhu atau konsentrasi) yang berasal dari suatu titik. Memang, banyak sekali sistem yang difusif (harga opsi, transportasi partikel dalam media homogen, dll.), Menunjukkan bahwa banyak contoh dengan asumsi seseorang tidak begitu naif dengan menganggap bahwa distribusi Normal harus bertahan pada nilai-nilai besar atau kecil yang tidak realistis secara realistis. --bahwa itu akan menjadi kesalahpahaman dari semua teori fisik.
whuber
2
Distribusi normal tampaknya tidak intuitif sampai Anda mengetahui bahwa itu memaksimalkan entropi di bawah kendala varian tetap.
leonbloy

Jawaban:

11

Saya pikir ini adalah masalah filosofis dan masalah statistik.

Banyak fenomena yang terjadi secara alami kira-kira terdistribusi secara normal. Orang dapat berdebat apakah penyebab yang mendasari itu mungkin sesuatu seperti CLT:

  • Ketinggian orang dapat dianggap sebagai jumlah dari banyak penyebab yang lebih kecil (mungkin independen, tidak mungkin terdistribusi secara identik): panjang berbagai tulang, atau hasil dari berbagai ekspresi gen, atau hasil dari banyak pengaruh makanan, atau kombinasi dari semua hal di atas .

  • Skor tes dapat dianggap sebagai jumlah skor pada banyak pertanyaan tes individu (mungkin didistribusikan secara identik, tidak mungkin sepenuhnya independen).

  • Jarak yang ditempuh sebuah partikel dalam satu dimensi sebagai hasil dari gerakan Brown dalam suatu cairan: Gerakan dapat dianggap secara abstrak sebagai jalan acak yang dihasilkan dari pukulan acak IID oleh molekul.

(0,2π).dimana Anda dapat google.] Namun, koordinat x dan y normal dapat dianggap sebagai jumlah dari banyak ketidakakuratan kecil dalam penargetan, yang mungkin membenarkan mekanisme terkait CLT di latar belakang.

Dalam pengertian historis, penyebaran luas distribusi normal (Gaussian) alih-alih distribusi eksponensial ganda (Laplace) untuk memodelkan pengamatan astronomi mungkin sebagian disebabkan oleh CLT. Pada hari-hari awal pemodelan kesalahan pengamatan seperti itu, ada perdebatan antara Gauss dan Laplace , masing-masing berdebat untuk distribusi favoritnya sendiri. Karena berbagai alasan, model normal telah menang. Orang dapat berargumen bahwa salah satu alasan kesuksesan akhir distribusi normal adalah kenyamanan matematis berdasarkan batas normal CLT. Ini tampaknya benar bahkan ketika tidak jelas keluarga distribusi mana yang paling cocok. (Bahkan sekarang, masih ada astronom yang merasa bahwa "satu pengamatan terbaik"dibuat oleh seorang astronom yang teliti dan dihormati pasti akan menjadi nilai yang lebih baik daripada rata - rata banyak pengamatan yang dilakukan oleh pengamat yang mungkin kurang berbakat. Akibatnya, mereka lebih suka tidak ada intervensi sama sekali oleh ahli statistik.)

BruceET
sumber
Ya. Masih memperbaiki kesalahan ketik. Terima kasih telah memperhatikan yang satu ini. Kesalahan yang sama dalam 'nilai ujian' juga diperbaiki.
BruceET
-3

Banyak variabel yang terjadi secara alami terdistribusi secara normal. Ketinggian manusia? Ukuran koloni hewan?

Senang
sumber
1
@Bahagia Sebenarnya tidak ada contoh yang diberikan di sini yang terdistribusi secara normal karena dukungan dari distribusi normal adalah -infinity hingga + infinity dan contoh-contoh yang diberikan tidak boleh nol atau kurang. Dalam setiap kasus, distribusi normal mungkin merupakan pendekatan yang berguna, tetapi tidak jika Anda tertarik pada ekor distribusi.
JeremyC
2
Tinggi manusia adalah hasil dari jumlah gen independen (kurang-lebih), sehingga mereka benar-benar adalah karena CLT tersebut.
gardenhead
2
@ ArtemMavrin: mendapatkan ketinggian negatif akan menjadi sesuatu seperti 8+ standar deviasi. Jika salah satu objek untuk pendekatan normal tidak menjadi valid karena ia menempatkan nol massa probabilitas luar 8 sd, Anda mungkin juga juga mengeluhkan bahwa benar-benar nilai didistribusikan Biasanya adalah tidak rasional dengan probabilitas 1, namun semua pengukuran kami adalah bilangan rasional.
Cliff AB
1
@ArtemMavrin: baik, jika pertanyaannya adalah setiap hal yang persis terdistribusi normal, bahwa jawabannya sederhana: tidak ada. Bahkan tidak rnorm(1). Sama dengan semua distribusi, selain multinomial.
Cliff AB
2
n