Saat mengajar statistik, gunakan "normal" atau "Gaussian"?

42

Saya menggunakan sebagian besar "distribusi Gaussian" dalam buku saya, tetapi seseorang hanya menyarankan saya beralih ke "distribusi normal". Adakah konsensus tentang istilah mana yang digunakan untuk pemula?

Tentu saja kedua istilah itu sinonim , jadi ini bukan pertanyaan tentang substansi, tetapi murni soal istilah mana yang lebih umum digunakan. Dan tentu saja saya menggunakan kedua istilah itu. Tetapi yang harus digunakan sebagian besar?

Harvey Motulsky
sumber
1
Apakah ada bagian pratinjau / bab contoh buku Anda yang tersedia di suatu tempat? Saya mendengar hal-hal baik tentang itu.
Glen_b
2
@Glen_b Fitur "Lihat ke dalam" di amazon.com memungkinkan Anda melihat pratinjau buku. Juga, tiga bab tersedia di sini: intuitifivebiostatistics.com/excerpts
Harvey Motulsky
6
Masalah "istilah mana yang lebih umum digunakan" dapat dengan mudah diatasi, meskipun kasar: Pencarian Google pencarian "Gaussian" memiliki sekitar 2/3 dari hit pencarian untuk "distribusi normal." Rasio ini sedikit berbeda di Google Cendekia, di mana sekarang "distribusi Gaussian" memiliki setengah hit dari "distribusi normal" (tetapi hanya seperempat ketika "terbalik" dikecualikan). Hasil ini menunjukkan (1) "normal" lebih populer tetapi (2) "Gaussian" diakui secara luas. Melihat hasil menunjukkan bahwa frasa seperti "normal asimptotik" mungkin membutuhkan waktu lama untuk diganti, jika pernah.
whuber
2
Dalam ekstensi @whuber, saya pikir ada juga perbedaan antara bidang: "Gaussian" tampaknya relatif lebih dominan dalam sains, sedangkan "Normal" tampaknya menjadi istilah normal dalam ilmu sosial ...
abaumann
1
Coba "abnormal": P
Mehrdad

Jawaban:

47

Meskipun saya cenderung mengatakan 'normal' lebih sering (karena itulah yang saya diajarkan ketika pertama kali belajar), saya pikir "Gaussian" adalah pilihan yang lebih baik, selama siswa / pembaca cukup akrab dengan kedua istilah:

  • Normal tidak terlalu khas, jadi namanya sendiri menyesatkan. Ini tentu memainkan peran penting (paling tidak karena CLT), tetapi data yang diamati jauh lebih jarang terutama di dekat Gaussian daripada yang kadang-kadang disarankan.

  • Kata tersebut (dan kata-kata yang terkait seperti "normalisasi") memiliki beberapa makna yang dapat relevan dalam statistik (misalnya, misalnya "basis ortonormal"). Jika seseorang mengatakan "Saya menormalkan sampel saya" Saya tidak bisa memastikan apakah mereka berubah menjadi normal, menghitung skor-z, menskalakan vektor ke panjang unit, ke panjang , atau sejumlah kemungkinan lainnya. Jika kita cenderung menyebut distribusi "Gaussian" setidaknya pilihan pertama dihilangkan dan sesuatu yang lebih deskriptif menggantikannya.n

  • Gauss setidaknya memiliki tingkat klaim yang wajar terhadap distribusi.

Glen_b
sumber
3
+1 untuk bit "selama siswa / pembaca cukup akrab dengan kedua istilah". Saya pikir itu akan merugikan siswa untuk mengajar hanya "Gaussian", hanya karena "normal" begitu luas.
Patrick Coulombe
6
Saya setuju bahwa kita harus mengajar keduanya. Jika kita mulai dari awal, dan tahu apa yang kita ketahui sekarang, kita tidak akan pernah membiarkan "normal" muncul, karena (1) istilah itu kelebihan beban (2) normal (Gaussian) tidak normal (biasa atau diharapkan) data. "Gaussian" adalah alternatif yang paling umum, meskipun ada sejarah sebelum Gauss. ET Jaynes menyarankan "pusat", yang merupakan ide yang lucu, tetapi itu belum menarik perhatian. (Saya mengenali argumen yang didasarkan pada teorema batas pusat.)
Nick Cox
Mengenai peluru # 2, ketika datang ke sains dan matematika yang lebih luas secara keseluruhan, belum tentu jelas apakah " normal " atau " Gauss " lebih umum. ;-)
kardinal
@ cardinal - Saya cukup setuju dengan saran yang cenderung condong lebih ke arah "Gaussian" di area tersebut - dan saya akan menambahkan teknik juga.
Glen_b
1
@Glen_b: Setuju. (Dalam model mental saya, saya memasukkan teknik di bawah payung umum sains, meskipun itu, mungkin, agak di luar, ahem, norma.) :-)
kardinal
36

Saya akan menggunakan Gaussian.

Satu masalah yang dihadapi orang yang belajar statistik adalah bahwa kita menggunakan kata-kata bahasa Inggris sehari-hari untuk mengartikan hal-hal yang berbeda (kekuatan, signifikan, distribusi dll). Sejauh kita bisa meminimalkan ini, kita harus. "Normal" sudah memiliki banyak arti.

Peter Flom - Pasang kembali Monica
sumber
2
Peter: Saya setuju. Itu sebabnya saya selalu menggunakan "Gaussian". Tetapi komentar dari pengulas pada edisi baru (ringkas), sangat mendorong "normal".
Harvey Motulsky
25

Salah satu argumen yang mendukung normal adalah notasi yang mengakar untuk distribusi, di mana berarti "normal". Saya belum pernah melihat orang yang mengusulkan untuk mengubah ini menjadi .N(μ,σ2)NG(μ,σ2)

Nate Eldredge
sumber
1
G mungkin akan bertentangan dengan Gamma juga, yang harus dilambangkan tetapi sayangnya itu diambil oleh fungsi dengan nama yang sama. Alternatif mungkin adalah atau , yang juga akan konsisten dengan dan seringnya singkatan dari ke . Tetapi saya benar-benar menyukai notasi , karena saya menulisnya terus-menerus dan ini adalah huruf yang mudah untuk dituliskan. ΓGaussGaussianBernoullibinomialbinomN
shadowtalker
Itu poin yang adil, meskipun jika kedua istilah disajikan, penggunaan dapat diperkenalkan kemudian. N
Glen_b
8
Biarkan ;-)GN(μ,σ2)
Stéphane Laurent
1
@ StéphaneLaurent: Saya kira maksud saya adalah bahwa jika Anda menghindari kata "normal", siswa mungkin mengalami kesulitan mengingat apa arti , karena itu tidak lagi mnemonik. N(μ,σ2)
Nate Eldredge
10

Dalam bahasa Jerman sering disebut Gaußsche Normalverteilung sehingga hampir tidak mungkin untuk konflik dengan mudah.

Apakah pantas bagi Anda untuk menggabungkan gaussian dan normal ?

gismo141
sumber
8
Mungkin gnormalakan bekerja dalam bahasa Inggris!
Dilip Sarwate
2
@DilipSarwate 𝅘𝅥𝅮 Saya seorang gnormal, agnother gnormal 𝅘𝅥𝅮 (permintaan maaf kepada messrs. Flanders dan Swann)
hobbs
9

Menurut ensiklopedia Wolfram :

Sementara ahli statistik dan matematikawan secara seragam menggunakan istilah "distribusi normal" untuk distribusi ini, fisikawan terkadang menyebutnya distribusi Gaussian dan, karena bentuknya yang melengkung, para ilmuwan sosial menyebutnya sebagai "kurva lonceng".

Saya setuju bahwa "normal" lebih mudah membingungkan - namun saya menduga buku statistik biasanya menggunakan "normal".

Gerenuk
sumber
Memberi +1 untuk jawaban yang deskriptif daripada preskriptif. Saya sebenarnya setuju dengan jawaban lain bahwa Gaussian lebih disukai, apa pun bidangnya, tetapi informatif untuk memulai dari konteks apa yang tersebar luas dalam penggunaan yang ada.
R ..
Adapun frasa "kurva lonceng", saya akan menghindarinya sepenuhnya dalam pengaturan pengajaran apa pun. Ini memiliki nada yang sangat rasis sebagai akibat dari buku terkenal dengan nama yang sama, dan setiap siswa Anda yang menyadarinya kemungkinan akan terganggu olehnya dan mengaitkan apa pun yang Anda katakan dengan teori yang tidak masuk akal tentang superioritas ras daripada memiliki subjek berdiri sendiri.
R ..
@R .. Deskriptif, ya, tapi uraian itu langsung bertentangan dengan jawaban di sini, yang menunjukkan bahwa sebagian besar ahli statistik dan ahli matematika benar-benar menggunakan istilah "Gaussian".
David Richerby
Alasan lain untuk tidak menggunakan istilah "kurva lonceng" untuk menunjukkan (fungsi kerapatan) distribusi Gaussian / normal adalah bahwa ada banyak distribusi yang fungsi kerapatan probabilitasnya (pdf) menyerupai kurva lonceng. Bahkan pdf dari distribusi Cauchy terlihat seperti kurva lonceng!
Mico
+1 untuk menjelaskan istilah relatif dalam berbagai disiplin ilmu. Terima kasih!
Penggemar
7

Saya ingin menunjukkan bahwa S. Stigler menggunakan distribusi Normal / Gauss / Laplace-Gauss untuk membuktikan 'hukum eponimy Stigler' yang diterbitkan dalam Statistics on the Table (beberapa halaman tersedia di books.google ).

Yang sangat menarik dan relevan dengan pertanyaan ini adalah bahwa pada halaman 287-288 ada tabel penggunaan historis 'Normal' vs 'Gauss' vs 'Laplace' dan tampaknya selama bertahun-tahun penggunaannya bergeser dari 2:15 untuk mendukung normal pada 1816-1884 hingga 8:14 (1888-1917) hingga 5:17 (1919-1939) hingga 9:10 (1947-1976).

Jadi menurut ini penggunaan 'normal' vs 'Gauss' semakin setara. Atau jika Anda percaya bahwa tren akan terus berlanjut maka 'Gauss' akan mengalahkan 'normal' dalam 50-100 tahun.

pes
sumber
5

Sebuah jawaban yang belum saya lihat di antara semua jawaban bagus:

Saya kebanyakan menggunakan "normal" untuk alasan keakraban sebelumnya, tapi saya suka menggunakan huruf kapital untuk menekankan arti teknisnya: "... jika data terdistribusi secara normal ..." (Saya tidak tahu apakah saya menyalin praktik ini dari di tempat lain atau (kembali) menciptakannya sendiri)

Ben Bolker
sumber
5

Yang digunakan tergantung pada tingkat statistik yang diajarkan. Sayangnya, pengalaman mengajar saya menunjukkan bahwa mayoritas mahasiswa sarjana tidak pernah sepenuhnya memahami konsep distribusi probabilitas. Namun, mereka semua harus entah bagaimana memahami CLT dan cara berpikir tentang ketidakpastian. Untuk kelas sarjana, Normal lebih disukai karena itu tidak menambah kecemasan kata baru yang tidak dikenal. Untuk mahasiswa pascasarjana, Gaussian lebih disukai karena semua kebingungan yang disebutkan di atas mengenai normalisasi dan konteks historis yang disediakannya. Saya mengajar kelas penelitian sarjana yang membutuhkan dua kelas statistik prasyarat dan semua buku sarjana yang telah saya lihat digunakan selama 30 tahun terakhir telah menggunakan Normal.

TJ Olney
sumber
1
"mayoritas mahasiswa sarjana tidak pernah sepenuhnya memahami konsep distribusi probabilitas" +1
Code-Guru
4

Nama itu normalberasal dari beberapa pengamatan bahwa kesalahan berperilaku normal. Anda akan menemukan detail lebih lanjut di sini . Jika itu alasan untuk menyebut distribusi ini distribusi normal, itu dapat membuat kebingungan baru seperti distribusi normal untuk jumlah kecelakaan poisson. Saya percaya kita harus bergerak maju dan mulai menyebutnya sebagai Gaussiangantinya.

Mahbubul Majumder
sumber