Saya menggunakan sebagian besar "distribusi Gaussian" dalam buku saya, tetapi seseorang hanya menyarankan saya beralih ke "distribusi normal". Adakah konsensus tentang istilah mana yang digunakan untuk pemula?
Tentu saja kedua istilah itu sinonim , jadi ini bukan pertanyaan tentang substansi, tetapi murni soal istilah mana yang lebih umum digunakan. Dan tentu saja saya menggunakan kedua istilah itu. Tetapi yang harus digunakan sebagian besar?
normal-distribution
terminology
Harvey Motulsky
sumber
sumber
Jawaban:
Meskipun saya cenderung mengatakan 'normal' lebih sering (karena itulah yang saya diajarkan ketika pertama kali belajar), saya pikir "Gaussian" adalah pilihan yang lebih baik, selama siswa / pembaca cukup akrab dengan kedua istilah:
Normal tidak terlalu khas, jadi namanya sendiri menyesatkan. Ini tentu memainkan peran penting (paling tidak karena CLT), tetapi data yang diamati jauh lebih jarang terutama di dekat Gaussian daripada yang kadang-kadang disarankan.
Kata tersebut (dan kata-kata yang terkait seperti "normalisasi") memiliki beberapa makna yang dapat relevan dalam statistik (misalnya, misalnya "basis ortonormal"). Jika seseorang mengatakan "Saya menormalkan sampel saya" Saya tidak bisa memastikan apakah mereka berubah menjadi normal, menghitung skor-z, menskalakan vektor ke panjang unit, ke panjang , atau sejumlah kemungkinan lainnya. Jika kita cenderung menyebut distribusi "Gaussian" setidaknya pilihan pertama dihilangkan dan sesuatu yang lebih deskriptif menggantikannya.n−−√
Gauss setidaknya memiliki tingkat klaim yang wajar terhadap distribusi.
sumber
Saya akan menggunakan Gaussian.
Satu masalah yang dihadapi orang yang belajar statistik adalah bahwa kita menggunakan kata-kata bahasa Inggris sehari-hari untuk mengartikan hal-hal yang berbeda (kekuatan, signifikan, distribusi dll). Sejauh kita bisa meminimalkan ini, kita harus. "Normal" sudah memiliki banyak arti.
sumber
Salah satu argumen yang mendukung normal adalah notasi yang mengakar untuk distribusi, di mana berarti "normal". Saya belum pernah melihat orang yang mengusulkan untuk mengubah ini menjadi .N(μ,σ2) N G(μ,σ2)
sumber
Dalam bahasa Jerman sering disebut Gaußsche Normalverteilung sehingga hampir tidak mungkin untuk konflik dengan mudah.
Apakah pantas bagi Anda untuk menggabungkan gaussian dan normal ?
sumber
gnormal
akan bekerja dalam bahasa Inggris!Menurut ensiklopedia Wolfram :
Saya setuju bahwa "normal" lebih mudah membingungkan - namun saya menduga buku statistik biasanya menggunakan "normal".
sumber
Saya ingin menunjukkan bahwa S. Stigler menggunakan distribusi Normal / Gauss / Laplace-Gauss untuk membuktikan 'hukum eponimy Stigler' yang diterbitkan dalam Statistics on the Table (beberapa halaman tersedia di books.google ).
Yang sangat menarik dan relevan dengan pertanyaan ini adalah bahwa pada halaman 287-288 ada tabel penggunaan historis 'Normal' vs 'Gauss' vs 'Laplace' dan tampaknya selama bertahun-tahun penggunaannya bergeser dari 2:15 untuk mendukung normal pada 1816-1884 hingga 8:14 (1888-1917) hingga 5:17 (1919-1939) hingga 9:10 (1947-1976).
Jadi menurut ini penggunaan 'normal' vs 'Gauss' semakin setara. Atau jika Anda percaya bahwa tren akan terus berlanjut maka 'Gauss' akan mengalahkan 'normal' dalam 50-100 tahun.
sumber
Sebuah jawaban yang belum saya lihat di antara semua jawaban bagus:
Saya kebanyakan menggunakan "normal" untuk alasan keakraban sebelumnya, tapi saya suka menggunakan huruf kapital untuk menekankan arti teknisnya: "... jika data terdistribusi secara normal ..." (Saya tidak tahu apakah saya menyalin praktik ini dari di tempat lain atau (kembali) menciptakannya sendiri)
sumber
Yang digunakan tergantung pada tingkat statistik yang diajarkan. Sayangnya, pengalaman mengajar saya menunjukkan bahwa mayoritas mahasiswa sarjana tidak pernah sepenuhnya memahami konsep distribusi probabilitas. Namun, mereka semua harus entah bagaimana memahami CLT dan cara berpikir tentang ketidakpastian. Untuk kelas sarjana, Normal lebih disukai karena itu tidak menambah kecemasan kata baru yang tidak dikenal. Untuk mahasiswa pascasarjana, Gaussian lebih disukai karena semua kebingungan yang disebutkan di atas mengenai normalisasi dan konteks historis yang disediakannya. Saya mengajar kelas penelitian sarjana yang membutuhkan dua kelas statistik prasyarat dan semua buku sarjana yang telah saya lihat digunakan selama 30 tahun terakhir telah menggunakan Normal.
sumber
Nama itu
normal
berasal dari beberapa pengamatan bahwa kesalahan berperilaku normal. Anda akan menemukan detail lebih lanjut di sini . Jika itu alasan untuk menyebut distribusi ini distribusi normal, itu dapat membuat kebingungan baru seperti distribusi normal untuk jumlah kecelakaanpoisson
. Saya percaya kita harus bergerak maju dan mulai menyebutnya sebagaiGaussian
gantinya.sumber