Saya akan memperkenalkan tabel normal standar di kelas statistik pengantar saya, dan itu membuat saya bertanya-tanya: siapa yang membuat tabel normal standar pertama? Bagaimana mereka melakukannya sebelum komputer datang? Aku ngeri memikirkan seseorang yang brute-force menghitung ribuan Riemann dengan tangan.
normal-distribution
algorithms
history
tables
Daniel Smolkin
sumber
sumber
Jawaban:
Laplace adalah orang pertama yang menyadari perlunya tabulasi, muncul dengan perkiraan:
Tabel modern pertama dari distribusi normal kemudian dibangun oleh astronom Perancis Christian Kramp dalam Analyze des Réfractions Astronomiques et Terrestres (Par le citoyen Kramp, Professeur de Chymie dan de Physique expérimentale à l'école centrale du Département de la Roer, 1799) . Dari Tabel Terkait dengan Distribusi Normal: Sejarah Singkat Penulis: Herbert A. David Sumber: The American Statistician, Vol. 59, No. 4 (November, 2005), hlm. 309-311 :
Tapi ... seberapa akurat dia? OK, mari kita ambil sebagai contoh:2.97
Luar biasa!
Mari kita beralih ke ekspresi modern Gaussian pdf:
Pdf dari adalah:N( 0 , 1 )
di mana . Dan karenanya, .z= x2√ x = z× 2-√
Jadi mari kita pergi ke R, dan mencari ... OK, tidak begitu cepat. Pertama-tama kita harus ingat bahwa ketika ada konstanta yang mengalikan eksponen dalam fungsi eksponensial , integral akan dibagi oleh eksponen itu: . Karena kami bertujuan mereplikasi hasil di tabel lama, kami sebenarnya mengalikan nilai dengan , yang harus muncul dalam penyebut.PZ( Z> z= 2.97 ) ea x 1 / a x 2-√
Lebih jauh, Christian Kramp tidak menormalkan, jadi kita harus mengoreksi hasil yang diberikan oleh R yang sesuai, dikalikan dengan . Koreksi akhir akan terlihat seperti ini:2 π--√
Dalam kasus di atas, dan . Sekarang mari kita pergi ke R:z= 2.97 x = z× 2-√= 4.200214
Fantastis!
Mari kita pergi ke atas meja untuk bersenang-senang, katakan ...0,06
Bagaimana dengan Kramp? .0.82629882
Sangat dekat ...
Masalahnya adalah ... seberapa dekat, tepatnya? Setelah semua suara diterima, saya tidak bisa membiarkan jawaban yang sebenarnya menggantung. Masalahnya adalah bahwa semua aplikasi pengenalan karakter optik (OCR) yang saya coba sangat tidak aktif - tidak mengherankan jika Anda telah melihat yang asli. Jadi, saya belajar untuk menghargai Christian Kramp atas kegigihan karyanya karena saya secara pribadi mengetik setiap digit di kolom pertama Table Première-nya .
Setelah bantuan berharga dari @Glen_b, sekarang mungkin sangat akurat, dan siap untuk menyalin dan menempel pada konsol R di tautan GitHub ini .
Berikut ini analisis keakuratan perhitungannya. Persiapkan dirimu ...
mean(abs(difference))
dengandifference = R - kramp
:Pada entri di mana perhitungannya paling berbeda dibandingkan dengan [R] nilai tempat desimal pertama yang berbeda berada di posisi kedelapan (ratus juta). Rata-rata (median) "kesalahan" pertamanya adalah dalam angka desimal kesepuluh (kesepuluh miliar!). Dan, meskipun ia tidak sepenuhnya setuju dengan [R] dalam hal apa pun, entri terdekat tidak akan menyimpang sampai tiga belas entri digital.
mean(abs(R - kramp)) / mean(R)
(sama denganall.equal(R[,2], kramp[,2], tolerance = 0)
):sqrt(mean(difference^2))
:Jika Anda menemukan gambar atau potret Chistian Kramp, silakan edit posting ini dan letakkan di sini.
sumber
Menurut HA David [1] Laplace mengakui perlunya tabel distribusi normal "sedini 1783" dan tabel normal pertama diproduksi oleh Kramp pada 1799.
Laplace menyarankan dua pendekatan seri, satu untuk integral dari ke dari (yang sebanding dengan distribusi normal dengan varians ) dan satu untuk ekor atas.0 x e−t2 12
Namun, Kramp tidak menggunakan seri Laplace ini, karena ada celah dalam interval waktu penerapannya.
Akibatnya ia mulai dengan integral untuk area ekor dari 0 dan kemudian menerapkan ekspansi Taylor tentang integral dihitung terakhir - yaitu, ketika ia menghitung nilai-nilai baru dalam tabel, ia menggeser ekspansi Taylor-nya (di mana adalah integral yang memberikan area ekor atas).x G(x+h) G
Untuk lebih spesifik, kutip beberapa kalimat yang relevan:
David menunjukkan bahwa tabel tersebut banyak digunakan.
Jadi, bukan ribuan Riemann, jumlah itu adalah ratusan ekspansi Taylor.
Pada catatan yang lebih kecil, dalam keadaan darurat (terjebak hanya dengan kalkulator dan beberapa nilai yang diingat dari tabel normal) saya cukup berhasil menerapkan aturan Simpson (dan aturan terkait untuk integrasi numerik) untuk mendapatkan perkiraan yang baik pada nilai-nilai lain; itu tidak semua yang membosankan untuk menghasilkan tabel disingkat * untuk beberapa tokoh akurasi. [Untuk menghasilkan tabel skala dan akurasi Kramp akan menjadi tugas yang cukup besar, meskipun, bahkan menggunakan metode yang lebih pintar, seperti yang dia lakukan.]
* Dengan tabel yang disingkat, maksud saya di mana Anda pada dasarnya bisa lolos dengan interpolasi di antara nilai-nilai yang ditabulasikan tanpa kehilangan terlalu banyak akurasi. Jika Anda hanya ingin mengatakan sekitar 3 angka akurasi Anda benar-benar tidak perlu menghitung semua nilai yang banyak itu. Saya telah secara efektif menggunakan interpolasi polinomial (lebih tepatnya, teknik beda hingga terapan), yang memungkinkan untuk tabel dengan nilai lebih sedikit daripada interpolasi linier - jika agak lebih banyak upaya pada langkah interpolasi - dan juga telah melakukan interpolasi dengan transformasi logit, yang membuat interpolasi linier jauh lebih efektif, tetapi hanya banyak digunakan jika Anda memiliki kalkulator yang baik).
[1] Herbert A. David (2005),
"Tabel Terkait dengan Distribusi Normal: Sejarah Singkat"
The American Statistician , Vol. 59, No. 4 (November), hlm. 309-311
[2] Kramp (1799),
Menganalisis des Réfractions Astronomiques et Terrestres,
Leipzig: Schwikkert
sumber
Masalah menarik! Saya pikir ide pertama tidak datang melalui integrasi formula yang rumit; alih-alih, hasil dari penerapan asimptotik dalam kombinatorik. Metode pena dan kertas dapat memakan waktu beberapa minggu; tidak begitu sulit untuk Karl Gauss dibandingkan dengan perhitungan pie untuk para pendahulunya. Saya pikir ide Gauss berani; perhitungannya mudah baginya.
Contoh membuat tabel z standar dari awal -
1. Ambil populasi dari n (katakanlah n adalah 20) angka dan daftarkan semua sampel yang mungkin berukuran r (katakanlah r adalah 5) dari itu.
2. menghitung rata-rata sampel. Anda mendapatkan sampel nCr berarti (di sini, 20c5 = 15504 berarti).
3. Rata-rata mereka sama dengan rata-rata populasi. Temukan stdev sarana sampel.
4. Temukan skor z sampel berarti menggunakan mean pop dan stdev rata-rata sampel.
5. Urutkan z dalam urutan menaik dan temukan probabilitas z berada dalam rentang nilai nCr z Anda.
6. Bandingkan nilai dengan tabel normal. Lebih kecil n baik untuk perhitungan tangan. Lebih besar n akan menghasilkan perkiraan lebih dekat dari nilai tabel normal.
Kode berikut dalam r:
Probabilitas z jatuh antara 0 dan nilai positif q di bawah ini; bandingkan dengan tabel yang diketahui. Manipulasi q di bawah ini antara 0 dan 3,5 untuk membandingkan.
sumber