Ayah saya adalah penggemar matematika, tetapi tidak terlalu tertarik pada statistik. Akan rapi untuk mencoba mengilustrasikan beberapa bit statistik yang indah, dan CLT adalah kandidat utama. Bagaimana Anda menyampaikan keindahan matematika dan dampak teorema limit pusat kepada non-ahli statistik?
33
Jawaban:
Apa yang paling saya sukai dari CLT adalah kasus-kasus yang tidak dapat diterapkan - ini memberi saya harapan bahwa kehidupannya sedikit lebih menarik seperti yang ditunjukkan oleh kurva Gauss. Jadi tunjukkan padanya distribusi Cauchy.
sumber
Untuk sepenuhnya menghargai CLT, itu harus dilihat.
Oleh karena itu gagasan mesin kacang dan banyak video youtube untuk ilustrasi.
sumber
Seringkali ketika matematikawan berbicara tentang probabilitas mereka mulai dengan distribusi probabilitas yang diketahui kemudian berbicara tentang probabilitas peristiwa. Nilai sebenarnya dari teorema limit pusat adalah bahwa hal itu memungkinkan kita untuk menggunakan distribusi normal sebagai perkiraan dalam kasus di mana kita tidak tahu distribusi sebenarnya. Anda dapat mengajukan pertanyaan statistik standar kepada ayah Anda (tetapi diucapkan sebagai matematika) tentang berapa probabilitas bahwa rata-rata sampel akan lebih besar dari nilai yang diberikan jika data berasal dari distribusi dengan rata-rata mu dan sigma sd, kemudian lihat apakah ia mengasumsikan distribusi (yang kemudian Anda katakan kami tidak tahu) atau mengatakan bahwa ia perlu mengetahui distribusi. Kemudian Anda dapat menunjukkan bahwa kami dapat memperkirakan jawabannya menggunakan CLT dalam banyak kasus.
Untuk membandingkan matematika dengan statistik, saya suka menggunakan teorema nilai rata-rata integrasi (yang mengatakan bahwa untuk integral dari a ke b terdapat persegi dari a ke b dengan area yang sama dan ketinggian persegi panjang adalah rata-rata dari melengkung). Matematikawan melihat teorema ini dan berkata "keren, saya bisa menggunakan integrasi untuk menghitung rata-rata", sedangkan ahli statistik melihat teorema yang sama dan mengatakan "keren, saya bisa menggunakan rata-rata untuk menghitung integral".
Saya sebenarnya memiliki hiasan dinding silang dijahit di kantor saya dari teorema nilai rata-rata dan CLT (bersama dengan teorema Bayes).
sumber
Saya suka mendemonstrasikan variasi pengambilan sampel dan pada dasarnya Central Limit Theorem melalui latihan "di dalam kelas". Semua orang di kelas mengatakan 100 siswa menulis usia mereka di selembar kertas. Semua potongan kertas memiliki ukuran yang sama dan dilipat dengan cara yang sama setelah saya menghitung rata-rata. Ini adalah populasi dan saya menghitung usia rata-rata. Kemudian setiap siswa secara acak memilih 10 lembar kertas, menuliskan usia dan mengembalikannya ke kantong. (S) ia menghitung rata-rata dan meneruskan tas ke siswa berikutnya. Akhirnya kami memiliki 100 sampel yang terdiri dari 10 siswa yang masing-masing memperkirakan rata-rata populasi yang dapat kami jelaskan melalui histogram dan beberapa statistik deskriptif.
Kami kemudian mengulangi demonstrasi kali ini menggunakan seperangkat 100 "pendapat" yang mereplikasi beberapa pertanyaan Ya / Tidak dari jajak pendapat baru-baru ini, mis. Jika pemilihan umum (Inggris Raya) dipanggil besok, apakah Anda akan mempertimbangkan memilih untuk Partai Nasional Inggris. Para siswa mengambil sampel 10 pendapat ini.
Pada akhirnya kami telah menunjukkan variasi pengambilan sampel, Teorema Limit Pusat, dll dengan data kontinu dan biner.
sumber
Bermain-main dengan kode berikut, memvariasikan nilai
M
dan memilih distribusi selain seragam dapat menjadi ilustrasi yang menyenangkan.sumber
Jika Anda menggunakan Stata, Anda dapat menggunakan perintah -clt- yang membuat grafik distribusi sampel, lihat
http://www.ats.ucla.edu/stat/stata/ado/teach/clt.htm
sumber
Dalam pengalaman saya, CLT kurang bermanfaat daripada yang muncul. Orang tidak pernah tahu di tengah-tengah proyek apakah n cukup besar untuk perkiraan cukup untuk tugas tersebut. Dan untuk pengujian statistik, CLT membantu Anda melindungi kesalahan tipe I tetapi tidak banyak mengurangi kesalahan tipe II. Sebagai contoh, uji-t dapat memiliki daya rendah yang sewenang-wenang untuk n besar ketika distribusi data sangat miring.
sumber