Apa yang harus diajarkan terlebih dahulu: Probabilitas atau Statistik?

19

Saya baru saja bergabung sebagai anggota fakultas di departemen matematika. dari sebuah institusi terkenal. Saya akan mengajarkan Probabilitas dan Statistik program studi di tingkat sarjana. Lembaga ini sudah memiliki silabus untuk kursus ini yang saya tidak puas. Dalam silabus itu, statistik dibahas pertama kali, juga bagian estimasi tidak ada. Saya selalu berpikir dasar-dasar probabilitas harus diajarkan sebelum mengajar statistik. Bisakah seseorang memberi pendapat tentang ini? Juga saran untuk topik yang harus dibahas dalam kursus seperti ini sangat dihargai.

Ashok
sumber
3
Tampak bagi saya bahwa pemahaman dasar (tidak harus konsep terlalu matematika) probabilitas diperlukan untuk mendapatkan logika dan intuisi di balik teknik statistik sebagaimana dibuktikan oleh fakta bahwa sebagian besar buku statistik tingkat dasar dimulai dengan probabilitas. Di kelas sarjana bisnis saya juga, kami pertama diajarkan probabilitas dan kemudian statistik.
rsl
4
Apakah statistik, atau statistik terapan ..? Banyak dari statistik yang diterapkan dapat dipikirkan tanpa pengantar yang rinci untuk probabilitas. Ini juga bisa menjadi apetizer yang bagus untuk probabilitas dan statistik teoritis nanti. Jadi itu tidak harus menjadi ide yang buruk.
Tim
3
Program gelar apa yang diikuti siswa? Apakah mereka jurusan matematika, atau modul yang ditawarkan terutama untuk siswa dari departemen lain, katakanlah sosiologi atau bisnis?
Robert Long
@ Roberttong: Dikatakan bahwa mekanik engg. siswa dan siswa matematika utama kita sendiri akan menghadiri kursus. Lainnya dari engg listrik ekonomi. dan siswa sains komputer mungkin juga hadir.
Ashok

Jawaban:

22

Tampaknya itu bukan lagi masalah opini: dunia tampaknya telah bergerak jauh melampaui "probabilitas mengajar dan kemudian mengajar statistik sebagai penerapannya." Untuk mengetahui arah pengajaran statistik, lihat daftar judul makalah dalam edisi khusus The American Statistician tahun lalu (direproduksi di bawah): tidak ada satu pun yang merujuk pada probabilitas.

Mereka mendiskusikan pengajaran probabilitas dan perannya dalam kurikulum. Contoh yang baik adalah makalah George Cobb dan tanggapannya . Berikut beberapa kutipan yang relevan:

Praktik statistik modern jauh lebih luas daripada yang diakui oleh penekanan kurikuler tradisional kami pada inferensi berbasis probabilitas.

Apa yang kita ajarkan tertinggal beberapa dekade di belakang apa yang kita praktikkan. Paradigma kurikuler kami menekankan inferensi formal dari orientasi frequentist, berdasarkan baik pada teorema limit pusat pada level entry atau, dalam kursus untuk jurusan matematika, pada set kecil model probabilitas parametrik yang cocok untuk solusi bentuk tertutup yang diperoleh dengan menggunakan kalkulus . Kesenjangan antara kurikulum kami yang berusia setengah abad dan praktik statistik kontemporer kami terus melebar.

Tesis saya ... adalah bahwa sebagai profesi kita baru mulai mengeksplorasi kemungkinan. Sejarah mata pelajaran kami juga mendukung tesis ini: Tidak seperti probabilitas, sebagian besar matematika, statistik tumbuh secara de novo dari tanah sains.

Probabilitas adalah konsep yang terkenal licin. Kesenjangan antara intuisi dan perawatan formal mungkin lebih luas daripada cabang matematika terapan lainnya. Jika kita bersikeras bahwa pemikiran statistik harus berdasarkan pada model probabilitas, bagaimana kita mendamaikan persyaratan itu dengan tujuan membuat ide-ide sentral "sederhana dan mudah didekati" dan meminimalkan "prasyarat untuk penelitian"?

Sebagai eksperimen pemikiran, jalankan melalui konsep dasar dan teori estimasi. Perhatikan bagaimana hampir semuanya dapat dijelaskan dan diilustrasikan hanya menggunakan kalkulus semester pertama, dengan probabilitas yang diperkenalkan di sepanjang jalan.

Tentu saja kami ingin siswa untuk belajar kalkulus dan probabilitas, tetapi alangkah baiknya jika kami dapat bergabung dengan semua ilmu lain dalam mengajarkan konsep dasar subjek kami kepada siswa tahun pertama.

Jauh lebih seperti ini. Anda bisa membacanya sendiri; bahan tersedia secara bebas.

Referensi

Edisi khusus Ahli Statistik Amerika tentang "Statistik dan Kurikulum Sarjana" (November, 2015) tersedia di http://amstat.tandfonline.com/toc/utas20/69/4 .

Mengajar Generasi Statistik Selanjutnya Siswa untuk “Berpikir Dengan Data”: Edisi Khusus tentang Statistik dan Kurikulum Sarjana Nicholas J. Horton & Johanna S. Hardin DOI: 10.1080 / 00031305.2015.1094283

Renovasi Mere Terlalu Sedikit Terlambat: Kita Perlu Memikirkan Kembali Kurikulum Sarjana kita dari Bawah ke Atas George Cobb DOI: 10.1080 / 00031305.2015.1093029

Mengajar Statistik di Google-Scale Nicholas Chamandy, Omkar Muralidharan & Stefan Taruhan halaman 283-291 DOI: 10.1080 / 00031305.2015.1089790

Penjelajahan dalam Penelitian Statistik: Suatu Pendekatan untuk Mengekspos Sarjana untuk Analisis Data Otentik Deborah Nolan & Duncan Temple Lang DOI: 10.1080 / 00031305.2015.1073624

Melampaui Normal: Mempersiapkan sarjana untuk Angkatan Kerja dalam Konsultasi Statistik Capstone Byran J. Smucker & A. John Bailer DOI: 10.1080 / 00031305.2015.1077731

Kerangka Kerja untuk Menanamkan Pengalaman Data Otentik dalam Statistik Program Scott D. Grimshaw DOI: 10.1080 / 00031305.2015.1081106

Mengembangkan Pemahaman Konseptual dalam Statistik Matematika Jennifer L. Green & Erin E. Blankenship DOI: 10.1080 / 00031305.2015.1069759

Kursus Kedua dalam Statistik: Desain dan Analisis Eksperimen? Natalie J. Blades, G. Bruce Schaalje & William F. Christensen DOI: 10.1080 / 00031305.2015.1086437

Kursus Ilmu Data untuk Sarjana: Berpikir Dengan Data Ben Baumer DOI: 10.1080 / 00031305.2015.1081105

Ilmu Data dalam Kurikulum Statistik: Mempersiapkan Siswa untuk "Berpikir dengan Data" J. Hardin, R. Hoerl, Nicholas J. Horton, D. Nolan, B. Baumer, O. Hall-Holt, P. Murrell, R. Peng, P Roback, D. Temple Lang & MD Ward DOI: 10.1080 / 00031305.2015.1077729

Menggunakan Simulasi Berbasis Game Online untuk Memperkuat Pemahaman Siswa tentang Masalah Statistik Praktis dalam Analisis Data Dunia Nyata Shonda Kuiper & Rodney X. Sturdivant DOI: 10.1080 / 00031305.2015.1075421

Memerangi Pemikiran Anti-Statistik Menggunakan Metode Berbasis Simulasi Di Seluruh Kurikulum Sarjana Nathan Tintle, Beth Chance, George Cobb, Soma Roy, Todd Swanson & Jill VanderStoep DOI: 10.1080 / 00031305.2015.1081619

Apa yang Harus Diketahui Para Guru Tentang Bootstrap: Menyelidiki Kembali dalam Kurikulum Statistik Sarjana Tim C. Hesterberg DOI: 10.1080 / 00031305.2015.1089789

Memasukkan Studi Statistik Konsultatif Studi Kasus di Seri Waktu Pengantar Program Davit Khachatryan DOI: 10.1080 / 00031305.2015.1026611

Mengembangkan Program Sarjana Analitik Komputasi Interdisipliner Baru: Pendekatan Kualitatif-Kuantitatif-Kualitatif Skotlandia Leman, Leanna House & Andrew Hoegh DOI: 10.1080 / 00031305.2015.1090337

Dari Pedoman Kurikulum hingga Hasil Belajar: Penilaian di Tingkat Program Beth Chance & Roxy Peck DOI: 10.1080 / 00031305.2015.1077730

Penilaian Program untuk Statistik Sarjana, Mayor Allison Amanda Moore & Jennifer J. Kaplan DOI: 10.1080 / 00031305.2015.1087331

whuber
sumber
3
(+1) Saya pikir ini adalah respons yang bagus. Masalah dengan teori probabilitas pengajaran pertama, adalah memberi kesan bahwa statistik berkaitan dengan spesifikasi, pemasangan, dan diagnostik model probabilistik. Tidak hanya ini hanya sebagian kecil dari statistik, tetapi melompati beberapa masalah paling mendasar ketika berpikir tentang data: bagaimana memvisualisasikannya dan bagaimana meringkasnya. Apa manfaat relatif dari rata-rata atau median untuk mengidentifikasi lokasi suatu dataset? Bagaimana kita harus melakukan tabulasi silang hasil kita? Grafik apa yang sesuai, dan apa yang mereka beri tahu tentang data?
Silverfish
@ Silververfish, ini sangat berbeda dari cara orang-orang seperti Bernoulli mendekati statistik. Lihatlah makalahnya yang indah ini. Suatu usaha untuk menganalisis kematian yang disebabkan oleh cacar dan manfaat inokulasi untuk mencegahnya . Dia pada dasarnya memulai epidemiologi modern dengan itu. Jika dia terpaku pada hal-hal yang Anda sebutkan seperti visualisasi dll., Dia tidak akan membawa wawasan ke dalam pemahaman proses yang mendasarinya.
Aksakal
2π
Untuk terobosan awal dalam epidemiologi, saya akan menyampaikan kepada Anda studi John Snow tentang wabah kolera Broad Street 1854 - sesuatu yang ditemukan dalam banyak buku bagus yang memperkenalkan visualisasi data, dan proses pemikiran yang tentunya harus menjadi jantung Stats 101.
Silverfish
1
@ Akakal Saya menghargai Anda menyebutkan Bernoulli. Namun, bagaimana para perintis dan ahli matematika hebat mendekati dan memecahkan masalah adalah hal yang sama sekali berbeda dari bagaimana solusi harus diajarkan. Saya ingin menekankan bahwa tidak ada seorang pun (afaik) yang menganjurkan tidak mengajarkan probabilitas: pertanyaan tersebut menyangkut kapan ide-ide seperti itu harus diperkenalkan dalam kurikulum pengantar (perguruan tinggi) dan sejauh mana mereka harus dikejar. Ada alasan pedagogis yang kuat (didasarkan pada psikologi serta pengalaman mengajar) untuk memperkenalkan banyak ide statistik terlebih dahulu.
whuber
7

Bentuk jamak dari anekdot bukanlah data, tetapi dalam hampir semua kursus yang pernah saya lihat, setidaknya dasar-dasar probabilitas muncul sebelum statistik.

Di sisi lain, secara historis, kuadrat terkecil biasa dikembangkan sebelum distribusi normal ditemukan! Metode statistik yang lebih dulu, pembenaran berbasis probabilitas yang lebih ketat tentang mengapa itu berhasil datang kedua!

Sejarah Statistik Stephen Stigler : Pengukuran Ketidakpastian Sebelum 1900 membawa pembaca melalui perkembangan sejarah:

  • Matematikawan, astronom memahami mekanika dasar dan hukum gravitasi. Mereka dapat menggambarkan gerakan benda-benda langit sebagai fungsi dari beberapa parameter.
  • Mereka juga memiliki ratusan pengamatan terhadap benda-benda angkasa, tetapi bagaimana seharusnya pengamatan dikombinasikan untuk memulihkan parameter?
    • Seratus pengamatan memberi Anda seratus persamaan, tetapi jika hanya ada tiga yang tidak diketahui untuk dipecahkan, ini adalah sistem yang terlalu ditentukan ...
  • Legendre pertama kali mengembangkan metode meminimalkan jumlah kesalahan kuadrat. Kemudian ini dihubungkan dengan pekerjaan dalam probabilitas Gauss dan Laplace, bahwa kuadrat terkecil biasa dalam beberapa hal optimal mengingat kesalahan yang didistribusikan secara normal.

Mengapa saya membawa ini?

Ada keanggunan logis tertentu untuk pertama membangun mesin matematika yang diperlukan untuk memperoleh, memahami beberapa metode, untuk meletakkan fondasi sebelum Anda membangun rumah.

Namun dalam kenyataan sains, rumah sering didahulukan, fondasi kedua: P.

Saya ingin melihat hasil dari literatur pendidikan. Apa yang lebih efektif untuk mengajar? Lalu mengapa? Atau mengapa lalu apa?

(Saya mungkin orang yang aneh, tetapi saya menemukan kisah bagaimana kuadrat terkecil dikembangkan menjadi pengubah halaman yang menarik! Cerita dapat membuat hal-hal yang membosankan dan abstrak menjadi hidup ...)

Matthew Gunn
sumber
2
Literatur pendidikan statistik tampaknya konsisten dan tegas tentang masalah ini: probabilitas bukan statistik, statistik jauh lebih dari probabilitas, dan statistik (setidaknya di tingkat K-12 dan perguruan tinggi) harus diperkenalkan sebagai pemikiran dengan data daripada sebagai aplikasi probabilitas. Selain referensi yang saya berikan dalam jawaban saya, periksa beberapa sumber daya lain yang tersedia secara bebas seperti CauseWeb , GAISE , dan J. Statistics Education .
whuber
4

Saya pikir itu harus menjadi proses berulang bagi kebanyakan orang: Anda belajar sedikit probabilitas, lalu sedikit statistik, kemudian sedikit lebih banyak probabilitas, dan sedikit lagi statistik dll.

Misalnya, lihat persyaratan Stat PhD di GWU. Kursus tingkat probabilitas PhD 8257 memiliki deskripsi singkat berikut:

STAT 8257. Probability. 3 Credits.
Probabilistic foundations of statistics, probability distributions, random variables, moments, characteristic functions, modes of convergence, limit theorems, probability bounds. Prerequisite: STAT 6201– STAT 6202, knowledge of calculus through functions of several variables and series.

Catatan, bagaimana ia memiliki program statistik tingkat Master 6201 dan 6202 di prasyarat. Jika Anda menelusuri stat tingkat terendah atau kursus probabilitas di GWU, Anda akan mendapatkan Pengantar Statistik Bisnis dan Ekonomi 1051 atau Pengantar Statistik dalam Ilmu Sosial 1053 . Berikut deskripsi salah satunya:

STAT 1051. Introduction to Business and Economic Statistics. 3 Credits.
Lecture (3 hours), laboratory (1 hour). Frequency distributions, descriptive measures, probability, probability distributions, sampling, estimation, tests of hypotheses, regression and correlation, with applications to business.

Perhatikan, bagaimana kursus memiliki judul "Statistik" tetapi itu mengajarkan probabilitas di dalamnya. Bagi banyak orang ini adalah pertemuan pertama dengan teori Probabilitas setelah kursus "Stats" SMA.

Ini agak mirip dengan bagaimana itu diajarkan di masa saya: kursus dan buku teks biasanya berjudul "Teori probabilitas dan statistik matematika", misalnya teks Gmurman .

Saya tidak bisa membayangkan mempelajari teori probabilitas tanpa statistik apa pun. Kursus tingkat PhD di atas 8257 mengasumsikan Anda sudah tahu statistik. Jadi, bahkan jika Anda pertama kali mengajarkan probabilitas, akan ada beberapa pembelajaran statistik yang terlibat. Ini hanya untuk kursus pertama mungkin masuk akal untuk sedikit lebih menimbang statistik, dan menggunakannya untuk memperkenalkan teori probabilitas juga.

Pada akhirnya ini merupakan proses berulang seperti yang saya jelaskan di awal. Dan karena dalam setiap proses iteratif yang baik, langkah pertama tidak penting, apakah konsep pertama berasal dari statistik atau probabilitas tidak akan menjadi masalah setelah beberapa iterasi: Anda akan sampai ke tempat yang sama.

Catatan akhir, pendekatan pengajaran tergantung pada bidang Anda. Jika Anda mempelajari fisika, Anda akan mendapatkan hal-hal seperti mekanika statistik, statistik Fermi-Dirac, yang tidak akan Anda hadapi dalam ilmu sosial. Juga, dalam fisika, pendekatan yang sering digunakan adalah alami, dan pada kenyataannya mereka berada di dasar beberapa teori mendasar. Oleh karena itu, masuk akal untuk memiliki teori probabilitas yang berdiri sendiri diajarkan sejak awal, tidak seperti ilmu sosial di mana mungkin tidak masuk akal untuk menghabiskan waktu di atasnya dan malah lebih banyak menimbang pada statistik.

Aksakal
sumber
2
Kurikulum PhD, di muka itu, tampaknya akan memberikan sedikit panduan tentang bagaimana cara mengajar subjek untuk sarjana. Tujuan dan audiens sangat berbeda. Saya akan menambahkan catatan pribadi: dalam interaksi saya dengan beberapa departemen statistik yang mapan, saya telah melihat bahwa kurikulum mencerminkan gagasan pedagogi dan perkembangan berusia 30 tahun dan akan terus melakukannya sampai generasi profesor yang baru mengambil alih. Mungkin kita harus berhati-hati menggunakan kurikulum seperti itu sebagai model normatif dari apa yang harus dilakukan.
whuber
1
@whuber Dan kemudian kurikulum akan mencerminkan ide-ide lama 30 tahun ... tapi setidaknya mereka tidak akan menjadi ide-ide berusia 60 tahun. Bagaimanapun, seperti yang dikatakan, sains maju, pemakaman dengan pemakaman.
Mark L. Stone