Masuk akal dari teori dan aplikasi statistik

13

Saya baru saja lulus dengan gelar magister saya pada pemodelan medis dan biologi, disertai dengan matematika teknik sebagai latar belakang. Meskipun program pendidikan saya mencakup sejumlah besar kursus statistik matematika (lihat di bawah untuk daftar), yang saya kelola dengan nilai yang cukup tinggi, saya sering kali benar-benar kehilangan pandangan pada teori dan aplikasi statistik. Saya harus mengatakan, dibandingkan dengan matematika "murni", statistik benar-benar tidak masuk akal bagi saya. Terutama notasi dan bahasa yang digunakan oleh sebagian besar ahli statistik (termasuk dosen masa lalu saya) berbelit-belit dan hampir tidak ada sumber daya yang saya lihat sejauh ini (termasuk wikipedia) memiliki contoh sederhana yang dapat dengan mudah dihubungkan dengan seseorang, dan dikaitkan dengan teori yang diberikan. ..

Ini menjadi latar belakang; Saya juga menyadari kenyataan pahit bahwa saya tidak dapat memiliki karir sebagai seorang peneliti / insinyur tanpa memiliki pegangan yang kuat pada statistik, terutama dalam bidang bioinformatika.

Saya berharap saya bisa mendapatkan beberapa tips dari ahli statistik / ahli matematika yang lebih berpengalaman. Bagaimana saya bisa mengatasi masalah ini yang telah saya sebutkan di atas? APAKAH Anda tahu sumber daya yang bagus? seperti buku, e-book, kursus terbuka (via iTunes atau OpenCourseware untuk ex) dll.

EDIT: Seperti yang telah saya sebutkan saya cukup bias (negatif) terhadap mayoritas literatur dengan judul statistik umum, dan karena saya tidak dapat membeli sejumlah buku pelajaran besar (dan mahal) per cabang statistik, apa yang saya perlukan dalam hal buku adalah sesuatu yang mirip dengan apa Tipler & Mosca adalah untuk Fisika, tetapi untuk statistik.

Bagi mereka yang tidak tahu tentang Tipler; itu adalah buku teks besar yang mencakup sebagian besar mata pelajaran yang mungkin ditemui seseorang selama studi yang lebih tinggi, dan menyajikan masing-masing dari pengantar dasar ke detail yang sedikit lebih dalam. Pada dasarnya buku referensi yang sempurna, membelinya pada tahun pertama saya di uni, masih menggunakannya sekali-sekali.


Kursus yang saya ikuti tentang statistik:

  • kursus pengantar besar,
  • proses stokastik stasioner,
  • Proses Markov,
  • Metode Monte Carlo
  • Analisis kelangsungan hidup
posdef
sumber

Jawaban:

4

Saya benar-benar dapat memahami situasi Anda. Meskipun saya seorang mahasiswa PhD, kadang-kadang saya merasa sulit untuk teori dan aplikasi terkait. Jika Anda ingin membenamkan diri dalam memahami teori, itu pasti bermanfaat ketika Anda berpikir tentang masalah dunia nyata. Tetapi prosesnya mungkin membuat frustrasi.

Salah satu dari banyak referensi yang saya sukai adalah Analisis Data Gelman dan Hill Menggunakan Model Hierarchical / Multilevel . Mereka menghindari teori di mana mereka dapat mengekspresikan konsep yang mendasarinya menggunakan simulasi. Ini pasti akan menguntungkan Anda karena Anda memiliki pengalaman dalam MCMC dll. Seperti yang Anda katakan, Anda bekerja dalam bioinformatika, mungkin Strategi Pemodelan Regresi Harrell adalah referensi yang bagus juga.

Saya akan menjadikan ini sebagai wiki komunitas dan membiarkan orang lain menambahkannya.

suncoolsu
sumber
Terima kasih atas perhatian Anda pada masalah ini. Sangat menyenangkan untuk melihat bahwa saya bukan satu-satunya yang bingung tentang barang-barang itu. Yang sedang berkata, saya pikir Anda sudah melebih-lebihkan situasi saya; sementara saya telah mengambil sejumlah mata kuliah dan akrab dengan keberadaan sejumlah cara analisis statistik yang berbeda; mereka tidak pernah bertahan dengan saya setelah kursus. Beberapa bulan setelah ujian, saya terus bertanya-tanya; "Aku pernah melihat / mendengar ini di suatu tempat, tetapi bagaimana cara kerjanya sebenarnya?" Bagi saya ini menunjukkan bahwa saya perlu meruntuhkan semuanya dan mulai membangunnya dengan fondasi yang lebih kuat.
posdef
Saya akan menambahkan "setuju" untuk teks Harrell (note spelling). Ini sangat baik seperti kombinasi dua paket dari kode R yang menyertainya. Saya juga berpikir "Statistik Terapan Modern dengan S" oleh Venables dan Ripley akan menjadi akuisisi yang baik. Saya memiliki latar belakang tingkat master (dengan gelar sarjana dalam fisika) sebelum menggunakan MASS untuk belajar R. Ada banyak kebijaksanaan aplikasi dalam teks itu.
DWin
Buku regresi Gelman sangat bagus, ia menjelaskan semuanya dengan sangat baik, dan memberikan kode R yang sangat berguna untuk memeriksa pemahaman Anda tentang materi tersebut.
richiemorrisroe
2

Apakah Anda terbiasa dengan Analisis Data Bayesian (oleh Gelman, Carlin, Stern, dan Rubin)? Mungkin itu yang Anda butuhkan.

mef
sumber
2

Semua masalah statistik sangat penting untuk mengikuti 4 langkah (yang saya pinjam dari @whuber menjawab pertanyaan lain ):

  1. Perkirakan parameter.

  2. Nilai kualitas perkiraan itu.

  3. Jelajahi data.

  4. Evaluasi kecocokan.

Anda dapat bertukar parameter kata dengan model kata .

Buku statistik biasanya menyajikan dua poin pertama untuk berbagai situasi. Masalah bahwa setiap aplikasi dunia nyata memerlukan pendekatan yang berbeda, maka model yang berbeda, sehingga sebagian besar dari buku-buku tersebut akhirnya membuat katalog model-model yang berbeda ini. Ini memiliki efek yang tidak diinginkan sehingga mudah kehilangan diri sendiri dalam detail dan kehilangan gambaran besarnya.

Buku bergambar besar yang saya sungguh-sungguh merekomendasikan adalah statistik Asymptotic . Ini memberikan perawatan yang ketat dari topik dan secara matematis "murni". Meskipun judulnya menyebutkan statistik asimptotik, rahasia besar yang tak terhitung adalah bahwa sebagian besar metode statistik klasik pada dasarnya didasarkan pada hasil asimptotik.

mpiktas
sumber
2

Saya pikir hal terpenting di sini adalah mengembangkan intuisi tentang statistik dan beberapa konsep statistik umum. Mungkin cara terbaik untuk melakukan ini adalah memiliki beberapa domain yang dapat Anda "miliki." Ini dapat memberikan lingkaran umpan balik positif di mana pemahaman tentang domain membantu Anda memahami lebih banyak tentang statistik yang mendasarinya, yang membantu Anda memahami lebih banyak tentang domain, dll.

Bagi saya domain itu adalah statistik bisbol. Saya mengerti bahwa adonan yang masuk 3 untuk 4 dalam permainan bukan "benar" 0,750 pemukul. Ini membantu untuk memahami poin yang lebih umum bahwa data sampel tidak sama dengan distribusi yang mendasarinya. Saya juga tahu dia mungkin lebih dekat dengan pemain rata-rata daripada pemukul 0,750, jadi ini membantu untuk memahami konsep-konsep seperti regresi ke mean. Dari sana saya bisa sampai pada kesimpulan Bayesian penuh di mana distribusi probabilitas saya sebelumnya memiliki rata-rata pemain bisbol rata-rata, dan saya sekarang memiliki 4 sampel baru yang dapat digunakan untuk memperbarui distribusi posterior saya.

Saya tidak tahu apa domain itu untuk Anda, tetapi saya kira itu akan lebih bermanfaat daripada buku teks biasa. Contoh membantu memahami teori, yang membantu memahami contoh. Sebuah buku pelajaran dengan contoh-contoh bagus, tetapi kecuali jika Anda dapat membuat contoh-contoh itu "milik Anda" maka saya ingin tahu apakah Anda akan mendapatkan cukup dari mereka.

Michael McGowan
sumber
1

Semua orang belajar secara berbeda, tetapi saya pikir aman untuk mengatakan bahwa contoh, contoh, contoh, banyak membantu dalam statistik. Saran saya adalah belajar R (hanya dasar-dasarnya yang cukup banyak membantu) dan kemudian Anda dapat mencoba setiap dan setiap contoh sampai mata Anda berdarah. Anda dapat mengurutkannya, menyesuaikannya, merencanakannya, apa saja. Dan, karena R diarahkan pada statistik, saat Anda belajar R, Anda akan belajar statistik. Buku-buku yang Anda daftarkan kemudian dapat diserang dari sudut pandang "tunjukkan padaku".

Karena R gratis, dan banyak sumber materi gratis, semua yang Anda butuhkan untuk berinvestasi adalah waktu Anda.

http://www.mayin.org/ajayshah/KB/R/index.html

http://math.illinoisstate.edu/dhkim/rstuff/rtutor.html

http://www.cyclismo.org/tutorial/R/

http://www.stat.pitt.edu/stoffer/tsa2/R_time_series_quick_fix.htm

http://www.statmethods.net/about/books.html

Ada banyak buku bagus tentang R yang bisa Anda beli, inilah yang saya gunakan:

http://www.amazon.com/Introductory-Statistics-R-Peter-Dalgaard/dp/0387954759

Edit ============

Saya lupa menambahkan beberapa tautan. Jika Anda menggunakan Windows, editor yang baik untuk memberi makan R adalah Tinn-R (orang lain dapat menambahkan tautan untuk editor di Mac, atau Linux).

http://www.sciviews.org/Tinn-R/

http://cran.r-project.org/web/packages/TinnR/

bill_080
sumber
terima kasih atas tautannya, saya akan mencoba dan menjelajahinya sebanyak mungkin dalam beberapa minggu mendatang ... Saya pernah terpapar R sekali sebelumnya, dalam kursus analisis kelangsungan hidup di mana kami melakukan banyak regresi multivarian (cox dan aelen model) dan banyak hal lain yang saya tidak ingat. Kesan saya pada R, sebagai orang yang sangat terbiasa dengan MATLAB cukup negatif, tetapi saya melakukannya karena banyak hal yang membuat kami kurang lebih terlempar ke ujung kolam, dan kemudian diharapkan belajar untuk berenang sendiri, yang tentu saja menyebabkan saya membenci perangkat lunak sejak saat itu :) Waktu untuk mengubah itu mungkin
posdef
1

Saya pribadi menyukai ini yang memiliki campuran teori dan aplikasi yang sangat bagus (dengan banyak contoh). Itu cocok dengan casella dan berger untuk pendekatan yang lebih berorientasi teori. Dan untuk ikhtisar kuas yang luas ini .

selalu
sumber
Kedua buku tampaknya memiliki ulasan yang baik tentang amazon, adakah yang bisa menambahkan pendapat (mungkin sedikit lebih detail) tentang ini? btw; by casella & berger maksud Anda "Statistik Inferensi"?
posdef
Ya 'inferensi statistik'. Bagi saya langkah besar adalah mulai dari memahami model probabilitas untuk memahami bagaimana menggunakan data untuk menguji model dan memperkirakan parameter model. Terutama buku Davison yang benar-benar fokus pada poin ini.
alwaysean