Apa buku tunggal paling berpengaruh yang harus dibaca oleh setiap ahli statistik?

77

Jika Anda bisa kembali ke masa lalu dan berkata pada diri sendiri untuk membaca buku tertentu di awal karier Anda sebagai ahli statistik, buku apa itu?

Neil McGuigan
sumber
1
Sebenarnya ada tiga pertanyaan terpisah di sini! 1) Apa buku tunggal paling berpengaruh dalam statistik; 2) Buku apa yang harus dibaca oleh setiap ahli statistik; 3) Buku apa yang sudah Anda baca yang paling Anda harap akan Anda baca jauh lebih awal. (2) dan (3) mungkin memiliki banyak tumpang tindih; (1) mungkin sangat berbeda.
onestop
1
Pertanyaan ini adalah cara lain dalam memandang pertanyaan ini. Saya berharap itu akan memberikan pelengkap yang baik, setelah mendapat jawaban yang baik.
naught101

Jawaban:

38

Berikut adalah dua untuk dimasukkan dalam daftar:

Tufte. Tampilan visual informasi kuantitatif
Tukey. Analisis data eksplorasi

Rob Hyndman
sumber
10
Keduanya layak dibaca ulang secara berkala, mungkin sekali satu dekade, hanya untuk menyegarkan kembali idenya. Mengenai Tukey: senang sekali duduk hanya dengan pensil dan kertas sesekali dan melakukan analisis mendalam terhadap dataset yang menarik.
whuber
6
Untuk grafik untuk seorang ahli statistik, saya lebih suka buku-buku William Cleveland daripada Tufte.
Peter Flom - Reinstate Monica
1
Saya merasa buku-buku ini dimaksudkan untuk menganalisis data non-linear ketika metode non-linear tidak tersedia?
Robert Kubrick
34

Elemen Pembelajaran Statistik dari Hastie, Tibshirani, dan Friedman http://www-stat.stanford.edu/~tibs/ElemStatLearn/ harus ada di perpustakaan ahli statistik mana pun!

robin girard
sumber
6
Saya tidak setuju - yang satu terkait erat dengan pembelajaran mesin, bukan statistik per se !
aL3xa
@ aL3xa: tentu saja fokus pada pembelajaran mesin ... itulah sebabnya saya pikir para ahli statistik harus mengenalnya sejak dini.
Cliff AB
Rupanya saya minoritas dalam berpikir buku ini berlebihan. Tampaknya ditulis untuk siswa tingkat pascasarjana, tetapi orang yang tidak peduli tentang detail bagaimana sesuatu bekerja.
The Laconic
25

Saya bukan ahli statistik, dan saya belum banyak membaca tentang topik itu, tapi mungkin

Lady Tasting Tea: Bagaimana Statistik Merevolusi Ilmu Pengetahuan di Abad ke-20

harus disebutkan? Ini bukan buku pelajaran, tapi masih layak dibaca.

Vivi
sumber
1
Saya yang kedua ini. Juga, ada cukup banyak saran untuk bacaan lebih lanjut yang menurut saya berguna dalam buku ini.
Chris Beeley
1
Saya pikir buku ini berbicara kepada mereka yang tidak tahu apa-apa di awal tetapi kebodohan bahasa dan beban budaya yang terkait dengan lapangan. Buku ini memberikan sayap pikiran - dikatakan bahwa statistik adalah tentang menemukan kebenaran yang berguna di lautan kebisingan dan kesalahpahaman.
EngrStudent
2
Banyak orang melaporkan ini sebagai hiburan, tetapi penuh dengan kesalahan luar biasa. Jika Anda dapat menemukannya, ulasan saya di Biometrics 57: 1273-1274 (2001) memberikan daftar yang jauh dari lengkap. (Salsburg mencampurkan berbagai Bernoullis, yang lebih mudah dilakukan.)
Nick Cox
21

Teori Probabilitas: Logika Ilmu Pengetahuan

Christopher D. Long
sumber
Buku ini sulit. Ini tentang dasar-dasar probabilitas, dan bahkan di bagian Statistik, saya tidak berpikir itu adalah teks referensi. Saya percaya mungkin ada 14 orang di planet Bumi yang membaca dan memahami pesan lengkapnya, tetapi saya mungkin akan mengklasifikasikan ini sebagai bacaan wajib bagi para probabilis, demi ribuan orang lain yang terlibat dalam hal-hal mendalam seperti GLM, GAM, Model Bayesian dan hal lainnya.
means-to-meaning
1
Agak menyedihkan bahwa beberapa bab selanjutnya hilang dan / atau sedang dikembangkan - misalnya tidak ada bab tentang regresi, tetapi naskah naskah yang tidak diterbitkan tersedia dengan beberapa wawasan yang menarik tentang regresi "kesalahan pengukuran". Beberapa hal yang sangat keren tentang deret waktu.
probabilityislogic
21

Darrell Huff - Cara Berbohong dengan Statistik

Rob Hyndman
sumber
5
Kembali ketika ini adalah $ 3,95 dan kemudian $ 4,95, saya membeli salinan oleh selusin dan memberikannya kepada teman, klien, dan siapa pun yang mungkin tertarik.
whuber
Sudah sepatutnya diingat. Tetapi konten non-statistik tanggal sayangnya, paling tidak sebagian besar dari kartun yang menampilkan orang (dan bahkan bayi) merokok. 60+ tahun kemudian, itu tidak lucu lagi. (Beberapa cetak ulang misalnya satu di Inggris memperbarui kartun.)
Nick Cox
14

Bukan buku, tetapi saya baru-baru ini menemukan sebuah artikel oleh Jacob Cohen di American Psychologist berjudul "Hal-hal yang telah saya pelajari (sejauh ini)." Ini tersedia sebagai pdf di sini .

Freya Harrison
sumber
Itulah artikel yang luar biasa, ditulis dengan gaya percakapan yang jernih dan cohen.
richiemorrisroe
12

Dahulu, monograf kecil Jack Kiefer "Pengantar Inferensi Statistik" mengupas misteri banyak statistik klasik dan membantu saya memulai dengan literatur lainnya. Saya masih merujuknya dan dengan hangat merekomendasikannya kepada siswa yang kuat dalam kursus statistik tahun kedua.

Rob Hyndman
sumber
2
Rekomendasi bagus, terima kasih - Saya mendapat salinan baru-baru ini berdasarkan ini dan itu benar-benar bagus.
ars
1
Saya senang mendengar orang lain menghargai buku ini!
whuber
12

Saya tidak akan berdebat bahwa salah satu dari ini harus dianggap "buku paling berpengaruh ... [untuk] ahli statistik", tetapi bagi mereka yang baru mulai belajar tentang topik ini, dua buku bermanfaat adalah:

  1. Robert Abelson, Statistik sebagai Argumen Berprinsip
  2. Paul Murrell, Pengantar Teknologi Data
gung - Pasang kembali Monica
sumber
Abelson akan bermanfaat bagi banyak orang yang tidak hanya memulai, juga.
Peter Flom - Pasang kembali Monica
11

Buku William Cleveland "The Elements of Graphing Data" atau bukunya "Visualisasi Data"

Robert Alberts
sumber
1
Saat ini saya sedang membaca The Elements (Visualisasi Data tidak ada di perpustakaan sekolah saya saat ini). Apa perbedaan antara Elemen & Visualisasi Data? Saya belum dapat menemukan deskripsi yang cukup rinci untuk merumuskan apa sebenarnya perbedaan antara keduanya.
Andy W
2
Saya setuju. Saya pikir, bagi ahli statistik, Cleveland lebih baik daripada Tufte.
Peter Flom - Reinstate Monica
3
+1 untuk Robert Alberts, & +1 untuk Peter Flom (buku-buku Cleveland jelas lebih baik bagi para ahli statistik, meskipun Tufte juga indah, dan saya telah membaca semuanya). @AndyW, Elements adalah pengantar, misalnya, ia memiliki panduan untuk membuat grafik yang informatif. Visualisasi menunjukkan cara memusatkan proses eksplorasi data Anda di sekitar grafik; ini dimulai dengan visualisasi awal data, berbicara tentang masalah yang ada dan berjalan sepanjang jalan untuk menilai model akhir (misalnya, analisis residual) melalui grafik. Yang terakhir ini jauh lebih informatif daripada yang pertama.
gung - Reinstate Monica
@AndyW Salah satu dari mereka sedikit lebih teknis daripada yang lain (saya lupa yang mana meskipun!)
Peter Flom - Reinstate Monica
1
Seperti yang dikatakan @gung, Visualisasi adalah lanjutan dari Elemen . Ada beberapa tumpang tindih tetapi membantu daripada menjengkelkan. Keduanya sangat disarankan. Revisi terakhir bertanggal 1993 dan 1994, tetapi mereka masih segar 20+ tahun kemudian. Perhatikan bahwa pembaca non-teknis akan mendapatkan nilai dari keduanya: Saya dapat menjamin secara pribadi bahwa matematika sekolah menengah adalah latar belakang yang cukup.
Nick Cox
6

Di sisi matematika / dasar: Metode Statistik Matematika Harald Cramér .

ars
sumber
Ngomong-ngomong, ini adalah tempat paling awal yang saya temukan menyebutkan tentang Cramer's phi. Luar biasa bagaimana seorang sidenote kecil yang cantik dalam buku itu menjadi metode yang terkenal beberapa dekade kemudian.
Tal Galili
5

Untuk penjelasan yang jelas tentang apa yang seharusnya ada dalam artikel jurnal ilmu sosial (bantuan jika Anda menulis atau peer review), saya suka Panduan Reviewer untuk Metode Kuantitatif dalam Ilmu Sosial . Secara khusus saya suka tabel desideratra sebagai sinopsis minimum yang makalah (artikel, tesis, disertasi) harus berisi. Bab-bab dipisahkan oleh teknik analisis, yang bagus. Saya pikir buku ini memiliki aplikasi yang lebih luas daripada "hanya" ilmu sosial karena teknik yang digunakan digunakan di banyak bidang.

Cukup awal, jadi mungkin tidak tercakup oleh pertanyaan, saya diperkenalkan dengan Pengantar Ott untuk Metode Statistik dan Analisis Data . Ini cukup mahal, tetapi merupakan sumber yang bagus untuk menunjukkan model statistik yang mendasari berbagai metode GLM. Saya memimpikan hari dimana jurnal membutuhkan artikel berisi menunjukkan formula model statistik yang diuji.

Untuk memeriksa asumsi tes, melihat efek dari berbagai pilihan dalam suatu tes, dan sebagainya, ini adalah satu buku yang saya harap saya miliki ketika saya belajar . Saya memiliki edisi sebelumnya dan ini adalah salah satu sumber daya umum terbaik yang telah saya beli karena cara yang jelas dan konsisten di mana informasi tentang tes diletakkan. Ini berisi contoh-contoh bagus yang menggambarkan tes, dan tidak mengharuskan pembaca untuk memiliki paket statistik tertentu untuk mengikuti paparan.

Michelle
sumber
4

Tertipu Oleh Keacakan oleh Taleb

Taleb adalah seorang profesor di Columbia dan pedagang pilihan. Dia menghasilkan sekitar $ 800 juta dolar pada 2008 bertaruh melawan pasar. Dia juga menulis Black Swan. Dia membahas absurditas menggunakan distribusi normal untuk memodelkan pasar, dan berfilsafat mengenai kemampuan kita untuk menggunakan induksi.

Neil McGuigan
sumber
8
Buku yang mengerikan, ditulis oleh seseorang yang tidak mengerti statistik ...
Xi'an
4
Xi'an, ingin memperluas, atau menyediakan tautan ke beberapa kritik?
naught101
4
Ada banyak komentar di The Black Swan (dan Taleb lebih umum) di sini
Peter Flom - Reinstate Monica
4

Saya telah membaca rekomendasi di atas dan terkejut menemukan bahwa sebagian besar orang yang menjawab pertanyaan adalah orang-orang yang bukan ahli statistik itu sendiri. Dengan 2 atau 3 pengecualian ... Sebagai ahli statistik industri yang kebetulan bekerja dengan ilmuwan sosial dan profesional kesehatan, saya akan mengatakan bahwa jika saya bisa membawa hanya satu buku ke pulau terpencil, itu adalah George EP Box, Statistik untuk Eksperimen (Wiley). Dalam gaya humoris dan jernihnya yang tak ada bandingannya, ia menjelaskan esensi dan filosofi membangun model matematika untuk data nyata. Pemikiran yang keras, tidak ada kesederhanaan matematis, tidak ada omong kosong, mengajarkan kita untuk berpikir secara statistik, merencanakan dan memvisualisasikan apa pun yang Anda bisa. Sebuah mahakarya ilmuwan terapan yang kompeten (insinyur kimia berubah menjadi ahli statistik). Selalu menyenangkan untuk dibaca lagi.

jh
sumber
2
Pilihan bagus! Rekan penulisnya, William Hunter dan J. Stuart Hunter, juga berkontribusi dalam buku ini.
Michael Chernick
Edisi pertama lebih bersih dan lebih segar daripada yang kedua. Box adalah ahli statistik yang hebat, tetapi di kemudian hari dia adalah pembaca bukti yang buruk.
Nick Cox
3

Banyak buku bagus sudah disarankan. Tapi di sini ada yang lain: "Reckoning With Risk" dari Gerd Gigerenzer karena memahami bagaimana statistik mempengaruhi keputusan lebih penting daripada membuat semua teorinya benar. Faktanya dosa nomor satu dari para ahli statistik adalah gagal berkomunikasi dengan jelas. Bukunya berbicara tentang konsekuensi dari komunikasi yang buruk dan bagaimana menghindarinya.

matt_black
sumber
"Memahami bagaimana statistik memengaruhi keputusan lebih penting daripada menyelesaikan semua teorinya dengan benar ..." Bukankah itu benar? Saya berasal dari latar belakang arsitektur, dan saya dapat memberi tahu Anda, kadang-kadang teori hanya menghalangi ...
naught101
2

Saya akan pergi ke depan dan mengusulkan buku teks standar di lapangan. Saya berbicara tentang Probabilitas dan Statistik oleh Degroot dan Schervish, pertama kali diterbitkan pada tahun 1975.

Buku ini telah berfungsi sebagai buku teks bagi banyak siswa dan dianggap klasik, memang demikian menurut saya. Ini mencakup topik-topik seperti kombinatorik, distribusi, statistik bayesian, inferensi kemungkinan dan analisis regresi. Sejauh yang saya tahu tidak ada buku pelajaran lain yang begitu teliti sehingga saya percaya buku ini harus dimiliki.

JohnK
sumber
1

Panduan Penting untuk Efek Ukuran: Kekuatan Statistik, Meta-Analisis, dan Interpretasi Hasil Penelitian oleh Paul D. Ellis

Buku ini jika "harus dimiliki" untuk semua orang yang melakukan penelitian ilmiah apa pun, terutama yang bukan berasal dari statistik / matematika murni. Buku di bawah ini memperluas yang pertama tentang interval kepercayaan.

Memahami Statistik Baru: Ukuran Efek, Interval Keyakinan, dan Analisis Meta oleh Geoff Cumming

Adam Przedniczek
sumber
1

"Paling berpengaruh" adalah gagasan yang sangat berbeda dari "semua orang harus membaca". Saya tidak memenuhi syarat untuk menjawab yang pertama - Anda akan membutuhkan seseorang yang merupakan sejarawan statistik - tetapi untuk yang kedua, berikut adalah beberapa:

  1. Statistik sebagai Argumen Prinsip oleh Robert Abelson harus dibaca oleh siapa pun yang melakukan atau menggunakan statistik dalam pengejaran sains, humaniora, dll.

  2. Dua buku William S. Cleveland tentang grafik: Unsur-unsur data grafik dan Visualisasi Data . Untuk ahli statistik, saya akan menempatkan ini di atas karya Tufte, bukan karena Tufte tidak bermanfaat tetapi karena a) Cleveland menulis dengan ahli statistik sebagai audiens yang dituju dan b) Cleveland mendasarkan rekomendasinya pada data eksperimental tentang bagaimana orang melihat grafik, daripada intuisi.

  3. Analisis Data Eksplorasi oleh John Tukey. Itu kuno tetapi berharga - Anda bisa melakukan banyak hal dengan pensil, kertas, dan otak (setidaknya, jika otak Anda sebagus Tukey!)

Peter Flom - Pasang kembali Monica
sumber
1

Mungkin analisis data Bayesian oleh Gelman atau Deep Learning with Python . Tapi itu agak mirip dengan mengambil streptomisin ke abad pertengahan. Ini tidak ditulis ketika saya memulai karir saya dan beberapa hal dari buku akan menjadi berita besar saat itu. Beberapa hal yang paling berpengaruh yang harus diketahui semua orang adalah tidak ada sumber tunggal (mungkin mereka seharusnya, tetapi ...).

Björn
sumber
0

Panduan untuk Ekonometrika milik Kennedy berisi banyak saran praktis tentang berbagai analisis statistik. Entah bagaimana itu sangat padat informasi dan mudah dibaca, dan saya masih belajar sesuatu yang baru setiap kali saya mengambilnya.

Introductory Econometrics Wooldridge juga memiliki jenis diskusi seperti ini, tetapi sebagai buku teks pengantar, buku ini lebih mandiri. Saya berharap saya memiliki kursus yang berbasis di sekitarnya.

The Laconic
sumber