Kesimpulan untuk pembaca yang skeptis (tetapi tidak menentang matematika)

14

Saya baru saja menyaksikan kuliah tentang kesimpulan statistik ("membandingkan proporsi dan cara"), bagian dari kursus pengantar statistik online. Materi itu membuat sedikit masuk akal bagi saya seperti biasa (sekarang saya pasti telah melihat hal ini puluhan kali, tersebar selama tiga dekade terakhir).

Saya sedang mencari buku tentang "Stats-101" dasar (estimasi titik, penilaian estimasi, inferensi statistik, pengujian hipotesis, desain studi) yang menangani masalah serius meyakinkan pembaca yang skeptis ...

Di bawah ini saya memberikan beberapa contoh jenis pertanyaan yang penulis cari akan menganggap serius dan tahu bagaimana mengatasinya dengan meyakinkan.

Tetapi pertama-tama izinkan saya meluangkan waktu untuk menekankan bahwa dalam posting ini saya tidak menanyakan pertanyaan-pertanyaan ini. Tolong, jangan jawab mereka! Saya memberi mereka hanya sebagai contoh, dan dengan cara "tes lakmus" (untuk jenis penulis mencari).

  1. Jika "proporsi" hanyalah rata - rata dari variabel Boolean (yaitu yang hanya mengambil nilai 0 dan 1), mengapa prosedur yang berbeda diajarkan untuk melakukan inferensi statistik dengan "proporsi" dan dengan "berarti"?

  2. Jika distribusi normal sangat kuat sehingga asumsi normalitas memberikan hasil yang baik bahkan dalam kasus ketika data tersebut tidak terdistribusi secara normal, dan jika distribusi-t terlihat sangat normal, mengapa semua kerepotan tentang menggunakan distribusi-t alih-alih normal?

  3. Apa sebenarnya "derajat kebebasan", dan mengapa kita mengkhawatirkannya?

  4. Apa artinya berbicara tentang nilai "benar" dari suatu parameter, mengingat kita hanya menggunakan distribusi yang kebetulan terlihat mirip dengan data?

  5. Kenapa "analisis data eksplorasi" adalah hal yang baik, sementara "pengintaian data" adalah hal yang jahat?

Seperti yang telah saya katakan, saya terhambat oleh sikap yang tersirat oleh pengabaian pertanyaan semacam itu. Bukan "sikap epistemologis" yang ingin saya lihat pada seseorang yang mengajari saya sesuatu. Saya mencari penulis yang menghargai skeptisisme dan rasionalitas pembaca, dan yang tahu bagaimana mengatasinya (tanpa harus pergi ke halaman dan halaman formalisme dan teknis).

Saya menyadari bahwa ini adalah hal yang sulit, dan mungkin terutama dalam hal statistik. Karena itu, saya tidak berharap banyak penulis akan berhasil. Tetapi pada saat ini saya akan puas dengan hanya menemukan satu .

Biarkan saya menambahkan bahwa saya tidak suka matematika. Sebaliknya, saya suka matematika. (Saya nyaman dengan analisis [alias "kalkulus lanjut"], aljabar linier, teori probabilitas, bahkan teori ukuran dasar.)

Yang mengatakan, minat saya saat ini adalah dalam statistik "diterapkan", "praktis", "sehari-hari", "dunia nyata" (sebagai lawan dari kebaikan teoritis). (Tapi aku juga tidak mau buku masak!)

FWIW, saya telah membaca beberapa bab pertama dari analisis data menggunakan regresi dan model multilevel / hierarkis oleh Gelman dan Hill, dan saya menyukai nada penulis. Fokus mereka praktis, tetapi masuklah ke teori ketika dibutuhkan. Mereka juga sering melangkah mundur, dan menilai praktik standar secara kritis, dan menawarkan pendapat jujur ​​yang menarik bagi akal sehat pembaca yang skeptis. Sayangnya, para penulis ini belum menulis buku yang ditujukan untuk subjek yang saya tanyakan dalam posting ini (hal-hal "Statistik 101", seperti dijelaskan di atas). Saya juga sadar bahwa salah satu penulis ini (Gelman) ikut menulis analisis data Bayesian yang sangat dihormati , tetapi, sekali lagi, ini bukan yang saya cari saat ini.

EDIT:

Dikran Marsupial mengajukan keberatan berikut:

Saya tidak berpikir ada yang salah dengan mengabaikan pertanyaan, ada titik di mana mengatasi setiap pertanyaan mengurangi eksposisi konsep-konsep dasar yang sering lebih penting (terutama dalam buku statistik 101!).

Saya setuju dengan itu. Akan lebih akurat bagi saya untuk mengatakan bahwa saya sedang mencari "pandangan kedua pada statistik dasar." Bahkan, dengan ini sebagai motivasi saya, saya melihat buku-buku teks yang digunakan pada kursus pascasarjana tentang inferensi (katakanlah), dan menemukan bahwa mereka juga mengabaikan pertanyaan-pertanyaan seperti yang saya cantumkan. Kalaupun ada, mereka tampaknya kurang tertarik untuk menyelidiki pertanyaan-pertanyaan semacam itu (sehingga mereka dapat fokus pada hal-hal seperti kondisi untuk beberapa konvergensi-atau-ini-atau-itu ...).

Masalahnya adalah bahwa buku-buku yang lebih maju ditujukan kepada populasi pembaca yang sangat berbeda , di mana "skeptisisme orang luar" telah berkurang secara drastis. TKI, mereka yang mengambil statistik tingkat pascasarjana sudah melewati titik terganggu oleh pertanyaan yang mengganggu saya. Mereka tidak skeptis tentang hal-hal ini lagi. (Bagaimana mereka mengatasi skeptisisme? Mungkin ada beberapa yang tidak terlalu kritis sejak awal, terutama jika mereka mempelajari statistik mereka cukup awal - saya tahu saya sendiri bukan mahasiswa baru yang kritis, misalnya, meskipun saya tidak ambil statistik lalu. Yang lain mungkin memiliki guru yang mengisi di mana buku teks mereka gagal. Beberapa mungkin cukup pintar untuk mencari tahu jawaban atas pertanyaan-pertanyaan seperti itu untuk diri mereka sendiri. Siapa yang tahu.)

kjo
sumber
2
Sebagian besar dari pertanyaan itu - yang tidak kami jawab - sudah memiliki jawaban yang baik di sini di CV. Beberapa dari pertanyaan itu bahkan memiliki jawaban yang cukup sepele. Tapi ada seribu pertanyaan yang diajukan orang selama topik apa pun - Anda tidak akan pernah menemukan penjelasan yang mencakup semua pertanyaan yang mungkin, Anda juga tidak akan menemukan satu pun yang hanya mengantisipasi pertanyaan spesifik yang Anda miliki saat Anda menonton atau bacaan. Yah Anda mungkin menekan satu atau dua hanya secara kebetulan, tetapi secara keseluruhan itu adalah standar yang mustahil. Mengapa tidak mengajukan pertanyaan saja saat muncul? Di situs yang menjawab pertanyaan?
Glen_b -Reinstate Monica
2
Saya akan mengatakan pertanyaan serupa muncul ketika orang melakukan statistik (dan beberapa buku menjawab beberapa dari mereka), tetapi kebanyakan dari mereka bukan pertanyaan aktual yang berkaitan dengan skeptisisme - kebanyakan mereka adalah pertanyaan pemahaman sederhana. misalnya "apa itu derajat kebebasan dan mengapa kita peduli" sama sekali tidak skeptis, itu meminta kejelasan penjelasan dan motivasi. Alasan mengapa pengguna statistik canggih tidak khawatir tentang itu adalah karena mereka sudah mengerti mengapa mereka begitu berharga.
Glen_b -Reinstate Monica

Jawaban:

6

Anda sudah mendapat beberapa saran bagus. Ini beberapa lagi. Pertama, dua blog yang saya baca secara sporadis, dan di mana pertanyaan seperti yang Anda ajukan pada diri sendiri terkadang dibahas. Karena mereka adalah blog, Anda bahkan dapat mengajukan pertanyaan dan mendapatkan jawaban yang sangat bagus! Mereka datang:

http://andrewgelman.com/ (Andrew Gelman)

http://errorstatistics.com/ (Deborah Mayo)

Dan beberapa buku yang saya pikir akan membantu Anda: Box, Hunter & Hunter: Statistik untuk eksperimen.

Seperti judulnya katakan, ini adalah kursus ("pertama", tetapi benar-benar ... benar-benar kedua) untuk orang-orang yang ingin merancang eksperimen mereka sendiri, dan menganalisisnya. Sangat tinggi pada bagian "mengapa".

Kemudian: DR Cox: Principles of Statistics Inference, buku lain yang sangat bagus tentang "mengapa" bukan "bagaimana".

Dan, karena Anda bertanya mengapa cara dan proporsi diperlakukan secara berbeda, berikut adalah buku yang tidak melakukannya: http://www.amazon.com/Statistics-4th-David-Freedman/dp/0393929728/ref=sr_1_1?s = buku & ie = UTF8 & qid = 1373395118 & sr = 1-1 & kata kunci = freedman + statistik

Matematika rendah, prinsip tinggi.

kjetil b halvorsen
sumber
8

Saya agak ragu akan ada satu buku yang cocok untuk Anda karena orang-orang cenderung skeptis tentang hal-hal yang berbeda, dan buku-buku ditulis untuk audiens target, bukan untuk individu. Ini adalah salah satu hal baik tentang diajarkan oleh seseorang, bukan hanya buku, yaitu Anda dapat mengajukan pertanyaan saat bepergian. Ini adalah hal yang cukup sulit dilakukan dalam teks linier.

Saya tidak berpikir ada yang salah dengan mengabaikan pertanyaan, ada titik di mana mengatasi setiap pertanyaan mengurangi eksposisi konsep-konsep dasar yang sering lebih penting (terutama dalam buku statistik 101!).

Saya menduga pendekatan terbaik adalah mendapatkan buku yang bagus dan kemudian mencari jawaban untuk pertanyaan yang tidak terjawab di tempat lain. Saya punya rak buku yang penuh dengan teks statistik di depan saya, hanya karena tidak ada satu pun di antara mereka yang saya butuhkan (bahkan bukan buku Jaynes; o).

Untuk pemula mutlak, saya pikir buku Grant Foster "Memahami Statistik" adalah tempat yang baik untuk memulai, tetapi saya menduga itu terlalu mendasar dalam kasus ini.

Dikran Marsupial
sumber
1
"Saya tidak berpikir ada yang salah dengan mengabaikan pertanyaan ..." Saya pikir ini keberatan yang adil; Saya telah menambahkan EDIT ke posting saya untuk mengatasinya.
kjo
7

XΘXΘΘXtXΘ

Zen
sumber
5
Sebagian besar alasan mengapa prosedur statistik tampak dipertanyakan adalah karena mereka agak kontra-intuitif dan apresiasi historis tentang bagaimana statistik berakhir seperti itu, mungkin merupakan pendekatan yang baik untuk orang yang skeptis.
Dikran Marsupial
2
@DikranMarsupial: Faktanya, saya telah membaca Stigler's "The history of statistics" tepatnya untuk memahami kesulitan saya dengan statistik. Dan itu memang membantu. Sayangnya, itu meninggalkan sebagian besar era Fisher vs Neyman, ketika (saya curiga) banyak keanehan sesat muncul. Saya mencoba sekitar 50 halaman buku Hald, tetapi menemukan derivasi yang mustahil untuk diikuti: mereka jelas ditujukan kepada pembaca dengan keahlian statistik yang signifikan ... Kalau dipikir-pikir, saya berpikir bahwa sebuah buku ditujukan kepada orang awam yang berpendidikan dan berjudul "Mengapa Apakah statistik begitu aneh? " akan menjual dengan baik ... :)
kjo
4
IMHO kontra-intuitif statistik sebelum tanggal era Fisher vs Neyman (meskipun intuitif tidak menyiratkan kegunaan atau sebaliknya). Buku-buku Ian Hacking mungkin patut dicoba, saya menikmati "The Emergence of Probability". Saya menemukan statistik Bayesian jauh lebih mudah dipahami secara konseptual daripada statistik frequentist, tetapi jauh lebih sulit untuk dilakukan dalam praktik. Memahami perbedaan antara pendekatan Bayesian dan frequentist banyak membantu saya dalam memahami pendekatan frequentist.
Dikran Marsupial
1
Terima kasih, saya akan memeriksa Hacking. Buku-bukunya sudah ada di depan mata saya untuk waktu yang lama, meskipun saya telah menunda membacanya berpikir dia lebih berpusat pada filosofi teori probabilitas (subjek yang menurut saya menarik dengan sendirinya). Yang mengatakan, saya menyadari bahwa setidaknya beberapa masalah saya dengan statistik mempengaruhi interpretasi probabilitas, jadi mungkin membaca Peretasan akan mengurus setidaknya beberapa keberatan saya.
kjo
2
@ kjo Saya membaca Logika Logistik Statistik Inferensi & menemukannya sangat 'filosofis' - ia memahami ide kemungkinan sebagai 'dukungan' dan terus menggunakan Neyman-Pearson tetapi terus menggunakan contoh sederhana - tidak membahas parameter gangguan, multi -parameter inference, atau apapun yang rumit (kecuali saya sudah lupa). Layak dibaca, tentu saja, tetapi saya tidak akan merekomendasikannya untuk memulainya.
Scortchi
6

Abelson (1995), Statistik sebagai berprinsip Argumen adalah pengantar & memiliki menarik mengambil beberapa pertanyaan yang sering bingung peserta didik.

Tetapi mungkin Anda hanya perlu membaca beberapa buku tentang statistik teoritis (melewatkan semua hal tentang konvergensi, ruang metrik, & c.) & Kemudian bahkan jika mereka tidak menjawab secara spesifik pertanyaan seperti contoh Anda, Anda akan dapat menjawab sebagian besar mereka sendiri, & lihat sisanya, seperti yang disarankan @Dikran.

Saya menyarankan di thread lain membaca Cox & Hinkley, Statistik Teoritis atau Cox, Prinsip-prinsip Inferensi Statistik bersama dengan Casella & Berger, Statistik Inferensi untuk mendapatkan pemahaman tentang berbagai perspektif yang ada.

Scortchi - Reinstate Monica
sumber
1
Saya menemukan itu menarik tetapi saya tidak berpikir itu pada tingkat yang diharapkan oleh OP sama sekali.
Gala
@ Yael Anda mungkin benar, terutama mengingat hasil edit.
Scortchi