Menjelaskan tes dua sisi

Ini adalah pertanyaan yang bagus dan saya menanti-nantikan versi Everyones untuk menjelaskan nilai-p dan uji dua sisi vs satu sisi. Saya telah mengajar statistik ahli bedah ortopedi dan karena itu saya berusaha menjaganya sedapat mungkin karena kebanyakan dari mereka belum melakukan matematika tingkat lanjut selama 10-30 tahun.

Cara saya menjelaskan menghitung nilai-p & ekor

Saya mulai dengan menjelaskan bahwa jika kita percaya bahwa kita memiliki koin yang adil, kita tahu itu seharusnya berakhir rata-rata 50% dari flip ( ). Sekarang jika Anda bertanya-tanya apa kemungkinan mendapatkan hanya 2 ekor dari 10 membalik dengan koin yang adil ini, Anda dapat menghitung probabilitas itu seperti yang telah saya lakukan dalam grafik batang. Dari grafik Anda dapat melihat bahwa probabilitas mendapatkan 8 dari 10 flips dengan koin yang adil adalah sekitar . $=H_0$ $\approx 4.4\%$

Karena kita akan mempertanyakan keadilan koin jika kita mendapat 9 atau 10 ekor, kita harus memasukkan kemungkinan ini, ekor dari ujian. Dengan menambahkan nilai-nilai kita mendapatkan bahwa probabilitas sekarang sedikit lebih dari untuk mendapatkan 2 ekor atau kurang. $\approx 5.5\%$

Sekarang jika kita hanya mendapatkan 2 kepala, yaitu 8 kepala (ekor lainnya), kita mungkin akan mau mempertanyakan keadilan koin. Ini berarti Anda memiliki probabilitas untuk tes dua sisi . $5.4...\%+5.4...\% \approx 10.9\%$

Karena kita di bidang kedokteran biasanya tertarik mempelajari kegagalan, kita perlu memasukkan sisi yang berlawanan dari probabilitas bahkan jika niat kita adalah untuk berbuat baik dan untuk memperkenalkan pengobatan yang bermanfaat.

Grafik koin membalik saya

Refleksi sedikit keluar dari topik

Contoh sederhana ini juga menunjukkan seberapa tergantung kita pada hipotesis nol untuk menghitung nilai-p. Saya juga ingin menunjukkan kemiripan antara kurva binomial dan kurva lonceng. Ketika berubah menjadi 200 flip Anda mendapatkan cara alami untuk menjelaskan mengapa probabilitas mendapatkan 100 flips mulai kurang relevan. Interval kepentingan yang menentukan adalah transisi alami ke fungsi probabilitas kepadatan / fungsi massa dan mitra kumulatifnya.

Di kelas saya, saya merekomendasikan mereka video statistik akademi Khan dan saya juga menggunakan beberapa penjelasannya untuk konsep tertentu. Mereka juga dapat membalik koin di mana kita melihat keacakan dari koin terbalik - hal yang saya coba tunjukkan adalah bahwa keacakan lebih acak daripada yang biasanya kita yakini terinspirasi oleh episode Radiolab ini .

Kode

Saya biasanya memiliki satu grafik / slide, kode-R yang saya gunakan untuk membuat grafik:

library(graphics)

binom_plot_function <- function(x_max, my_title = FALSE, my_prob = .5, edges = 0, 
                                col=c("green", "gold", "red")){
  barplot(
    dbinom(0:x_max, x_max, my_prob)*100, 
    col=c(rep(col[1], edges), rep(col[2], x_max-2*edges+1), rep(col[3], edges)),
    #names=0:x_max,
    ylab="Probability %",
    xlab="Number of tails", names.arg=0:x_max)
  if (my_title != FALSE ){
    title(main=my_title)
  }
}

binom_plot_function(10, paste("Flipping coins", 10, "times"), edges=0, col=c("#449944", "gold", "#994444"))
binom_plot_function(10, edges=3, col=c(rgb(200/255, 0, 0), "gold", "gold"))
binom_plot_function(10, edges=3, col=c(rgb(200/255, 0, 0), "gold", rgb(200/255, 100/255, 100/255)))

Max Gordon
sumber

Jawaban yang bagus Max - dan terima kasih karena telah mengakui pertanyaan saya yang tidak sepele :)

Tal Galili

+1 jawaban yang bagus, sangat menyeluruh. Maafkan aku, tapi aku akan mengacaukan dua hal. 1) nilai-p dipahami sebagai probabilitas data sebagai ekstrem atau lebih ekstrem seperti milik Anda di bawah nol, dengan demikian jawaban Anda benar. Namun, ketika menggunakan data diskrit seperti koin Anda terbalik, ini tidak tepat konservatif. Cara terbaik untuk menggunakan apa yang disebut "nilai tengah-p", yaitu 1/2 kemungkinan data yang sama ekstrimnya dengan Anda + probabilitas data menjadi lebih ekstrem. Diskusi mudah tentang masalah ini dapat ditemukan di Agresti (2007) 2.6.3. (lanjutan)

gung - Reinstate Monica

2) Anda menyatakan bahwa keacakan lebih acak daripada yang kami yakini. Saya bisa menebak apa yang Anda maksudkan dengan itu (saya belum punya kesempatan untuk mendengarkan episode Radiolab yang Anda tautkan, tapi saya akan). Anehnya, saya selalu memberi tahu siswa bahwa keacakan kurang acak daripada yang Anda yakini. Saya merujuk di sini untuk persepsi coretan (misalnya, dalam perjudian). Orang-orang percaya bahwa peristiwa acak harus berganti lebih banyak daripada peristiwa acak yang sebenarnya, dan sebagai hasilnya percaya mereka melihat garis-garis. Lihat Falk (1997) Masuk akal tentang keacakan Psych Rev 104,2. Sekali lagi, Anda tidak salah - hanya makanan untuk dipikirkan.

gung - Reinstate Monica

Terima kasih @ungung atas masukan Anda. Saya sebenarnya belum pernah mendengar tentang nilai tengah - masuk akal juga. Saya tidak yakin apakah itu sesuatu yang akan saya sebutkan ketika mengajar statistik dasar karena itu mungkin memberikan perasaan kehilangan perasaan yang saya coba berikan. Mengenai keacakan kami maksudkan persis sama - ketika melihat angka yang benar-benar acak kami tertipu untuk berpikir ada pola untuk itu. Saya pikir saya mendengar di Freakonomics podcast kebodohan prediksi bahwa ...

Max Gordon

... pikiran manusia telah selama bertahun-tahun belajar bahwa gagal mendeteksi pemangsa lebih mahal daripada berpikir mungkin itu bukan apa-apa. Saya suka analogi itu dan saya mencoba memberi tahu rekan-rekan saya bahwa salah satu alasan utama untuk menggunakan statistik adalah untuk membantu kami dengan cacat yang kita semua alami sejak lahir.

Max Gordon

Misalkan Anda ingin menguji hipotesis bahwa tinggi rata-rata pria adalah "5 kaki 7 inci". Anda memilih sampel acak pria, mengukur tinggi badan mereka dan menghitung rata-rata sampel. Hipotesis Anda kemudian adalah:

$H_0: \mu = 5\ \text{ft} \ 7 \ \text{inches}$

$H_A: \mu \ne 5\ \text{ft} \ 7 \ \text{inches}$

Dalam situasi di atas Anda melakukan tes dua sisi karena Anda akan menolak nol Anda jika rata-rata sampel terlalu rendah atau terlalu tinggi.

Dalam hal ini, nilai-p menunjukkan probabilitas untuk merealisasikan sampel rata-rata yang setidaknya sama ekstrimnya dengan yang kami dapatkan dengan mengasumsikan bahwa nol sebenarnya benar. Jadi, jika mengamati sampel berarti "5 kaki 8 inci" maka nilai-p akan mewakili probabilitas bahwa kita akan mengamati ketinggian lebih besar dari "5 kaki 8 inci" atau ketinggian kurang dari "5 kaki 6 inci" asalkan nol adalah benar.

Jika di sisi lain alternatif Anda dibingkai seperti:

$H_A: \mu > 5\ \text{ft} \ 7 \ \text{inches}$

Dalam situasi di atas Anda akan melakukan tes satu sisi di sisi kanan. Alasannya adalah bahwa Anda lebih suka menolak nol demi alternatif hanya jika rata-rata sampel sangat tinggi.

Interpretasi dari nilai-p tetap sama dengan sedikit nuansa bahwa kita sekarang berbicara tentang kemungkinan mewujudkan sampel rata-rata yang lebih besar dari yang kita dapatkan sebenarnya. Jadi, jika mengamati sampel berarti "5 kaki 8 inci" maka nilai-p akan mewakili probabilitas bahwa kita akan mengamati ketinggian lebih besar dari "5 kaki 8 inci" asalkan nol benar.

varty
sumber

H_{A}

$H_A$

H_{0} : μ \leq 5 ft 7 inches

$H_0:\, \mu\le 5\ \text{ft}\ 7\ \text{inches}$

H_{0} : μ = 5 ft 7 inches

$H_0:\, \mu = 5\ \text{ft}\ 7\ \text{inches}$

@ chl saya setuju. Namun, untuk orang yang baru saja diperkenalkan dengan ide-ide statistik, menulis ulang nol untuk tes satu sisi dapat menjadi gangguan ketika fokusnya adalah pada bagaimana dan mengapa hal-hal berubah sehubungan dengan interpretasi nilai-p.

varty

Cukup adil. Itu layak disebut, bahkan untuk tujuan pengajaran.

chl

Menjelaskan tes dua sisi

Jawaban:

Cara saya menjelaskan menghitung nilai-p & ekor

Refleksi sedikit keluar dari topik

Kode