Bagaimana cara terbaik menampilkan kesalahan, daya, dan ukuran sampel tipe II (beta) secara grafis?

16

Saya diminta untuk menulis pengantar statistik dan saya berjuang bagaimana menunjukkan secara grafis cara p-value dan kekuatan berhubungan. Saya telah menghasilkan grafik ini:

Dua kurva Gauss berinteraksi

Pertanyaan saya: Apakah ada cara yang lebih baik untuk menampilkan ini?

Ini kode R saya

x <- seq(-4, 4, length=1000)
hx <- dnorm(x, mean=0, sd=1)

plot(x, hx, type="n", xlim=c(-4, 8), ylim=c(0, 0.5), 
ylab = "",
xlab = "",
main= expression(paste("Type II (", beta, ") error")), axes=FALSE)
axis(1, at = c(-qnorm(.025), 0, -4), 
     labels = expression("p-value", 0, -infinity ))

shift = qnorm(1-0.025, mean=0, sd=1)*1.7
xfit2 <- x + shift
yfit2 <- dnorm(xfit2, mean=shift, sd=1)

# Print null hypothesis area
col_null = "#DDDDDD"
polygon(c(min(x), x,max(x)), c(0,hx,0), col=col_null)
lines(x, hx, lwd=2)

# The alternative hypothesis area

## The red - underpowered area
lb <- min(xfit2)
ub <- round(qnorm(.975),2)
col1 = "#CC2222"

i <- xfit2 >= lb & xfit2 <= ub
polygon(c(lb,xfit2[i],ub), c(0,yfit2[i],0), col=col1)

## The green area where the power is
col2 = "#22CC22"
i <- xfit2 >= ub
polygon(c(ub,xfit2[i],max(xfit2)), c(0,yfit2[i],0), col=col2)

# Outline the alternative hypothesis
lines(xfit2, yfit2, lwd=2)

axis(1, at = (c(ub, max(xfit2))), labels=c("", expression(infinity)), 
    col=col2, lwd=1, lwd.tick=FALSE)


legend("topright", inset=.05, title="Color",
   c("Null hypoteses","Type II error", "True"), fill=c(col_null, col1, col2), horiz=FALSE)

abline(v=ub, lwd=2, col="#000088", lty="dashed")

arrows(ub, 0.45, ub+1, 0.45, lwd=3, col="#008800")
arrows(ub, 0.45, ub-1, 0.45, lwd=3, col="#880000")

Memperbarui


Terima kasih atas jawaban yang luar biasa. Saya telah mengubah beberapa kode:

# Print null hypothesis area
col_null = "#AAAAAA"
polygon(c(min(x), x,max(x)), c(0,hx,0), col=col_null, lwd=2, density=c(10, 40), angle=-45, border=0)
lines(x, hx, lwd=2, lty="dashed", col=col_null)

...
legend("topright", inset=.015, title="Color",
   c("Null hypoteses","Type II error", "True"), fill=c(col_null, col1, col2), 
       angle=-45,
       density=c(20, 1000, 1000), horiz=FALSE)

Saya suka gambar hipotesis nol yang putus-putus dan agak kabur karena ini menandakan bahwa itu tidak benar-benar ada. Saya sudah memikirkan transparansi dan menambahkan alfa, tetapi saya khawatir mendapatkan terlalu banyak informasi dalam satu gambar dan karenanya memilih untuk tidak melakukannya.

masukkan deskripsi gambar di sini

Keterbatasan artikel yang dicetak tidak memungkinkan saya untuk membiarkan para pembaca bereksperimen. Saya telah memilih balasan @Greg Snow dengan TeachingDemos sebagai jawaban saya karena saya menyukai gagasan itu dengan dua kesalahan yang tidak tumpang tindih.

Max Gordon
sumber
4
Anda dapat sedikit meningkatkan grafik dengan menggunakan transparansi semu. Sesuatu seperti dalam jawaban ini .
caracal
@caracal (+1) Saya harus menambahkan pola gagah (seperti Anda) untuk area yang menunjukkan kekuatan.
chl
Ini bagus, saya pernah melihat plot serupa di tempat lain. Tetapi ini tidak menunjukkan nilai aktual dari beberapa nilai p dan kekuatan pada nilai p tersebut. Anda dapat menghitung daya untuk nilai p dan ukuran sampel yang berbeda dan kemudian meletakkan beberapa baris pada satu grafik
Peter Flom - Reinstate Monica
1
Mungkin memeriksa bagaimana jenis plot yang dihasilkan oleh perangkat lunak G * Power 3 akan baik untuk ide-ide tentang apa yang harus plot. Meskipun dari memori mereka tampak sangat mirip dengan apa yang telah disajikan chl dan caracal (dan tidak akan membantu Anda bagaimana melakukannya di R).
Andy W
@Andy G * Daya yang diilhami daya vs. plot ukuran efek atau plot daya vs alpha akan menjadi tambahan yang bagus. Untuk kasus pertama, permulaan bisa menjadi jawaban ini , yang seharusnya mudah diadaptasi ke kasus ke-2.
caracal

Jawaban:

9

Saya telah bermain-main dengan plot yang sama dan menemukan bahwa itu bekerja lebih baik ketika 2 kurva tidak saling menghalangi, tetapi agak diimbangi secara vertikal (tetapi masih pada sumbu x yang sama). Ini memperjelas bahwa salah satu kurva mewakili hipotesis nol dan yang lainnya mewakili nilai yang diberikan untuk rata-rata di bawah hipotesis alternatif. The power.exampfungsi dalam paket TeachingDemos untuk R akan membuat plot ini dan run.power.exampfungsi (paket yang sama) memungkinkan Anda untuk interaktif mengubah argumen dan memperbarui plot.

Greg Snow
sumber
+1, ilustrasi yang lebih lengkap daripada milik saya. (Sebenarnya, saya tahu ada sesuatu di dalam TeachingDemospaket itu tetapi terlalu malas untuk mencarinya.)
chl
14

Beberapa pemikiran: (a) Gunakan transparansi, dan (b) Berikan sedikit interaktivitas.

Inilah pendapat saya, sebagian besar terinspirasi oleh applet Java tentang Kesalahan Tipe I dan Tipe II - Membuat Kesalahan dalam Sistem Peradilan . Karena ini adalah kode gambar yang agak murni, saya menempelkannya sebagai inti # 1139310 .

Berikut tampilannya:

masukkan deskripsi gambar di sini

H0

chl
sumber
Itu benar-benar luar biasa, saya belum pernah melihat aplpack sebelumnya.
Ken Williams
1
@ Terima kasih. The aplpackpaket juga beberapa yang baik add-ons untuk yaitu data. Namun, rpanel , yang juga bergantung pada tcl / tk, mungkin merupakan opsi yang lebih baik untuk hal-hal yang lebih kompleks. Sekarang, dengan RStudio dan paket manipulasi , juga mudah untuk meningkatkan plot dasar dalam R.
chl
8

G Power 3 , perangkat lunak gratis yang tersedia di Mac dan Windows, memiliki beberapa fitur grafik yang sangat bagus untuk analisis daya. Grafik utama secara konsisten konsisten dengan grafik Anda dan yang ditunjukkan oleh @chl. Ini menggunakan garis lurus sederhana untuk menunjukkan hipotesis nol dan distribusi statistik uji hipotesis alternatif, dan warna dalam beta dan alpha dalam warna terpisah.

Fitur bagus dari G Power 3 adalah mendukung banyak skenario analisis kekuatan umum dan GUI membuatnya mudah bagi siswa dan peneliti terapan untuk mengeksplorasi.

Berikut ini adalah cuplikan layar slide (diambil dari presentasi yang saya berikan pada statistik deskriptif dengan bagian analisis daya ) dengan beberapa grafik seperti yang ditunjukkan di sebelah kiri. Jika Anda memilih versi uji satu sisi maka itu akan lebih mirip dengan contoh Anda.

g grafik daya 3

Juga dimungkinkan untuk menghasilkan grafik yang menunjukkan hubungan fungsional antara faktor-faktor yang relevan dengan kekuatan statistik dan pengujian hipotesis (misalnya, alfa, ukuran efek, ukuran sampel, kekuatan, dll.). Saya menyajikan beberapa contoh grafik tersebut di sini . Inilah salah satu contoh grafik seperti itu:

masukkan deskripsi gambar di sini

Jeromy Anglim
sumber
Paket menarik, saya akan memeriksanya di masa depan. Grafiknya nampak sedikit rumit bagi seseorang yang baru mengenal bidang ini. Audiens saya adalah MD tanpa pengetahuan latar belakang matematika atau statistik. Terima kasih!
Max Gordon