Skenario berikut telah menjadi Most-FAQ di trio penyelidik (I), reviewer / editor (R, tidak terkait dengan CRAN) dan saya (M) sebagai pencipta plot. Kita dapat berasumsi bahwa (R) adalah peninjau bos besar medis yang khas, yang hanya tahu bahwa setiap plot harus memiliki bar kesalahan, jika tidak maka itu salah. Ketika peninjau statistik terlibat, masalah menjadi kurang kritis.
Skenario
Dalam studi cross-over farmakologis yang khas, dua obat A dan B diuji efeknya pada kadar glukosa. Setiap pasien diuji dua kali dalam urutan acak dan dengan asumsi tidak ada carry-over. Titik akhir primer adalah perbedaan antara glukosa (BA), dan kami menganggap bahwa uji-t berpasangan memadai.
(I) menginginkan plot yang menunjukkan kadar glukosa absolut dalam kedua kasus. Dia takut keinginan (R) untuk bar kesalahan, dan meminta kesalahan standar dalam grafik batang. Jangan memulai perang grafik batang di sini ._)
(I): Itu tidak mungkin benar. Bilah tumpang tindih, dan kami memiliki p = 0,03? Bukan itu yang saya pelajari di sekolah menengah.
(L): Kami memiliki desain berpasangan di sini. Bilah kesalahan yang diminta sama sekali tidak relevan, yang penting adalah SE / CI dari perbedaan pasangan, yang tidak ditampilkan dalam plot. Jika saya punya pilihan dan tidak ada terlalu banyak data, saya lebih suka plot berikut
Ditambahkan 1: Ini adalah plot koordinat paralel yang disebutkan dalam beberapa respons
(L): Garis-garis menunjukkan pasangan, dan sebagian besar garis naik, dan itu kesan yang tepat, karena kemiringan adalah yang terpenting (ok, ini kategorikal, namun demikian).
(I): Gambar itu membingungkan. Tidak ada yang memahaminya, dan tidak memiliki bar kesalahan (R mengintai).
(L): Kami juga dapat menambahkan plot lain yang menunjukkan interval kepercayaan yang relevan dari perbedaan tersebut. Jarak dari garis nol memberi kesan ukuran efek.
(I): Tidak ada yang melakukannya
(R): Dan itu memboroskan pohon-pohon berharga
(L): (Sebagai orang Jerman yang baik): Ya, titik pada pohon diambil. Namun saya tetap menggunakan ini (dan tidak pernah mempublikasikannya) ketika kami memiliki beberapa perawatan dan beberapa kontras.
Ada saran ? R-Code di bawah ini, jika Anda ingin membuat plot.
# Graphics for Crossover experiments
library(ggplot2)
library(plyr)
theme_set(theme_bw()+theme(panel.margin=grid::unit(0,"lines")))
n = 20
effect = 5
set.seed(4711)
glu0 = rnorm(n,120,30)
glu1 = glu0 + rnorm(n,effect,7)
dt = data.frame(patient = rep(paste0("P",10:(9+n))),
treatment = rep(c("A","B"), each=n),glucose = c(glu0,glu1))
dt1 = ddply(dt,.(treatment), function(x){
data.frame(glucose = mean(x$glucose), se = sqrt(var(x$glucose)/nrow(x)) )})
tt = t.test(glucose~treatment,paired=TRUE,data=dt,conf.int=TRUE)
dt2 = data.frame(diff = -tt$estimate,low=-tt$conf.int[2], up=-tt$conf.int[1])
p = paste("p =",signif(tt$p.value,2))
png(height=300,width=300)
ggplot(dt1, aes(x=treatment, y=glucose, fill=treatment))+
geom_bar(stat="identity")+
geom_errorbar(aes(ymin=glucose-se, ymax=glucose+se),size=1., width=0.3)+
geom_text(aes(1.5,150),label=p,size=6)
ggplot(dt,aes(x=treatment,y=glucose, group=patient))+ylim(0,190)+
geom_line()+geom_point(size=4.5)+
geom_text(aes(1.5,60),label=p,size=6)
ggplot(dt2,aes(x="",y=diff))+
geom_errorbar(aes(ymin=low,ymax=up),size=1.5,width=0.2)+
geom_text(aes(1,-0.8),label=p,size=6)+
ylab("95% CI of difference glucose B-A")+ ylim(-10,10)+
theme(panel.border=element_blank(), panel.grid.major.x=element_blank(),
panel.grid.major.y=element_line(size=1,colour="grey88"))
dev.off()
sumber
Jawaban:
Anda sepenuhnya benar dalam asumsi Anda bahwa bilah galat yang mewakili galat standar rata-rata sama sekali tidak pantas untuk desain dalam subjek. Namun, pertanyaan tumpang tindih kesalahan dan signifikansi adalah topik lain, yang saya akan kembali pada akhir daftar referensi yang dikomentari ini.
Ada banyak literatur dari Psikologi tentang interval kepercayaan di dalam subjek atau bar kesalahan yang melakukan apa yang Anda inginkan. Pekerjaan referensi jelas:
Loftus, GR, & Masson, MEJ (1994). Menggunakan interval kepercayaan dalam desain dalam-subjek . Buletin & Ulasan Psikonomis, 1 (4), 476-490. doi: 10.3758 / BF03210951
Namun, masalah mereka adalah bahwa mereka menggunakan istilah kesalahan yang sama untuk semua tingkat faktor dalam subjek. Ini sepertinya bukan masalah besar untuk kasus Anda (2 level). Tetapi ada pendekatan yang lebih modern untuk menyelesaikan masalah ini. Terutama:
Franz, V., & Loftus, G. (2012). Kesalahan standar dan interval kepercayaan dalam desain dalam-subyek: Generalized Loftus dan Masson (1994) dan menghindari bias dari akun alternatif . Buletin & Ulasan Psikonomis , 1–10. doi: 10.3758 / s13423-012-0230-1
Baguley, T. (2011). Menghitung dan membuat grafik interval kepercayaan dalam-subjek untuk ANOVA. Metode Penelitian Perilaku . doi: 10.3758 / s13428-011-0123-7 [ dapat ditemukan di sini ]
Referensi lebih lanjut dapat ditemukan dalam dua makalah yang terakhir (yang saya pikir keduanya layak dibaca).
Bagaimana para peneliti menafsirkan CI? Buruk menurut kertas berikut:
Belia, S., Fidler, F., Williams, J., & Cumming, G. (2005). Interval Keyakinan Kesalahpahaman Peneliti dan Bar Kesalahan Standar . Metode Psikologis , 10 (4), 389–396. doi: 10.1037 / 1082-989X.10.4.389
Bagaimana seharusnya kita menginterpretasikan CI yang tumpang tindih dan tidak tumpang tindih?
Cumming, G., & Finch, S. (2005). Inference by Eye: Interval Keyakinan dan Cara Membaca Gambar Data . American Psychologist , 60 (2), 170-180. doi: 10.1037 / 0003-066X.60.2.170
Satu pemikiran terakhir (walaupun ini tidak relevan dengan kasus Anda): Jika Anda memiliki desain petak-petak (yaitu, faktor di dalam dan di antara subjek) dalam satu petak, Anda dapat melupakan bilah kesalahan secara bersamaan. Saya akan (rendah hati) merekomendasikan saya
raw.means.plot
fungsi dalam paket Rplotrix
.sumber
Pertanyaannya tampaknya bukan tentang bar kesalahan sebanyak tentang cara terbaik untuk memplot data berpasangan.
Pada dasarnya, bar kesalahan paling banyak adalah cara meringkas ketidakpastian: mereka tidak, dan mereka tentu saja tidak bisa, banyak bicara tentang struktur yang bagus dalam data.
Plot koordinat paralel - kadang-kadang disebut plot profil, sebuah istilah yang memiliki arti berbeda di bidang yang berbeda - telah disebutkan dalam pertanyaan. Plot sebar dasar telah disarankan oleh @Ray Koopman.
Sumber lain untuk plot ini adalah Neyman, J., Scott, EL dan Shane, CD 1953. Tentang distribusi spasial galaksi: model spesifik. Jurnal Astrofisika 117: 92–133.
Dalam arti luas, plot-plot semacam itu mirip dengan gagasan merencanakan residu versus pas, juga dipopulerkan oleh Tukey dan saudara iparnya, Anscombe.
Desain yang diabaikan adalah plot paralel-garis McNeil, DR 1992. Pada grafik data berpasangan. Ahli Statistik Amerika 46: 307–310. Ini juga dibahas dalam dua referensi di bawah ini.
Ulasan terkait-stata, dengan beberapa referensi, ada di
2004, Perjanjian grafik dan ketidaksepakatan. Jurnal Stata 4: 329-349.
.pdf dapat diakses di http://www.stata-journal.com/sjpdf.html?articlenum=gr0005
Plot berpasangan, paralel, atau profil untuk perubahan, korelasi, dan perbandingan lainnya. Jurnal Stata 9: 621-639.
.pdf dapat diakses di http://www.stata-journal.com/sjpdf.html?articlenum=gr0041
Pengguna non-Stata harus dapat melewati dan bersenandung melalui kode Stata sambil mencari cara untuk mengimplementasikan grafik dalam perangkat lunak favorit mereka sendiri.
sumber
Coba sebarkan sebaran poin (A, B) individual. Sebagian besar dari mereka harus terletak di satu sisi diagonal (garis A = B). Ada dua analog bar kesalahan. Yang konvensional, setara dengan CI untuk perbedaan rata-rata, akan menjadi pita kepercayaan untuk perbedaan rata-rata. Pita akan menjadi wilayah antara dua garis, yang keduanya sejajar dengan diagonal. Uji-t berpasangan akan signifikan jika dan hanya jika kedua tepi pita berada pada sisi yang sama dari diagonal.
Analog error-bar yang lebih konservatif akan menjadi elips kepercayaan untuk centroid.
sumber
Ringkasan pendahuluan:
Masson / Loftus sangat lengkap, dan bukan bacaan yang mudah untuk diberikan kepada rekan medis saya yang tidak akan menerima sesuatu seperti "interaksi". Mereka juga memiliki beberapa saran untuk beberapa perbandingan, yang menunjukkan bahwa interval kepercayaan berpasangan sulit untuk diilustrasikan ketika seseorang tidak ingin terlalu menyederhanakan.
Saya tidak suka gaya ini: bilah-bilah dengan bilah galat terlihat Excelish milenium terakhir. Namun, mereka juga menggunakan gaya yang sedikit lebih elegan:
Cumming / Finch dan Belia et al. adalah bacaan wajib. Yang pertama adalah pilihan yang sempurna untuk memberi teman Anda yang bergidik ketika dia melihat kata interaksi . Saya memesan buku Cumming setelah membaca artikel itu. Yang kedua menunjukkan tes yang akan saya terapkan di Shiny untuk pertemuan penyelidik medis berikutnya.
Saya suka plot ini, bahkan jika ada sumbu kedua yang tidak pernah saya gunakan sebelumnya; periksa kontribusi Henrik dan beberapa orang lain di StackOverflow untuk metode grafis R-base untuk mendapatkannya. Saya lebih suka menempatkan sumbu kedua di sebelah kiri perbedaan untuk membuat benar-benar jelas bahwa nilai berubah, dan mungkin menambahkan sumbu p-value.
Adakah yang berasal dari fraksi kisi / ggplot yang melakukan tembakan? Semua solusi yang disediakan adalah grafis dasar dan tidak dapat panel / facetable.
Namun: perhatikan bahwa komentar dan makalah sebagian besar dari departemen psikologi (dan @cbeleites dari kimia hardcore). Akan baik untuk mendapatkan komentar dari pengulas jurnal medis.
sumber
Mengapa tidak hanya merencanakan perbedaan * untuk setiap pasien? Anda kemudian dapat menggunakan histogram, plot kotak atau plot probabilitas normal dan overlay interval kepercayaan 95% untuk perbedaan.
sumber