Cara menampilkan bilah kesalahan untuk percobaan lintas-berpasangan

19

Skenario berikut telah menjadi Most-FAQ di trio penyelidik (I), reviewer / editor (R, tidak terkait dengan CRAN) dan saya (M) sebagai pencipta plot. Kita dapat berasumsi bahwa (R) adalah peninjau bos besar medis yang khas, yang hanya tahu bahwa setiap plot harus memiliki bar kesalahan, jika tidak maka itu salah. Ketika peninjau statistik terlibat, masalah menjadi kurang kritis.

Skenario

Dalam studi cross-over farmakologis yang khas, dua obat A dan B diuji efeknya pada kadar glukosa. Setiap pasien diuji dua kali dalam urutan acak dan dengan asumsi tidak ada carry-over. Titik akhir primer adalah perbedaan antara glukosa (BA), dan kami menganggap bahwa uji-t berpasangan memadai.

(I) menginginkan plot yang menunjukkan kadar glukosa absolut dalam kedua kasus. Dia takut keinginan (R) untuk bar kesalahan, dan meminta kesalahan standar dalam grafik batang. Jangan memulai perang grafik batang di sini ._)

grafik batang dan glukosa SE untuk dua perawatan

(I): Itu tidak mungkin benar. Bilah tumpang tindih, dan kami memiliki p = 0,03? Bukan itu yang saya pelajari di sekolah menengah.

(L): Kami memiliki desain berpasangan di sini. Bilah kesalahan yang diminta sama sekali tidak relevan, yang penting adalah SE / CI dari perbedaan pasangan, yang tidak ditampilkan dalam plot. Jika saya punya pilihan dan tidak ada terlalu banyak data, saya lebih suka plot berikut

Garis yang bergabung menunjukkan pasangan, titik nilai-nilai aslinya

Ditambahkan 1: Ini adalah plot koordinat paralel yang disebutkan dalam beberapa respons

(L): Garis-garis menunjukkan pasangan, dan sebagian besar garis naik, dan itu kesan yang tepat, karena kemiringan adalah yang terpenting (ok, ini kategorikal, namun demikian).

(I): Gambar itu membingungkan. Tidak ada yang memahaminya, dan tidak memiliki bar kesalahan (R mengintai).

(L): Kami juga dapat menambahkan plot lain yang menunjukkan interval kepercayaan yang relevan dari perbedaan tersebut. Jarak dari garis nol memberi kesan ukuran efek.

(I): Tidak ada yang melakukannya

(R): Dan itu memboroskan pohon-pohon berharga

(L): (Sebagai orang Jerman yang baik): Ya, titik pada pohon diambil. Namun saya tetap menggunakan ini (dan tidak pernah mempublikasikannya) ketika kami memiliki beberapa perawatan dan beberapa kontras.

interval kepercayaan perbedaan

Ada saran ? R-Code di bawah ini, jika Anda ingin membuat plot.

# Graphics for Crossover experiments
library(ggplot2)
library(plyr)
theme_set(theme_bw()+theme(panel.margin=grid::unit(0,"lines")))
n = 20
effect = 5 
set.seed(4711)
glu0 = rnorm(n,120,30)
glu1 = glu0 + rnorm(n,effect,7)
dt = data.frame(patient = rep(paste0("P",10:(9+n))),              
                treatment = rep(c("A","B"), each=n),glucose = c(glu0,glu1))

dt1 = ddply(dt,.(treatment), function(x){
  data.frame(glucose = mean(x$glucose), se = sqrt(var(x$glucose)/nrow(x)) )})

tt = t.test(glucose~treatment,paired=TRUE,data=dt,conf.int=TRUE)
dt2 = data.frame(diff = -tt$estimate,low=-tt$conf.int[2], up=-tt$conf.int[1])
p = paste("p =",signif(tt$p.value,2))

png(height=300,width=300)
ggplot(dt1, aes(x=treatment, y=glucose, fill=treatment))+      
  geom_bar(stat="identity")+  
  geom_errorbar(aes(ymin=glucose-se, ymax=glucose+se),size=1., width=0.3)+
  geom_text(aes(1.5,150),label=p,size=6)

ggplot(dt,aes(x=treatment,y=glucose, group=patient))+ylim(0,190)+
  geom_line()+geom_point(size=4.5)+
  geom_text(aes(1.5,60),label=p,size=6)

ggplot(dt2,aes(x="",y=diff))+
  geom_errorbar(aes(ymin=low,ymax=up),size=1.5,width=0.2)+ 
  geom_text(aes(1,-0.8),label=p,size=6)+
  ylab("95% CI of difference glucose B-A")+  ylim(-10,10)+
  theme(panel.border=element_blank(), panel.grid.major.x=element_blank(),
         panel.grid.major.y=element_line(size=1,colour="grey88"))

dev.off()
Dieter Menne
sumber
Ya ampun @ dieter-menne, pertanyaan bagus! Ini sangat tergantung pada jenis jurnal yang Anda kirimkan artikel. Saya akan menjauh dari perang grafik, tetapi saya suka grafik 2 dan 3: begitu banyak informasi dalam ruang yang begitu kecil.
doug.numbers
4
Masson dan Loftus (2003) sering diberikan referensi. Mereka menunjukkan contoh plot di mana mereka panel CI perbedaan di panel kedua dari grafik yang sama. Apakah itu akan membuat semua orang di sirkus bahagia, saya tidak tahu (saya merasa untuk Anda!)
Andy W
Terima kasih, @AndyW, untuk referensi. Ini to the point, tetapi memiliki masalah: itu dari psikologi. Ada banyak makalah yang lebih baik tentang subjek dari psikolog yang memiliki latar belakang statistik yang jauh lebih baik dibandingkan dengan pengulas medis. Saya berharap saya bisa menemukan panduan jurnal tingkat tinggi tentang hal itu, itu satu-satunya pedang tajam yang bisa saya tangani.
Dieter Menne

Jawaban:

17

Anda sepenuhnya benar dalam asumsi Anda bahwa bilah galat yang mewakili galat standar rata-rata sama sekali tidak pantas untuk desain dalam subjek. Namun, pertanyaan tumpang tindih kesalahan dan signifikansi adalah topik lain, yang saya akan kembali pada akhir daftar referensi yang dikomentari ini.

Ada banyak literatur dari Psikologi tentang interval kepercayaan di dalam subjek atau bar kesalahan yang melakukan apa yang Anda inginkan. Pekerjaan referensi jelas:

Loftus, GR, & Masson, MEJ (1994). Menggunakan interval kepercayaan dalam desain dalam-subjek . Buletin & Ulasan Psikonomis, 1 (4), 476-490. doi: 10.3758 / BF03210951

Namun, masalah mereka adalah bahwa mereka menggunakan istilah kesalahan yang sama untuk semua tingkat faktor dalam subjek. Ini sepertinya bukan masalah besar untuk kasus Anda (2 level). Tetapi ada pendekatan yang lebih modern untuk menyelesaikan masalah ini. Terutama:

Franz, V., & Loftus, G. (2012). Kesalahan standar dan interval kepercayaan dalam desain dalam-subyek: Generalized Loftus dan Masson (1994) dan menghindari bias dari akun alternatif . Buletin & Ulasan Psikonomis , 1–10. doi: 10.3758 / s13423-012-0230-1

Baguley, T. (2011). Menghitung dan membuat grafik interval kepercayaan dalam-subjek untuk ANOVA. Metode Penelitian Perilaku . doi: 10.3758 / s13428-011-0123-7 [ dapat ditemukan di sini ]

Referensi lebih lanjut dapat ditemukan dalam dua makalah yang terakhir (yang saya pikir keduanya layak dibaca).


Bagaimana para peneliti menafsirkan CI? Buruk menurut kertas berikut:

Belia, S., Fidler, F., Williams, J., & Cumming, G. (2005). Interval Keyakinan Kesalahpahaman Peneliti dan Bar Kesalahan Standar . Metode Psikologis , 10 (4), 389–396. doi: 10.1037 / 1082-989X.10.4.389

Bagaimana seharusnya kita menginterpretasikan CI yang tumpang tindih dan tidak tumpang tindih?

Cumming, G., & Finch, S. (2005). Inference by Eye: Interval Keyakinan dan Cara Membaca Gambar Data . American Psychologist , 60 (2), 170-180. doi: 10.1037 / 0003-066X.60.2.170


Satu pemikiran terakhir (walaupun ini tidak relevan dengan kasus Anda): Jika Anda memiliki desain petak-petak (yaitu, faktor di dalam dan di antara subjek) dalam satu petak, Anda dapat melupakan bilah kesalahan secara bersamaan. Saya akan (rendah hati) merekomendasikan saya raw.means.plotfungsi dalam paket R plotrix.

Henrik
sumber
2
Daftar referensi yang sangat berguna. Cumming telah menyatukan banyak idenya di amazon.com/Understanding-New-Statistics-Meta-Analysis-ebook/dp/… (Apa pun yang ingin Anda katakan tentang ungkapan "statistik baru", saya mungkin setuju.)
Nick Cox
@amoeba Kertas Baguley yang saya kutip menggunakan teknik kertas Morey.
Henrik
10

Pertanyaannya tampaknya bukan tentang bar kesalahan sebanyak tentang cara terbaik untuk memplot data berpasangan.

Pada dasarnya, bar kesalahan paling banyak adalah cara meringkas ketidakpastian: mereka tidak, dan mereka tentu saja tidak bisa, banyak bicara tentang struktur yang bagus dalam data.

Plot koordinat paralel - kadang-kadang disebut plot profil, sebuah istilah yang memiliki arti berbeda di bidang yang berbeda - telah disebutkan dalam pertanyaan. Plot sebar dasar telah disarankan oleh @Ray Koopman.

SEBUAH-B(SEBUAH+B)/2SEBUAH+B

Sumber lain untuk plot ini adalah Neyman, J., Scott, EL dan Shane, CD 1953. Tentang distribusi spasial galaksi: model spesifik. Jurnal Astrofisika 117: 92–133.

Dalam arti luas, plot-plot semacam itu mirip dengan gagasan merencanakan residu versus pas, juga dipopulerkan oleh Tukey dan saudara iparnya, Anscombe.

SEBUAH-B=0SEBUAH=BSEBUAHB

Desain yang diabaikan adalah plot paralel-garis McNeil, DR 1992. Pada grafik data berpasangan. Ahli Statistik Amerika 46: 307–310. Ini juga dibahas dalam dua referensi di bawah ini.

Ulasan terkait-stata, dengan beberapa referensi, ada di

2004, Perjanjian grafik dan ketidaksepakatan. Jurnal Stata 4: 329-349.

.pdf dapat diakses di http://www.stata-journal.com/sjpdf.html?articlenum=gr0005

Plot berpasangan, paralel, atau profil untuk perubahan, korelasi, dan perbandingan lainnya. Jurnal Stata 9: 621-639.

.pdf dapat diakses di http://www.stata-journal.com/sjpdf.html?articlenum=gr0041

Pengguna non-Stata harus dapat melewati dan bersenandung melalui kode Stata sambil mencari cara untuk mengimplementasikan grafik dalam perangkat lunak favorit mereka sendiri.

SEBUAHB

Nick Cox
sumber
4

Coba sebarkan sebaran poin (A, B) individual. Sebagian besar dari mereka harus terletak di satu sisi diagonal (garis A = B). Ada dua analog bar kesalahan. Yang konvensional, setara dengan CI untuk perbedaan rata-rata, akan menjadi pita kepercayaan untuk perbedaan rata-rata. Pita akan menjadi wilayah antara dua garis, yang keduanya sejajar dengan diagonal. Uji-t berpasangan akan signifikan jika dan hanya jika kedua tepi pita berada pada sisi yang sama dari diagonal.

Analog error-bar yang lebih konservatif akan menjadi elips kepercayaan untuk centroid.

Ray Koopman
sumber
1
cmethHaidBcmethHaidSEBUAH
Tidak, cl. - :) Kimia klinis terlalu canggih. Mungkinkah Anda telah menambahkan beberapa referensi di "sana"; Saya tidak yakin kertas apa yang Anda bicarakan.
Dieter Menne
4

Ringkasan pendahuluan:

Masson / Loftus sangat lengkap, dan bukan bacaan yang mudah untuk diberikan kepada rekan medis saya yang tidak akan menerima sesuatu seperti "interaksi". Mereka juga memiliki beberapa saran untuk beberapa perbandingan, yang menunjukkan bahwa interval kepercayaan berpasangan sulit untuk diilustrasikan ketika seseorang tidak ingin terlalu menyederhanakan.

Masson Loftus

Saya tidak suka gaya ini: bilah-bilah dengan bilah galat terlihat Excelish milenium terakhir. Namun, mereka juga menggunakan gaya yang sedikit lebih elegan:

Masson Loftus tanpa bar

Cumming / Finch dan Belia et al. adalah bacaan wajib. Yang pertama adalah pilihan yang sempurna untuk memberi teman Anda yang bergidik ketika dia melihat kata interaksi . Saya memesan buku Cumming setelah membaca artikel itu. Yang kedua menunjukkan tes yang akan saya terapkan di Shiny untuk pertemuan penyelidik medis berikutnya.

Cumming / Finch

Saya suka plot ini, bahkan jika ada sumbu kedua yang tidak pernah saya gunakan sebelumnya; periksa kontribusi Henrik dan beberapa orang lain di StackOverflow untuk metode grafis R-base untuk mendapatkannya. Saya lebih suka menempatkan sumbu kedua di sebelah kiri perbedaan untuk membuat benar-benar jelas bahwa nilai berubah, dan mungkin menambahkan sumbu p-value.

Adakah yang berasal dari fraksi kisi / ggplot yang melakukan tembakan? Semua solusi yang disediakan adalah grafis dasar dan tidak dapat panel / facetable.

Namun: perhatikan bahwa komentar dan makalah sebagian besar dari departemen psikologi (dan @cbeleites dari kimia hardcore). Akan baik untuk mendapatkan komentar dari pengulas jurnal medis.

Dieter Menne
sumber
0

Mengapa tidak hanya merencanakan perbedaan * untuk setiap pasien? Anda kemudian dapat menggunakan histogram, plot kotak atau plot probabilitas normal dan overlay interval kepercayaan 95% untuk perbedaan.

  • Dalam beberapa skenario mungkin perbedaan logaritma. Lihat, misalnya, Patterson & Jones, "Bioequivalence dan Statistik dalam Farmakologi Klinis", Chapman, 2006.
Emil Friedman
sumber
Kenapa tidak? Mungkin memberikan informasi yang valid, tetapi plot dengan titik atau pasangan individu tidak benar-benar populer dalam penelitian medis. Itu sebabnya plot paralel (yang menyediakan lebih banyak informasi) sangat tidak populer. Peneliti medis menginginkan rata-rata dan "rentang normal" (apa pun itu).
Dieter Menne