Uji statistik untuk membandingkan ketepatan dua perangkat

10

Saya membandingkan dua alat pengontrol suhu yang dirancang untuk menjaga suhu tubuh pada 37 derajat tepat pada pasien yang dianestesi. Perangkat dipasang pada 500 pasien yang membentuk dua kelompok. Grup A (400 pasien) - Perangkat 1, Grup B (100 pasien) - Perangkat 2. Setiap pasien mengukur suhu mereka setiap jam sekali selama 36 jam, memberi saya 18.000 titik data di dua kelompok. Saya perlu menentukan perangkat mana yang mengontrol suhu tubuh pasien lebih tepat selama periode 36 jam. Saya telah membuat grafik garis yang menggabungkan nilai median pada setiap titik waktu dengan bar kuartil dan secara visual tampaknya ada perbedaan. Bagaimana saya harus menganalisis data saya untuk membuktikan perbedaan statistik?

RIKT
sumber
Apakah Anda berbagi pasien antar perangkat? Jika Anda tidak melakukannya maka harus ada asumsi tambahan bahwa pasien dalam dua kelompok serupa dalam arti luas.
Aksakal
Bagaimana dengan model efek campuran? Kesalahan standar untuk setiap level (grup A / B) akan, dalam arti tertentu, memberi tahu Anda seberapa akurat pengukurannya. Anda dapat menghitung deret waktu dan pasien.
Roman Luštrik

Jawaban:

2

Hal pertama yang perlu Anda pikirkan adalah apa artinya (secara kuantitatif) memiliki "ketepatan yang baik" dalam perangkat semacam itu. Saya akan menyarankan bahwa, dalam konteks medis, tujuannya adalah untuk menghindari penyimpangan suhu yang masuk ke kisaran berbahaya bagi pasien, sehingga "presisi yang baik" mungkin akan diterjemahkan ke dalam menghindari suhu rendah atau tinggi yang berbahaya. Ini berarti Anda akan mencari metrik yang sangat menghukum penyimpangan besar dari suhu optimal 37 C. Dalam pandangan ini, pengukuran berdasarkan fluktuasi suhu rata-rata akan menjadi ukuran yang buruk dari presisi, sedangkan langkah-langkah yang menyoroti penyimpangan besar akan lebih baik.Hai

Saat Anda merumuskan metrik jenis ini, Anda secara implisit mengadopsi "fungsi penalti" yang menghukum suhu yang menyimpang dari suhu yang Anda inginkan. Salah satu opsi adalah mengukur "presisi" dengan varians yang lebih rendah di sekitar suhu yang diinginkan (memperlakukan ini sebagai rata-rata tetap untuk perhitungan varians). Varians menghukum oleh kesalahan kuadrat, sehingga memberikan hukuman yang wajar untuk penyimpangan tinggi. Pilihan lain adalah menghukum lebih berat (mis., Cubed-error). Pilihan lain adalah dengan hanya mengukur jumlah waktu setiap perangkat memiliki pasien di luar kisaran suhu yang aman secara medis. Dalam kasus apa pun, apa pun yang Anda pilih harus mencerminkan bahaya penyimpangan yang dirasakan dari suhu yang diinginkan.

Setelah Anda menentukan apa yang merupakan metrik "presisi baik", Anda akan merumuskan semacam "uji heteroskedastisitas", diformulasikan dalam arti yang lebih luas untuk memungkinkan pengukuran presisi apa pun yang Anda gunakan. Saya tidak yakin saya setuju dengan komentar Whuber tentang penyesuaian untuk autokorelasi. Itu benar-benar tergantung pada formulasi kerugian Anda - setelah semua, tinggal di kisaran suhu tinggi untuk jangka waktu yang lama bisa menjadi hal yang paling berbahaya, jadi jika Anda menyesuaikan kembali ke akun untuk korelasi-otomatis, Anda mungkin berakhir gagal menghukum hasil yang sangat berbahaya secara memadai.

Ben - Pasang kembali Monica
sumber
0

Ini adalah tes homoseksualitas. Dan karena ini adalah deret waktu, pilihan yang tepat adalah tes Breusch – Pagan , bukan uji F. Tes ini hanya menjawab HANYA pertanyaan kesetaraan antara kedua perangkat. Tingkat ketepatan adalah cara lain untuk memikirkan perbedaan.

[Sunting: Mengubah tes ke yang benar, mengingat ketergantungan waktu]

Gary Chung
sumber
3
Pendekatan ini masuk akal. Tetapi mengapa tidak mencapai kedua tujuan secara langsung, dengan membandingkan dispersi di sekitar suhu target daripada varians (yang hanya mengukur dispersi di sekitar suhu rata-rata)? Satu masalah penting untuk memeriksa pertama menyangkut korelasi serial: jika tinggi, maka beberapa koreksi perlu dilakukan (seperti mengurangi derajat kebebasan dalam tes). Masalah lain menyangkut kerugian : fungsi kerugian mungkin tidak kuadratik. Mungkin orang dapat dengan mudah mentolerir fluktuasi kecil tetapi terjadinya fluktuasi besar bisa menyakitkan. Itu harus digali.
whuber
@whuber Mengenai membandingkan sekitar temp target, jika itu saya, itulah yang akan saya lakukan. OP secara khusus hanya menanyakan pertanyaan varians, jadi terlepas dari kecenderungan kami, kami harus mengatasinya secara langsung, ya? :)
Gary Chung
2
Masalah untuk tes F tidak akan normal, kemungkinan akan menjadi independensi. Ini adalah deret waktu.
Glen_b -Reinstate Monica
@ Glen_b Tidak percaya saya melewatkan titik itu. Terima kasih sudah menangkapnya. Diedit.
Gary Chung
9
Dengan hormat, tidak: perbedaan antara situs ini dan, katakanlah, situs Math adalah bahwa sebagian besar dari menjawab pertanyaan statistik melibatkan membantu OP membingkai seperti yang mereka inginkan. Cukup sering, jawaban yang benar untuk pertanyaan yang awalnya diajukan di sini kurang membantu atau bahkan menyesatkan. Jadi tugas pertama kami sebagai pembaca aktif dan calon responden adalah memastikan bahwa kami menafsirkan pertanyaan dengan cara yang bermanfaat dan tepat dan untuk memberikan jawaban yang paling sesuai dengan tujuan OP. Gunakan komentar untuk pertanyaan untuk mengajukan pertanyaan klarifikasi dan memverifikasi interpretasi Anda.
whuber
0

Jika Anda tertarik pada seberapa baik perangkat mempertahankan suhu 37C, Anda dapat:

  1. Gunakan semua data yang tersedia dari setiap orang apa adanya atau
  2. Perkirakan penyimpangan rata-rata per orang dari 37C menggunakan 36 percobaan setiap orang.

Data secara alami cocok untuk pengobatan tindakan berulang. Dengan memperlakukan uji coba orang dalam sebagai cluster, Anda akan mengurangi kemungkinan interval kepercayaan yang salah diperkirakan di sekitar efek perangkat. Selain itu, Anda dapat menguji efek waktu di antara kedua perangkat atau sebagai interaksi dengan perangkat untuk memastikan apakah pemeliharaan suhu dari waktu ke waktu baik. Menemukan cara untuk memvisualisasikan semua ini adalah kunci penting dan mungkin menyarankan satu pendekatan dari yang lain. Sesuatu di sepanjang garis:

library(dplyr)
library(lme4)

set.seed(42)
id <- rep(1:500, each=36)
time <- rep(1:36,500)
temp <- c(rnorm(36*400, 38,0.5), rnorm(36*100,37.25,0.5))
temp <- temp + 1/time

prox_37 <- temp - 37
group <- c(rep("A",36*400), rep("B",36*100))
graph_t <- ifelse(group=="A", time-0.25, time+0.25)
df <- data.frame(id,time,temp,prox_37,group, graph_t)

id_means <- group_by(df, id) %>% summarize(mean_37 = mean(prox_37))
id_means$group <- c(rep("A",400), rep("B",100))

boxplot(id_means$mean_37 ~ id_means$group)

plot(graph_t, prox_37, col=as.factor(group))
loess_fit <- loess(prox_37 ~ time, data = df)
lines(c(1:36), predict(loess_fit, newdata= c(1:36)) , col = "blue")

summary(t.test(mean_37 ~group, data=id_means))

model1 <- glm(prox_37 ~ as.factor(group), family = "gaussian", data=df)
model2 <- lmer(prox_37 ~ as.factor(group) + (1 | id), data=df)
model3 <- lmer(prox_37 ~ as.factor(group) + time + (1 | id), data=df)
model4 <- lmer(prox_37 ~ as.factor(group) + time + time*as.factor(group) + (1 | id), data=df)

AIC(model1)
summary(model2)
summary(model3)
summary(model4)

masukkan deskripsi gambar di sini

Todd D
sumber