Uji statistik untuk nilai prediksi positif dan negatif

12

Saya membaca sebuah makalah dan saya melihat sebuah tabel dengan perbandingan antara PPV (Positive Predictive Value) dan NPV (Negative Predictive Value). Mereka melakukan semacam uji statistik untuk mereka, ini adalah sketsa tabel:

PPV    NPV    p-value
65.9   100    < 0.00001
...

Setiap baris mengacu pada tabel kontingensi tertentu.

Tes hipotesis macam apa yang mereka lakukan? Terima kasih!

Simone
sumber

Jawaban:

17

Dengan asumsi klasifikasi silang seperti yang ditunjukkan di bawah ini (di sini, untuk instrumen penyaringan)

teks alternatif

kita dapat mendefinisikan empat ukuran akurasi penyaringan dan daya prediksi:

  • Sensitivitas (se), a / (a ​​+ c), yaitu probabilitas layar memberikan hasil positif mengingat adanya penyakit;
  • Spesifisitas (sp), d / (b + d), yaitu probabilitas layar memberikan hasil negatif mengingat penyakit tidak ada;
  • Nilai prediktif positif (PPV), a / (a ​​+ b), yaitu probabilitas pasien dengan hasil tes positif yang didiagnosis dengan benar (positif);
  • Nilai prediktif negatif (NPV), d / (c + d), yaitu probabilitas pasien dengan hasil tes negatif yang didiagnosis dengan benar (negatif).

Setiap empat ukuran adalah proporsi sederhana yang dihitung dari data yang diamati. Tes statistik yang sesuai dengan demikian akan menjadi tes binomial (tepat) , yang harus tersedia di sebagian besar paket statistik, atau banyak kalkulator online. Hipotesis yang diuji adalah apakah proporsi yang diamati berbeda secara signifikan dari 0,5 atau tidak. Saya menemukan, bagaimanapun, lebih menarik untuk memberikan interval kepercayaan daripada tes signifikansi tunggal, karena memberikan informasi tentang ketepatan pengukuran. Bagaimanapun, untuk mereproduksi hasil yang Anda tunjukkan, Anda perlu mengetahui margin total dari tabel dua arah Anda (Anda hanya memberikan PPV dan NPV sebagai%).

Sebagai contoh, anggaplah kita mengamati data berikut (kuesioner CAGE adalah kuesioner penyaringan untuk alkohol):

teks alternatif

maka dalam R PPV akan dihitung sebagai berikut:

> binom.test(99, 142)

    Exact binomial test

data:  99 and 142 
number of successes = 99, number of trials = 142, p-value = 2.958e-06
alternative hypothesis: true probability of success is not equal to 0.5 
95 percent confidence interval:
 0.6145213 0.7714116 
sample estimates:
probability of success 
             0.6971831 

Jika Anda menggunakan SAS, maka Anda dapat melihat Catatan Penggunaan 24170: Bagaimana saya bisa memperkirakan sensitivitas, spesifisitas, nilai prediktif positif dan negatif, probabilitas positif dan negatif palsu, dan kemungkinan rasio? .

Untuk menghitung interval kepercayaan, perkiraan gaussian, (1,96 menjadi kuantil dari distribusi normal standar pada atau dengan %), digunakan dalam praktek, terutama ketika proporsinya cukup kecil atau besar (yang sering terjadi di sini).p±1.96×p(1p)/np=0.9751α/2α=5

Untuk referensi lebih lanjut, Anda dapat melihat

Pendatang baru, RG. Interval Keyakinan Dua Sisi untuk Proporsi Tunggal: Perbandingan Tujuh Metode . Statistik dalam Kedokteran , 17, 857-872 (1998).

chl
sumber
Terima kasih. Ok, saya membaca di awal makalah bahwa mereka menggunakan uji Chi-square untuk semua variabel kategori. Tabel klasifikasi yang ditulis tidak merujuk ke variabel pada khususnya, itu adalah output dari tugas klasifikasi. Tidak terlalu jelas! Sekarang saya kira mereka melakukan tes klasik pada proporsi .. mungkin Chi-square ..
Simone
Saya telah melihat pertanyaan ini lagi dan saya telah melihat bahwa nilai-p tidak merujuk baik PPV atau NPV, itu mengacu pada seluruh baris. Saya pikir tes yang mereka miliki harus dikaitkan dengan seluruh tabel kontingensi.
Simone
@Simone Jadi, jika saya mengerti Anda dengan benar, Anda menyarankan agar penulis memberikan nilai PPV dan NPV tetapi memberikan nilai p yang sesuai dengan uji asosiasi global tabel 2x2? Apakah ini terkait dengan pertanyaan terakhir ini, stats.stackexchange.com/questions/9464/… ?
chl
Ya, itu akan terkait dengan pertanyaan itu jika nilai-p dikaitkan dengan PPV atau NPV. Dan dalam hal ini Anda memberikan solusinya. Tes sesuai dengan seluruh tabel 2x2, saya tidak akan pernah tahu seperti apa tesnya!
Simone
1

Silahkan lihat

Kosinski, Andrzej S. Statistik skor umum tertimbang untuk perbandingan nilai prediktif tes diagnostik. Statistics in Medicine http://dx.doi.org/10.1002/sim.5587 diterbitkan online: 22 Agustus 2012

Andrzej Kosinski
sumber