Sebuah analisis sementara adalah analisis data pada satu atau lebih titik waktu sebelum resmi penutupan penelitian dengan tujuan, misalnya, mungkin mengakhiri studi awal.
Menurut Piantadosi, S. ( Uji klinis - perspektif metodologis ): " Perkiraan efek pengobatan akan menjadi bias ketika uji coba dihentikan pada tahap awal. Semakin awal keputusan, semakin besar biasnya. "
Bisakah Anda menjelaskan klaim ini kepada saya? Saya dapat dengan mudah memahami bahwa keakuratan akan terpengaruh, tetapi klaim tentang bias tidak jelas bagi saya ...
clinical-trials
bias
okram
sumber
sumber
Jawaban:
Pertama-tama, Anda harus mencatat konteksnya: ini hanya berlaku ketika percobaan dihentikan lebih awal karena pemantauan sementara menunjukkan kemanjuran / kesia-siaan, bukan karena alasan acak di luar. Dalam hal ini estimasi ukuran efek akan bias dalam arti statistik sepenuhnya. Jika Anda berhenti untuk kemanjuran, perkiraan efeknya akan terlalu tinggi (dengan asumsi itu positif), jika Anda berhenti untuk kesia-siaan, itu akan terlalu rendah.
Piantodosi juga memberikan penjelasan intuitif (Bagian 10.5.4 dalam edisi saya). Misalkan perbedaan sejati dalam dua cara adalah 1 unit. Ketika Anda menjalankan banyak percobaan, dan melihatnya pada waktu analisis sementara Anda, beberapa dari mereka akan mengamati ukuran efek jauh di atas 1, beberapa jauh di bawah satu, dan sebagian besar di sekitar 1 - distribusi akan lebar, tetapi simetris. Perkiraan ukuran efek pada titik ini tidak akan terlalu akurat, tetapi tidak bias. Namun Anda hanya berhenti dan melaporkan ukuran efek jika perbedaannya signifikan (disesuaikan untuk beberapa pengujian), yaitu perkiraannya berada di sisi yang tinggi. Dalam semua kasus lain, Anda terus berjalan dan tidak melaporkan perkiraan. Itu berarti syarat untuk berhenti lebih awal, distribusi ukuran efek tidak simetris, dan nilai yang diharapkan di atas nilai sebenarnya dari estimasi.
Fakta bahwa efek ini lebih parah pada awalnya berasal dari rintangan yang lebih besar untuk menghentikan persidangan, sehingga sebagian besar dari distribusi dibuang selama pengkondisian.
sumber
Berikut adalah ilustrasi tentang bagaimana bias mungkin muncul dalam kesimpulan, dan mengapa itu mungkin bukan cerita lengkapnya. Misalkan Anda memiliki uji coba berurutan dari obat yang diharapkan memiliki efek positif (+1) tetapi mungkin memiliki efek negatif (-1). Lima marmut diuji satu demi satu. Probabilitas yang tidak diketahui dari hasil positif dalam satu kasus sebenarnya dan hasil negatif . 134 14
Jadi setelah lima percobaan probabilitas dari hasil yang berbeda
jadi probabilitas hasil positif secara keseluruhan adalah 918/1024 = 0,896, dan hasil rata-rata adalah +2,5. Dibagi dengan 5 percobaan, ini adalah rata-rata hasil +0,5 per percobaan.
Ini adalah angka yang tidak bias, karena juga .+ 1 ×34- 1 × 14
Misalkan untuk melindungi kelinci percobaan, penelitian ini akan dihentikan jika pada tahap apa pun hasil kumulatifnya negatif. Maka probabilitas menjadi
sehingga probabilitas hasil positif secara keseluruhan adalah 702/1024 = 0,6855, dan hasil rata-rata adalah +1,953. Jika kita melihat nilai rata-rata hasil per percobaan dalam perhitungan sebelumnya, yaitu menggunakan , , , , dan maka kita akan mendapatkan +0.184. +3+ 55 +1+ 35 -1+ 15 -1- 15 -1- 13 - 11
Ini adalah indra di mana ada bias dengan berhenti di awal skema kedua, dan bias berada di arah yang diprediksi. Tapi ini bukan cerita lengkapnya.
Mengapa whuber dan probabilityislogic berpikir berhenti lebih awal harus menghasilkan hasil yang tidak bias? Kita tahu hasil yang diharapkan dari percobaan dalam skema kedua adalah +1.953. Jumlah percobaan yang diharapkan ternyata 3,906. Jadi, membagi satu dengan yang lain kita mendapatkan +0.5, persis seperti sebelumnya dan apa yang digambarkan sebagai tidak bias.
sumber
Yah, pengetahuan saya tentang ini berasal dari pidato Harveian pada tahun 2008 http://bookshop.rcplondon.ac.uk/details.aspx?e=262 Pada dasarnya, sejauh ingatan saya yang terbaik, hasilnya akan menjadi bias karena 1) berhenti lebih awal biasanya berarti bahwa salah satu perawatan lebih atau kurang efektif dari yang diharapkan, dan jika ini positif, maka Anda mungkin memanfaatkan peluang. Saya percaya bahwa nilai p dihitung berdasarkan ukuran sampel yang direncanakan (tapi saya bisa salah tentang ini), dan juga jika Anda terus-menerus memeriksa hasil Anda untuk melihat apakah ada efek yang ditampilkan, Anda perlu memperbaiki beberapa perbandingan. untuk memastikan bahwa Anda tidak hanya menemukan efek kebetulan. Misalnya, jika Anda memeriksa 20 kali untuk nilai p di bawah 0,05 kemudian secara statistik, Anda hampir pasti menemukan satu hasil yang signifikan.
sumber
Saya akan tidak setuju dengan klaim itu, kecuali dengan "bias" Piantadosi berarti bagian dari keakuratan yang biasa disebut bias. Inferensi tidak akan "bias" karena Anda memilih untuk berhenti sendiri: itu akan "bias" karena Anda memiliki lebih sedikit data. Yang disebut "prinsip kemungkinan" menyatakan bahwa inferensi hanya bergantung pada data yang diamati, dan bukan pada data yang mungkin telah diamati, tetapi tidak. LP mengatakan
sumber
ada akan bias (dalam "arti statistik") jika pemutusan studi tidak acak.
Dalam serangkaian eksperimen yang dijalankan hingga kesimpulan, hasil "awal" dari (a) beberapa eksperimen yang akhirnya menemukan "tidak ada efek" akan menunjukkan beberapa efek (sebagai akibat dari kebetulan) dan (b) beberapa eksperimen yang akhirnya menemukan efek akan menunjukkan "tidak ada efek" (kemungkinan karena kurangnya daya). Dalam dunia di mana Anda menghentikan uji coba, jika Anda berhenti (a) lebih sering daripada (b), Anda akan berakhir di berbagai studi dengan bias dalam mendukung menemukan efek. (Logika yang sama berlaku untuk ukuran efek ; mengakhiri studi yang menunjukkan efek "lebih besar dari yang diharapkan" sejak awal lebih sering daripada yang menunjukkan "seperti yang diharapkan atau lebih rendah" akan meningkatkan jumlah temuan "efek besar.")
Jika pada kenyataannya percobaan medis dihentikan ketika hasil awal menunjukkan efek positif - untuk membuat pengobatan tersedia untuk subyek dalam plasebo atau orang lain - tetapi tidak ketika hasil awal tidak dapat disimpulkan, maka akan ada lebih banyak kesalahan tipe 1 dalam pengujian tersebut daripada akan ada jika semua percobaan dijalankan sampai pada kesimpulan. Tetapi itu tidak berarti praktik itu salah; biaya kesalahan tipe 1, secara moral, mungkin lebih rendah daripada menolak pengobatan secepat yang seharusnya dilakukan untuk perawatan yang benar-benar terbukti bekerja pada akhir percobaan penuh.
sumber