Salah satu cara untuk meringkas perbandingan dua kurva survival adalah dengan menghitung rasio bahaya (HR). Ada (setidaknya) dua metode untuk menghitung nilai ini.
- Metode logrank. Sebagai bagian dari perhitungan Kaplan-Meier, hitung jumlah peristiwa yang diamati (kematian, biasanya) di masing-masing kelompok ( , dan O b ), dan jumlah peristiwa yang diharapkan dengan asumsi hipotesis nol tidak ada perbedaan dalam kelangsungan hidup ( E a dan E b ). Rasio bahaya kemudian adalah:
H R = ( O a / E a )
- Metode Mantel-Haenszel. Hitung pertama V, yang merupakan jumlah dari varians hipergeometrik pada setiap titik waktu. Kemudian hitung rasio bahaya sebagai:
Saya mendapatkan kedua persamaan ini dari Bab 3 dari Machin, Cheung dan Parmar,Analisis Kelangsungan Hidup. Buku itu menyatakan bahwa kedua metode ini biasanya memberikan metode yang sangat mirip, dan memang demikian halnya dengan contoh dalam buku tersebut.
Seseorang mengirimi saya sebuah contoh di mana dua metode berbeda dengan faktor tiga. Dalam contoh khusus ini, jelas bahwa perkiraan batang kayu masuk akal, dan perkiraan Mantel-Haenszel jauh sekali. Pertanyaan saya adalah apakah ada yang punya saran umum kapan sebaiknya memilih estimasi logrank dari rasio bahaya, dan kapan sebaiknya memilih estimasi Mantel-Haenszel? Apakah itu ada hubungannya dengan ukuran sampel? Jumlah ikatan? Rasio ukuran sampel?
Jawaban:
Saya pikir saya menemukan jawabannya (untuk pertanyaan saya sendiri). Jika asumsi bahaya proporsional benar, kedua metode ini memberikan perkiraan rasio bahaya yang serupa. Perbedaan yang saya temukan dalam satu contoh khusus, saya pikir sekarang, adalah karena fakta bahwa asumsi itu meragukan.
Jika asumsi bahaya proporsional benar, maka grafik log (waktu) vs. log (-log (St)) (di mana St adalah survival proporsional pada waktu t) harus menunjukkan dua garis paralel. Di bawah ini adalah grafik yang dibuat dari kumpulan data masalah. Sepertinya jauh dari linear. Jika asumsi bahaya proporsional tidak valid, maka konsep rasio bahaya tidak ada artinya, jadi tidak masalah metode mana yang digunakan untuk menghitung rasio bahaya.
Saya ingin tahu apakah perbedaan antara perkiraan logrank dan Mantel-Haenszel dari rasio bahaya dapat digunakan sebagai metode untuk menguji asumsi bahaya proporsional?
sumber
Jika saya tidak salah, penaksir log-rank yang Anda referensi juga dikenal sebagai penaksir Pike. Saya percaya ini umumnya direkomendasikan untuk HR <3 karena menunjukkan bias yang lebih kecil dalam kisaran itu. Makalah berikut mungkin menarik (perhatikan bahwa makalah ini menyebutnya sebagai O / E):
sumber
Sebenarnya ada beberapa metode lagi dan pilihannya sering tergantung pada apakah Anda paling tertarik untuk mencari perbedaan awal, perbedaan kemudian atau - seperti untuk tes log-rank & tes Mantel-Haenszel - memberikan bobot yang sama untuk semua titik waktu.
Untuk pertanyaan yang ada. Uji log-rank sebenarnya adalah bentuk uji Mantel-Haenszel yang diterapkan pada data survival. Uji Mantel-Haenszel biasanya digunakan untuk menguji independensi dalam tabel kontingensi bertingkat.
Jika kita mencoba menerapkan uji MH pada data survival, kita dapat mulai dengan mengasumsikan bahwa peristiwa pada setiap waktu kegagalan adalah independen. Kami kemudian dikelompokkan berdasarkan waktu kegagalan. Kami menggunakan metode MH untuk dengan membuat setiap waktu kegagalan strata. Tidak heran mereka sering memberikan hasil yang sama.
Pengecualian terjadi ketika lebih dari satu peristiwa terjadi secara bersamaan - beberapa kematian pada titik waktu yang sama. Saya tidak ingat bagaimana perawatannya berbeda. Saya pikir tes log-rank rata-rata atas kemungkinan urutan waktu kegagalan yang diikat.
Jadi tes log-rank adalah tes MH untuk data kelangsungan hidup dan dapat menangani ikatan. Saya tidak pernah menggunakan tes MH untuk data kelangsungan hidup.
sumber
Saya pikir saya menemukan situs web dan referensi yang berhubungan persis dengan pertanyaan ini:
http://www.graphpad.com/faq/viewfaq.cfm?faq=1226 Mulai dari "Dua metode yang dibandingkan".
Situs tersebut merujuk pada kertas Berstein yang terhubung (di atas):
http://www.jstor.org/stable/2530564?seq=1
Situs ini merangkum hasil Berstein et al dengan baik, jadi saya akan mengutipnya:
Situs ini juga merujuk pada dataset di mana "dua estimasi SDM sangat berbeda (dengan faktor tiga)", dan menunjukkan bahwa asumsi PH adalah pertimbangan utama.
Lalu saya berpikir, "Siapa yang menulis situs itu?" Setelah sedikit mencari saya menemukan itu Harvey Motulsky. Jadi Harvey, saya sudah berhasil merujuk Anda dalam menjawab pertanyaan Anda sendiri. Anda telah menjadi otoritas!
Apakah "dataset masalah" merupakan dataset yang tersedia untuk umum?
sumber