Apa pro dan kontra dari menggunakan metode logrank vs Mantel-Haenszel untuk menghitung Rasio Bahaya dalam analisis survival?

17

Salah satu cara untuk meringkas perbandingan dua kurva survival adalah dengan menghitung rasio bahaya (HR). Ada (setidaknya) dua metode untuk menghitung nilai ini.

  • Metode logrank. Sebagai bagian dari perhitungan Kaplan-Meier, hitung jumlah peristiwa yang diamati (kematian, biasanya) di masing-masing kelompok ( , dan O b ), dan jumlah peristiwa yang diharapkan dengan asumsi hipotesis nol tidak ada perbedaan dalam kelangsungan hidup ( E a dan E b ). Rasio bahaya kemudian adalah: H R = ( O a / E a )HAISebuahHAIbESebuahEb
    HR=(Oa/Ea)(Ob/Eb)
  • Metode Mantel-Haenszel. Hitung pertama V, yang merupakan jumlah dari varians hipergeometrik pada setiap titik waktu. Kemudian hitung rasio bahaya sebagai: Saya mendapatkan kedua persamaan ini dari Bab 3 dari Machin, Cheung dan Parmar,Analisis Kelangsungan Hidup. Buku itu menyatakan bahwa kedua metode ini biasanya memberikan metode yang sangat mirip, dan memang demikian halnya dengan contoh dalam buku tersebut.
    HR=exp((OaEa)V)

Seseorang mengirimi saya sebuah contoh di mana dua metode berbeda dengan faktor tiga. Dalam contoh khusus ini, jelas bahwa perkiraan batang kayu masuk akal, dan perkiraan Mantel-Haenszel jauh sekali. Pertanyaan saya adalah apakah ada yang punya saran umum kapan sebaiknya memilih estimasi logrank dari rasio bahaya, dan kapan sebaiknya memilih estimasi Mantel-Haenszel? Apakah itu ada hubungannya dengan ukuran sampel? Jumlah ikatan? Rasio ukuran sampel?

Harvey Motulsky
sumber
Bagaimana estimasi ini terkait dengan yang diberikan oleh regresi Cox? Itu harus menjadi standar emas untuk memperkirakan SDM.
Aniko
Model Cox menggabungkan kovariat. Metode Kaplan-Meier, Nelson-Aalen, Mantel-Haenszel memodelkan bahaya hanya sebagai fungsi dari usia.
shabbychef
@shabbychef: dengan Cox PH, gunakan kovariat biner tunggal, yaitu kode 0/1 untuk grup referensi / pembanding, lalu exp (beta) = HR.
ars
Log-rank adalah tes yang lebih kuat daripada Cox PH ketika asumsi Bahaya proposbal dipenuhi. Jadi dengan kovariat 2 tingkat tunggal, lebih baik uji log-rank atau Mantel-Haenszel.
Thylacoleo
lihat di bawah untuk jawabannya ...
Thylacoleo

Jawaban:

11

Saya pikir saya menemukan jawabannya (untuk pertanyaan saya sendiri). Jika asumsi bahaya proporsional benar, kedua metode ini memberikan perkiraan rasio bahaya yang serupa. Perbedaan yang saya temukan dalam satu contoh khusus, saya pikir sekarang, adalah karena fakta bahwa asumsi itu meragukan.

Jika asumsi bahaya proporsional benar, maka grafik log (waktu) vs. log (-log (St)) (di mana St adalah survival proporsional pada waktu t) harus menunjukkan dua garis paralel. Di bawah ini adalah grafik yang dibuat dari kumpulan data masalah. Sepertinya jauh dari linear. Jika asumsi bahaya proporsional tidak valid, maka konsep rasio bahaya tidak ada artinya, jadi tidak masalah metode mana yang digunakan untuk menghitung rasio bahaya.

teks alternatif

Saya ingin tahu apakah perbedaan antara perkiraan logrank dan Mantel-Haenszel dari rasio bahaya dapat digunakan sebagai metode untuk menguji asumsi bahaya proporsional?

Harvey Motulsky
sumber
7

Jika saya tidak salah, penaksir log-rank yang Anda referensi juga dikenal sebagai penaksir Pike. Saya percaya ini umumnya direkomendasikan untuk HR <3 karena menunjukkan bias yang lebih kecil dalam kisaran itu. Makalah berikut mungkin menarik (perhatikan bahwa makalah ini menyebutnya sebagai O / E):

[...] Metode O / E bias tetapi, dalam kisaran nilai rasio tingkat bahaya yang menarik dalam uji klinis, metode O / E lebih efisien dalam hal kesalahan kuadrat rata-rata daripada CML atau Mantel-Haenszel metode untuk semua kecuali percobaan terbesar. Metode Mantel-Haenszel minimal bias, memberikan jawaban yang sangat dekat dengan yang diperoleh dengan menggunakan CML, dan dapat digunakan untuk memberikan interval kepercayaan perkiraan yang memuaskan.

ars
sumber
Setelah melihat sekilas makalah itu, saya tidak yakin estimasi yang mereka anggap sama dengan yang ada di persamaan kuisioner. Saya setuju dengan komentar di bawah pertanyaan - mungkin pada tahun 1981 metode perkiraan berguna tetapi hari ini tidak ada alasan yang jelas untuk tidak menggunakan regresi Cox.
onestop
@onestop: hmm, pikirkan definisi O / E == LR dengan log yang dilupakan di atas? Saya setuju dengan apa yang Anda katakan tentang Cox PH - itu bukan pertanyaan yang saya coba jawab, tetapi saran Anda lebih baik dalam konteks yang lebih luas.
ars
Bernstein et. Al. menunjukkan beberapa alasan (n kecil, ikatan) yang menyebabkan kedua metode menjadi tidak akurat atau berbeda. Tetapi semua perbedaan yang mereka tunjukkan kecil. Jadi saya tidak berpikir apa pun dalam makalah itu menjelaskan perbedaan tiga kali lipat yang saya lihat yang mendorong pertanyaan ini. Lihat di bawah untuk jawaban yang saya temukan.
Harvey Motulsky
7

Sebenarnya ada beberapa metode lagi dan pilihannya sering tergantung pada apakah Anda paling tertarik untuk mencari perbedaan awal, perbedaan kemudian atau - seperti untuk tes log-rank & tes Mantel-Haenszel - memberikan bobot yang sama untuk semua titik waktu.

Untuk pertanyaan yang ada. Uji log-rank sebenarnya adalah bentuk uji Mantel-Haenszel yang diterapkan pada data survival. Uji Mantel-Haenszel biasanya digunakan untuk menguji independensi dalam tabel kontingensi bertingkat.

Jika kita mencoba menerapkan uji MH pada data survival, kita dapat mulai dengan mengasumsikan bahwa peristiwa pada setiap waktu kegagalan adalah independen. Kami kemudian dikelompokkan berdasarkan waktu kegagalan. Kami menggunakan metode MH untuk dengan membuat setiap waktu kegagalan strata. Tidak heran mereka sering memberikan hasil yang sama.

Pengecualian terjadi ketika lebih dari satu peristiwa terjadi secara bersamaan - beberapa kematian pada titik waktu yang sama. Saya tidak ingat bagaimana perawatannya berbeda. Saya pikir tes log-rank rata-rata atas kemungkinan urutan waktu kegagalan yang diikat.

Jadi tes log-rank adalah tes MH untuk data kelangsungan hidup dan dapat menangani ikatan. Saya tidak pernah menggunakan tes MH untuk data kelangsungan hidup.

Thylacoleo
sumber
3

Saya pikir saya menemukan situs web dan referensi yang berhubungan persis dengan pertanyaan ini:

http://www.graphpad.com/faq/viewfaq.cfm?faq=1226 Mulai dari "Dua metode yang dibandingkan".

Situs tersebut merujuk pada kertas Berstein yang terhubung (di atas):

http://www.jstor.org/stable/2530564?seq=1

Situs ini merangkum hasil Berstein et al dengan baik, jadi saya akan mengutipnya:

Keduanya biasanya memberikan hasil yang identik (atau hampir identik). Tetapi hasilnya dapat berbeda ketika beberapa subjek mati pada waktu yang sama atau ketika rasio bahaya jauh dari 1.0.

Bernsetin dan rekannya menganalisis data simulasi dengan kedua metode (1). Dalam semua simulasi mereka, asumsi bahaya proporsional benar. Kedua metode tersebut memberikan nilai yang sangat mirip. Metode logrank (yang mereka sebut sebagai metode O / E) melaporkan nilai-nilai yang lebih dekat ke 1,0 daripada Rasio Bahaya sebenarnya, terutama ketika rasio bahaya besar atau ukuran sampel besar.

Ketika ada ikatan, kedua metode tersebut kurang akurat. Metode logrank cenderung melaporkan rasio bahaya yang bahkan lebih dekat ke 1,0 (sehingga rasio bahaya yang dilaporkan terlalu kecil ketika rasio bahaya lebih besar dari 1,0, dan terlalu besar ketika rasio bahaya kurang dari 1,0). Metode Mantel-Haenszel, sebaliknya, melaporkan rasio bahaya yang lebih jauh dari 1,0 (sehingga rasio bahaya yang dilaporkan terlalu besar ketika rasio bahaya lebih besar dari 1,0, dan terlalu kecil ketika rasio bahaya kurang dari 1,0).

Mereka tidak menguji dua metode dengan data yang disimulasikan di mana asumsi bahaya proporsional tidak benar. Saya telah melihat satu set data di mana dua estimasi SDM sangat berbeda (dengan faktor tiga), dan asumsi bahaya proporsional meragukan untuk data tersebut. Tampaknya metode Mantel-Haenszel memberi bobot lebih pada perbedaan dalam bahaya pada titik waktu akhir, sementara metode logrank memberi bobot yang sama di mana-mana (tapi saya belum mengeksplorasi ini secara rinci). Jika Anda melihat nilai SDM yang sangat berbeda dengan kedua metode ini, pikirkan apakah asumsi bahaya proporsional masuk akal. Jika asumsi itu tidak masuk akal, maka tentu saja seluruh konsep rasio bahaya tunggal yang menggambarkan seluruh kurva tidak bermakna

Situs ini juga merujuk pada dataset di mana "dua estimasi SDM sangat berbeda (dengan faktor tiga)", dan menunjukkan bahwa asumsi PH adalah pertimbangan utama.

Lalu saya berpikir, "Siapa yang menulis situs itu?" Setelah sedikit mencari saya menemukan itu Harvey Motulsky. Jadi Harvey, saya sudah berhasil merujuk Anda dalam menjawab pertanyaan Anda sendiri. Anda telah menjadi otoritas!

Apakah "dataset masalah" merupakan dataset yang tersedia untuk umum?

Thylacoleo
sumber
Saya menemukan jawabannya dua hari yang lalu, dan mempostingnya di sini sebagai jawaban baru. Saya juga kemudian memperluas dan memperbarui halaman web di graphpad.com yang Anda temukan. Saya baru saja mengedit halaman itu lagi untuk memasukkan tautan ke file Excel dengan data masalah ( graphpad.com/faq/file/1226.xls ). Saya tidak bisa melakukan itu sampai saya mendapat izin dari orang yang menghasilkan data (dia ingin menjadi anonim, dan data diberi label samar-samar).
Harvey Motulsky