Model bahaya proporsional Cox dan interpretasi koefisien ketika interaksi kasus yang lebih tinggi terlibat

9

Berikut ini adalah ringkasan-output dari Coxph-model I yang digunakan (saya menggunakan R dan output didasarkan pada model akhir terbaik yaitu semua variabel penjelas yang signifikan dan interaksinya dimasukkan):

 coxph(formula = Y ~ LT + Food + Temp2 + LT:Food + LT:Temp2 + 
Food:Temp2 + LT:Food:Temp2) # Y<-Surv(Time,Status==1)

n = 555

               coef         exp(coef)          se(coef)      z           Pr(>|z|)     
LT             9.302e+02      Inf             2.822e+02    3.297        0.000979 *** 
Food           3.397e+03      Inf             1.023e+03    3.321        0.000896 *** 
Temp2          5.016e+03      Inf             1.522e+03    3.296        0.000979 *** 
LT:Food        -2.250e+02    1.950e-98        6.807e+01    -3.305       0.000949 *** 
LT:Temp2       -3.327e+02    3.352e-145       1.013e+02    -3.284       0.001022 ** 
Food:Temp2     -1.212e+03    0.000e+00        3.666e+02    -3.307       0.000942 *** 
LT:Food:Temp2   8.046e+01    8.815e+34        2.442e+01     3.295       0.000986 *** 
--- 
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1 

Rsquare= 0.123   (max possible= 0.858 ) 
Likelihood ratio test= 72.91  on 7 df,   p=3.811e-13 
Wald test            = 55.79  on 7 df,   p=1.042e-09 
Score (logrank) test = 78.57  on 7 df,   p=2.687e-14 

Pertanyaan adalah:

Bagaimana menginterpretasikan nilai koefisien dan exp (koefisien) dalam kasus ini, karena nilai tersebut sangat besar? Juga terlibat interaksi 3 kasus, yang lebih membingungkan interpretasi.

Semua contoh mengenai Coxph-model yang saya temukan sejauh ini di internet sangat sederhana mengenai istilah-istilah interasi (yang selalu berubah menjadi tidak signifikan) dan juga nilai-nilai koefisien (= tingkat bahaya) dan eksponensial dari semua ini (= rasio bahaya) telah cukup kecil dan angka "mudah ditangani", misalnya koefisien = 1,73 -> exp (coef) = 5,64. TAPI milik saya adalah angka yang jauh lebih besar seperti yang Anda lihat dari ringkasan output (di atas). Dan karena mereka adalah vaues yang sangat besar, mereka hampir tidak masuk akal.

Tampaknya agak konyol untuk berpikir bahwa kelangsungan hidup adalah misalnya 8,815e + 34 (rasio bahaya yang diambil dari interaksi LT: Makanan: Temp2) kali lebih rendah ketika interaksi meningkat satu unit (?).

Sebenarnya saya juga tidak tahu bagaimana menafsirkan interaksi 3 kasus ini. Apakah itu berarti bahwa ketika semua variabel dalam interaksi meningkat satu unit, kelangsungan hidup berkurang dengan jumlah tertentu (diberi tahu oleh exp (coef) -nilai)?

Akan lebih bagus jika seseorang dapat membantu saya di sini. :)

Di bawah ini adalah bagian dari lembar data saya yang saya gunakan untuk analisis cox. Di sini Anda dapat melihat, bahwa saya telah menggunakan berkali-kali nilai variabe penjelas yang sama (yaitu LT, Makanan, dan Temp2) untuk beberapa "Waktu, variabel respons Status". Nilai-nilai variabel penjelas ini sudah merupakan nilai rata-rata dari variabel-variabel ini (karena pengaturan kerja lapangan di alam, itu tidak mungkin untuk mendapatkan nilai variabel penjelas individu untuk setiap individu yang diamati respons, maka nilai rata-rata yang digunakan sudah dalam fase ini ), dan ini akan menjawab saran 1 (?) (lihat jawaban pertama).

Saran 2 (lihat jawaban 1): Saya menggunakan R, dan saya belum super dewa di dalamnya. :) Jadi, jika saya menggunakan fungsi predict (cox.model, type = "expected"), saya mendapatkan sejumlah besar nilai yang berbeda dan tidak memiliki petunjuk ke variabel penjelas mana yang mereka maksudkan dan urutannya. Atau mungkinkah menyoroti istilah interaksi tertentu dalam fungsi prediksi? Saya tidak yakin apakah saya membuat diri saya sangat jelas di sini.

Saran 3 (lihat jawaban pertama): di bagian lembar data di bawah ini, orang dapat melihat unit-unit dari berbagai variabel penjelas. Mereka semua berbeda dan termasuk desimal. Bisakah ini ada hubungannya dengan hasil cox?

Bagian dari lembar data:

Time (days)     Status      LT(h) Food (portions per day) Temp2 C)
28                0         14.42        4.46             3.049
22                0         14.42        4.46             3.049
9                 1         14.42        4.46             3.049
24                0         15.33        4.45             2.595
24                0         15.33        4.45             2.595
19                1         15.33        4.45             2.595

Cheers, Unna

Unna
sumber
@ MansT: Bagus Anda telah mengedit pertanyaan ;-)
ocram

Jawaban:

7

Beberapa saran, tidak terkait langsung dengan CoxPH tetapi dengan interaksi dan collinearity

1) Ketika Anda mendapatkan nilai-nilai "gila" seperti ini, satu kemungkinan adalah kolinearitas. Ini sering menjadi masalah ketika Anda berinteraksi. Sudahkah Anda memusatkan semua variabel Anda (dengan mengurangi mean dari masing-masing)?

2) Anda tidak dapat menafsirkan satu interaksi dengan mudah. LT, makanan, dan temp2 semuanya terlibat dalam banyak interaksi. Jadi, lihat nilai prediksi dari kombinasi yang berbeda.

3) Periksa unit dari variabel yang berbeda. Ketika Anda mendapatkan parameter gila, kadang-kadang masalah unit (misalnya mengukur ketinggian manusia dalam milimeter atau kilometer)

4) Setelah Anda menyelesaikan hal-hal itu, saya menemukan cara termudah untuk memikirkan efek dari interaksi yang berbeda (khususnya yang tingkat lebih tinggi) adalah membuat grafik nilai yang diprediksi dengan kombinasi berbeda dari nilai independen.

Peter Flom
sumber
Hei, di bawah ini adalah bagian dari lembar data saya yang saya gunakan untuk analisis cox. Di sini Anda dapat melihat, bahwa saya telah menggunakan berkali-kali nilai variabe penjelas yang sama (yaitu LT, Makanan, dan Temp2) untuk beberapa Waktu, variabel respons Status. Nilai-nilai variabel penjelas ini sudah merupakan nilai rata-rata dari variabel-variabel ini (karena pengaturan kerja lapangan di alam, itu tidak mungkin untuk mendapatkan nilai variabel penjelas individu untuk setiap individu yang diamati respons, maka nilai rata-rata yang digunakan sudah dalam fase ini ), dan ini akan menjawab saran 1 (?).
Unna
Saran 2: Saya menggunakan R, dan saya belum super dewa di dalamnya. :) Jadi, jika saya menggunakan fungsi predict (cox.model, type = "expected"), saya mendapatkan sejumlah besar nilai yang berbeda dan tidak memiliki petunjuk ke variabel penjelas mana yang mereka maksudkan dan urutannya. Atau mungkinkah menyoroti istilah interaksi tertentu dalam fungsi prediksi? Saya tidak yakin apakah saya membuat diri saya sangat jelas di sini.
Unna
Saran 3: di bagian lembar data di bawah ini, orang dapat melihat unit dari variabel penjelas yang berbeda. Mereka semua berbeda dan termasuk desimal. Bisakah ini ada hubungannya dengan hasil cox?
Unna
Waktu (hari) Status LT (h) Makanan (bagian per hari) Temp2 (ºC) 28 0 14.42 4.46 3.049 22 0 14.42 4.46 3.049 9 1 14.42 4.46 3.049 24 0 15.33 4.45 2.595 24 0 15.33 4.45 2.595 19 1 15.33 4.45 2.595
Unna
Di atas komentar tentang contoh lembar data yang saya gunakan tidak muncul dalam bentuk tabel, tapi saya harap mungkin untuk masuk akal. :)
Unna