Alat Analisis Kelangsungan Hidup dalam Python [ditutup]
46
Saya bertanya-tanya apakah ada paket untuk python yang mampu melakukan analisis survival. Saya telah menggunakan paket survival dalam R tetapi ingin memport pekerjaan saya ke python.
Sangat diragukan bahwa pengembang Python untuk analisis survival telah melakukan upaya di dekat apa yang Terry Therneau dan lainnya telah masukkan ke dalam paket survival R dalam 30 tahun terakhir, termasuk pengujian ekstensif. Paket survival menjalani prosedur pengujian paling ketat yang pernah saya lihat dalam statistik.
Frank Harrell
2
Sepakat. survivalPaket R berada di bawah pengawasan ketat oleh komunitas besar.
Marc Claesen
RPy (2 sekarang) sangat menyakitkan untuk diinstal dalam pengalaman saya.
Zhubarb
Jawaban:
21
AFAIK, tidak ada paket analisis kelangsungan hidup dengan python. Seperti komentar mbq di atas, satu-satunya rute yang tersedia adalah Rpy .
Bahkan jika ada paket python murni yang tersedia, saya akan sangat berhati-hati dalam menggunakannya, khususnya saya akan melihat:
Seberapa sering diperbarui?
Apakah ini memiliki basis pengguna yang besar?
Apakah ada teknik yang canggih?
Salah satu manfaat R, adalah bahwa paket standar ini mendapatkan sejumlah besar pengujian dan umpan balik pengguna. Saat berurusan dengan data nyata, kasing tepi yang tidak terduga dapat masuk.
(+1) Nama yang cukup pintar untuk paket bertahan hidup.
Marc Claesen
8
python-asurv adalah upaya untuk port perangkat lunak asurv untuk metode bertahan hidup dalam astronomi. Mungkin patut diawasi, tetapi cgillespie benar tentang hal-hal yang harus diperhatikan: ia masih memiliki jalan panjang dan pengembangan tampaknya tidak aktif. (AFAICT hanya ada satu metode dan bahkan selesai, paket mungkin kurang untuk, katakanlah, biostatisticians.)
Anda mungkin lebih baik menggunakan paket survival dalam R dari Python melalui sesuatu seperti RPy atau PypeR . Saya tidak punya masalah melakukan ini sendiri.
PyIMSL berisi beberapa rutinitas untuk analisis survival. Ini Gratis Sebagai Dalam Bir untuk penggunaan nonkomersial, didukung penuh sebaliknya. Dari dokumentasi di Panduan Pengguna Statistik ...
Menghitung estimasi Kaplan-Meier untuk kemungkinan bertahan hidup: kaplanMeierEstimates ()
Menganalisa data survival dan reliabilitas menggunakan model hazard proporsional Cox: propHazardsGenLin ()
Menganalisa data survival menggunakan model linier umum: survivalGlm ()
Diperkirakan menggunakan berbagai mode parametrik: survivalEstimates ()
Memperkirakan fungsi bahaya keandalan menggunakan pendekatan nonparametric: nonparamHazardRate ()
Menghasilkan populasi dan tabel kehidupan kelompok: lifeTables ()
Bisakah Anda memberi contohnya? Saya penasaran untuk mencobanya!
user603
Saya percaya Anda merujuk ke antarmuka sihir R (yang menggunakan rpy2). Saya juga ingin melihat contoh cepat. (Ini adalah pemahaman saya bahwa model bertahan hidup belum sepenuhnya tersedia di statsmodels .)
chl
Saya tidak terlalu yakin tentang statsmodels, tetapi Anda bisa mendapatkan notebook dari github dengan contoh ekstensi C, Octave, dan R. Anda perlu menjalankan Notebook untuk menggunakannya secara jelas, tetapi saya yakin Anda dapat menggunakan kode yang sama di antarmuka apa pun.
Carl Smith
3
@ user603 Ini adalah demo sederhana: nbviewer.ipython.org/4383682 ; ini bergantung pada iPython yang cukup baru, saya percaya.
shabbychef
2
Saya juga ingin menyebutkan scikit-survival , yang menyediakan model untuk analisis survival yang dapat dengan mudah dikombinasikan dengan alat-alat dari scikit-learn (mis. KFold cross-validation).
Pada tulisan ini, scikit-survival meliputi implementasi dari
Penduga fungsi bahaya kumulatif Nelson-Aalen.
Penduga fungsi fungsi survival Kaplan-Meier.
Model hazard proporsional Cox dengan dan tanpa penalti bersih elastis.
scikit-survival sangat baik untuk tugas terkait prediksi waktu-ke-acara!
Cam.Davidson.Pilon
1
Selain menggunakan Rmelalui RPyatau setara ada sejumlah rutinitas analisis kelangsungan hidup di perpustakaan python statsmodels (sebelumnya sicpy.statsmodel). Mereka berada dalam paket "kotak pasir", artinya mereka tidak seharusnya siap untuk produksi sekarang.
Misalnya Anda memiliki model Cox dari kode hazard proporsional di sini .
survival
Paket R berada di bawah pengawasan ketat oleh komunitas besar.Jawaban:
AFAIK, tidak ada paket analisis kelangsungan hidup dengan python. Seperti komentar mbq di atas, satu-satunya rute yang tersedia adalah Rpy .
Bahkan jika ada paket python murni yang tersedia, saya akan sangat berhati-hati dalam menggunakannya, khususnya saya akan melihat:
Salah satu manfaat R, adalah bahwa paket standar ini mendapatkan sejumlah besar pengujian dan umpan balik pengguna. Saat berurusan dengan data nyata, kasing tepi yang tidak terduga dapat masuk.
sumber
Lihat proyek garis hidup for untuk implementasi sederhana dan bersih dari model survival dengan Python, termasuk
Manfaat:
Dokumentasi tersedia di sini: dokumentasi dan contoh
Contoh penggunaan:
Contoh plot dari pustaka plot bawaan:
sumber
python-asurv adalah upaya untuk port perangkat lunak asurv untuk metode bertahan hidup dalam astronomi. Mungkin patut diawasi, tetapi cgillespie benar tentang hal-hal yang harus diperhatikan: ia masih memiliki jalan panjang dan pengembangan tampaknya tidak aktif. (AFAICT hanya ada satu metode dan bahkan selesai, paket mungkin kurang untuk, katakanlah, biostatisticians.)
Anda mungkin lebih baik menggunakan paket survival dalam R dari Python melalui sesuatu seperti RPy atau PypeR . Saya tidak punya masalah melakukan ini sendiri.
sumber
PyIMSL berisi beberapa rutinitas untuk analisis survival. Ini Gratis Sebagai Dalam Bir untuk penggunaan nonkomersial, didukung penuh sebaliknya. Dari dokumentasi di Panduan Pengguna Statistik ...
Menghitung estimasi Kaplan-Meier untuk kemungkinan bertahan hidup: kaplanMeierEstimates ()
Menganalisa data survival dan reliabilitas menggunakan model hazard proporsional Cox: propHazardsGenLin ()
Menganalisa data survival menggunakan model linier umum: survivalGlm ()
Diperkirakan menggunakan berbagai mode parametrik: survivalEstimates ()
Memperkirakan fungsi bahaya keandalan menggunakan pendekatan nonparametric: nonparamHazardRate ()
Menghasilkan populasi dan tabel kehidupan kelompok: lifeTables ()
sumber
Anda sekarang dapat menggunakan R dari dalam IPython , jadi Anda mungkin ingin melihat menggunakan IPython dengan ekstensi R.
sumber
rpy2
). Saya juga ingin melihat contoh cepat. (Ini adalah pemahaman saya bahwa model bertahan hidup belum sepenuhnya tersedia di statsmodels .)Saya juga ingin menyebutkan scikit-survival , yang menyediakan model untuk analisis survival yang dapat dengan mudah dikombinasikan dengan alat-alat dari scikit-learn (mis. KFold cross-validation).
Pada tulisan ini, scikit-survival meliputi implementasi dari
sumber
Selain menggunakan
R
melaluiRPy
atau setara ada sejumlah rutinitas analisis kelangsungan hidup di perpustakaan python statsmodels (sebelumnyasicpy.statsmodel
). Mereka berada dalam paket "kotak pasir", artinya mereka tidak seharusnya siap untuk produksi sekarang.Misalnya Anda memiliki model Cox dari kode hazard proporsional di sini .
sumber