Mencoba mempelajari beberapa Python dan Sklearn, tetapi untuk pekerjaan saya, saya perlu menjalankan regresi yang menggunakan distribusi kesalahan dari keluarga Poisson, Gamma, dan terutama Tweedie.
Saya tidak melihat apa pun dalam dokumentasi tentang mereka, tetapi mereka berada di beberapa bagian dari distribusi R, jadi saya bertanya-tanya apakah ada yang melihat implementasi di mana saja untuk Python. Akan sangat keren jika Anda bisa mengarahkan saya ke implementasi SGD dari distribusi Tweedie!
Jawaban:
Ada gerakan untuk menerapkan model linier umum dengan distribusi kesalahan Poisson, gamma, dan Tweedie di scikit-learn.
Statsmodels memiliki implementasi model linear umum dengan distribusi Poisson, Tweedie, dan gamma error.
Sementara saya memperbarui jawaban ini, Spark ML juga (secara eksperimen) mendukung distribusi Poisson, Tweedie, dan gamma.
sumber
H2O memiliki Generalized Linear Model s.
Mereka menggunakan H2O Frames, jadi Anda tidak dapat menggunakan Pandas / Numpy secara langsung.
sumber