Saya sedang belajar tentang Regresi Logistik. Tapi saya terjebak dalam menghitung intersep ( ) dan koefisien ( ). Saya sudah mencarinya melalui internet, tetapi hanya mendapatkan tutorial menggunakan Microsoft Excel atau fungsi bawaan di R. Saya mendengarnya bisa diselesaikan dengan Kemungkinan Maksimum, tapi saya tidak mengerti bagaimana menggunakannya, karena saya tidak tidak memiliki latar belakang statistik. Adakah yang bisa memberi saya penjelasan dan simulasi singkat untuk menghitung koefisien secara manual?
regression
machine-learning
logistic
maximum-likelihood
Kadek Dwi Budi Utama
sumber
sumber
Jawaban:
Sayangnya, tidak seperti regresi linier, tidak ada rumus sederhana untuk estimasi kemungkinan maksimum regresi logistik. Anda harus melakukan beberapa jenis algoritma optimasi, seperti gradient descent atau kuadrat terkecil yang berulang secara berulang .
sumber
Saya ingin mengusulkan metode saya dan berharap ini membantu.
Untuk menghitung koefisien secara manual, Anda harus memiliki beberapa data, atau mengatakan kendala. Dalam regresi logistik, sebenarnya itu adalah bagaimana fungsi logistik didefinisikan melalui entropi maksimum dan pengganda lagrange, batasan ini harus dipenuhi dengan dua lainnya:Ehalfj=Ehal^fj . Artinya, harapan model harus sesuai dengan harapan yang diamati , yang telah diilustrasikan dalam makalah ini . Itu sebabnya fungsi logit sebagai fungsi tautan dalam regresi logistik juga disebut fungsi rata-rata.
Ambil contoh, tab silang di bawah ini menunjukkan berapa banyak pria / wanita di kelas kehormatan.
Seperti disebutkan di atas∑sayaysayaxsaya j=∑sayahalsayaxsaya j memegang. Sisi kiri (LHS) adalah harapan dari pengamatan (y dalam sampel) dan sisi kanan (RHS) adalah harapan model.
Dengan asumsi fungsinya adalahl o g(hal1 - hal) =β0+β1xsaya atau setara p =11 +e- (β0+β1∗xsaya) (xsaya mewakili fitur pengamatan menjadi perempuan, itu adalah 1 jika pengamatan adalah perempuan dan 0 sebaliknya), jelas kita tahu bahwa dua persamaan berikut memegang masing-masing ketika X= 1 dan kapan X= 0 dengan data yang ditunjukkan di atas:
Jadi mencegat (β0 ) adalah -1,47 dan koefisien (β1 ) adalah 0,593. Anda bisa mendapatkannya secara manual.
Sepanjang baris yang sama, Anda dapat secara manual menghitung koefisien model regresi logistik lainnya (ini berlaku juga untuk regresi softmax tetapi di luar ruang lingkup pertanyaan ini) jika cukup data diberikan.
Saya harap saya benar, jika tidak tolong beri tahu saya. Terima kasih.
sumber