Saya menjalankan regresi berbasis GAM menggunakan gamls paket R dan mengasumsikan distribusi beta data nol. Saya hanya memiliki variabel penjelas tunggal dalam model saya, jadi pada dasarnya: mymodel = gamlss(response ~ input, family=BEZI)
.
Algoritme memberi saya koefisien untuk dampak variabel penjelas ke dalam mean ( ) dan nilai-p terkait untuk , sesuatu seperti:
Mu link function: logit
Mu Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -2.58051 0.03766 -68.521 0.000e+00
input -0.09134 0.01683 -5.428 6.118e-08
Seperti yang Anda lihat pada contoh di atas, hipotesis ditolak dengan keyakinan tinggi.
Saya kemudian menjalankan model nol: null = gamlss(response ~ 1, family=BEZI)
dan membandingkan kemungkinan menggunakan uji rasio kemungkinan:
p=1-pchisq(-2*(logLik(null)[1]-logLik(mymodel)[1]), df(mymodel)-df(null)).
Dalam sejumlah kasus, saya mendapatkan bahkan ketika koefisien pada input dilaporkan sangat signifikan (seperti di atas). Saya menemukan ini sangat tidak biasa - setidaknya itu tidak pernah terjadi dalam pengalaman saya dengan regresi linier atau logistik (pada kenyataannya, ini juga tidak pernah terjadi ketika saya menggunakan gamma yang disesuaikan dengan gamls).
Pertanyaan saya adalah: apakah saya masih bisa mempercayai ketergantungan antara respons dan input saat ini?