Prediksi titik dan CI berbeda.
Untuk prediksi poin, kita lebih baik dengan mengoreksi bias sebanyak mungkin. Untuk CI, yang diperlukan dari awal adalah bahwa probabilitasnya sama dengan . Ketika [ a , b ] adalah 95% CI untuk ln ( y 0 ) misalnya, [ e a , e b ] tentu saja CI 95% untuk y 0 karena P ( a ≤ ln X ≤ b ) = P (100(1−α)%[a,b]ln(y0)[ea,eb]y0 . Jadi [ e 7.1563 , e 7.2175 ] Anda tentu merupakan CI yang valid.P(a≤lnX≤b)=P(ea≤X≤eb)[e7.1563,e7.2175]
Tapi pusat CI ini bukanlah naif prediktor (exp [prediktor ]) maupun prediktor dikoreksi y 0 (koreksi kali faktor prediktor naif) karena ketidaksetaraan Jensen, tetapi tidak terlalu penting. Dalam beberapa kasus (tidak selalu), Anda mungkin dapat mengubah CI menjadi [ e a - p , e b - q ] untuk beberapa p dan q sehingga probabilitasnya masih 95% dan pusatnya adalah prediktor yang dikoreksi bias. , tapi saya tidak mengerti maksudnya.lny0y0[ea−p,eb−q]pq
Apa yang disarankan, yaitu, bukan 95% CI. Untuk melihat mengapa, biarkan faktor koreksi menjadi h (nonrandom dan sempurna dikenal, untuk kesederhanaan), sehingga prediktor bias-dikoreksi adalah h e θ , dimana θ adalah prediktor berisi dari ln y 0 ( β 0 + β 2 ln x 2 + β 3 x[es2/2ea,es2/2eb]hheθθlny0 dalam contoh Anda). Ini " h " dapat diperkirakan dengan e s 2 / 2 misalnya, tapi sementara yang kedua adalah acak, h diasumsikan nonrandom untuk membuatnya sederhana. Misalkan [ a , b ] menjadi CI 95% untuk ln y 0 , yaitu P ( a ≤ ln y 0 ≤ b ) = 0,95 . Kemudian,
P ( h e a ≤ y 0 ≤ h e b )β^0+β^2lnx2+β^3x3hes2/2h[a,b]lny0P(a≤lny0≤b)=0.95
yangtidaksama dengan P ( a ≤ ln y 0 ≤ b ) = 0,95 kecuali distribusi ln y 0 seragam, yang biasanya tidak.
P(hea≤y0≤heb)=P(lnh+a≤lny0≤lnh+b),
P(a≤lny0≤b)=0.95lny0
EDIT
Di atas adalah tentang CI dari , bukan dari E ( y | X = x 0 ) . Pertanyaan aslinya adalah tentang CI untuk E ( y | X = x 0 ) . Mari E ( y | X = x 0 ) = h exp ( x 0 β ) , yang diperkirakan oleh h exp ( x 0 β )y0E(y|X=x0)E(y|X=x0)E(y|X=x0)=hexp(x0β)h^exp(x0β^). Dalam hal ini, saya pikir metode Delta adalah opsi yang berguna (lihat jawaban luchonacho).
Untuk menjadi ketat, kita membutuhkan distribusi gabungan dari h dan β , atau tepatnya, distribusi asimtotik dari vektor √h^β^. Kemudian batas distribusi √n−−√[(β^−β)′,h^−h]′berasal menggunakan metode Delta dan kemudian CI untukhexp(x0β)dapat dibangun.n−−√[h^exp(x0β^)−hexp(x0β)]hexp(x0β)
(dengan asumsi estimasi Anda konsisten)
Sumber dan detail lainnya dalam dokumen yang ditautkan.
sumber