Saya memiliki data berikut yang terletak di sini . Saya mencoba menghitung interval kepercayaan 95% pada kemurnian rata-rata ketika persentase hidrokarbon adalah 1,0. Di R, saya masukkan yang berikut ini.
> predict(purity.lm, newdata=list(hydro=1.0), interval="confidence", level=.95)
fit lwr upr
1 89.66431 87.51017 91.81845
Namun, bagaimana saya bisa mendapatkan hasil ini sendiri? Saya mencoba menggunakan persamaan berikut.
Dan saya memasukkan yang berikut ini di R.
> SSE_line = sum((purity - (77.863 + 11.801*hydro))^2)
> MSE = SSE_line/18
> t.quantiles <- qt(c(.025, .975), 18)
> prediction = B0 + B1*1
> SE_predict = sqrt(MSE)*sqrt(1+1/20+(mean(hydro)-1)^2/sum((hydro - mean(hydro))^2))
> prediction + SE_predict*t.quantiles
[1] 81.80716 97.52146
Hasil saya berbeda dari fungsi prediksi R. Apa kesalahpahaman saya tentang interval prediksi?
r
regression
confidence-interval
prediction-interval
idealistikz
sumber
sumber
predict(purity.lm, newdata=list(hydro=1.0), interval="prediction", level=.95)
Jawaban:
predict.lm
Kode Anda menghitung interval kepercayaan untuk nilai yang dipasang. Perhitungan tangan Anda menghitung interval prediksi untuk data baru. Jika Anda ingin mendapatkan hasil yang sama daripredict.lm
yang Anda dapatkan dari perhitungan tangan lalu ubahinterval="confidence"
keinterval="prediction"
sumber
Jawaban bagus dari dpel. Saya ingin menambahkan bahwa perbedaan antara interval kepercayaan dan interval prediksi dapat dinyatakan seperti di bawah ini:
Interval kepercayaansn e w= s2( 1N+ ( xn e w- x¯)2∑ ( xsaya- x¯)2)-------------------√
Sumber Lihat halaman slide 5/17 dan 11/17
sumber