Menghitung Interval Prediksi

9

Saya memiliki data berikut yang terletak di sini . Saya mencoba menghitung interval kepercayaan 95% pada kemurnian rata-rata ketika persentase hidrokarbon adalah 1,0. Di R, saya masukkan yang berikut ini.

> predict(purity.lm, newdata=list(hydro=1.0), interval="confidence", level=.95)
   fit      lwr      upr
1 89.66431 87.51017 91.81845

Namun, bagaimana saya bisa mendapatkan hasil ini sendiri? Saya mencoba menggunakan persamaan berikut.

snew=s2(1+1N+(xnew-x¯)2(xsaya-x¯)2)

Dan saya memasukkan yang berikut ini di R.

> SSE_line = sum((purity - (77.863 + 11.801*hydro))^2)
> MSE = SSE_line/18
> t.quantiles <- qt(c(.025, .975), 18)
> prediction = B0 + B1*1
> SE_predict = sqrt(MSE)*sqrt(1+1/20+(mean(hydro)-1)^2/sum((hydro - mean(hydro))^2))
> prediction + SE_predict*t.quantiles
[1] 81.80716 97.52146

Hasil saya berbeda dari fungsi prediksi R. Apa kesalahpahaman saya tentang interval prediksi?

idealistikz
sumber
Bagaimana Anda menghitung MSE dalam kode Anda?
Saya menambahkan perhitungan ke pos.
idealistikz
1
seperti yang disarankan MMJ, Anda harus mencobapredict(purity.lm, newdata=list(hydro=1.0), interval="prediction", level=.95)
vinux

Jawaban:

16

predict.lmKode Anda menghitung interval kepercayaan untuk nilai yang dipasang. Perhitungan tangan Anda menghitung interval prediksi untuk data baru. Jika Anda ingin mendapatkan hasil yang sama dari predict.lmyang Anda dapatkan dari perhitungan tangan lalu ubah interval="confidence"ke interval="prediction"

MMJ
sumber
1

Jawaban bagus dari dpel. Saya ingin menambahkan bahwa perbedaan antara interval kepercayaan dan interval prediksi dapat dinyatakan seperti di bawah ini:

Interval kepercayaan

snew=s2(1N+(xnew-x¯)2(xsaya-x¯)2)

snew=s2(1+1N+(xnew-x¯)2(xsaya-x¯)2)

Sumber Lihat halaman slide 5/17 dan 11/17

lklklk
sumber