Saya mencoba memahami asal-usul bentuk pita kepercayaan melengkung yang terkait dengan regresi linier OLS dan bagaimana hubungannya dengan interval kepercayaan parameter regresi (kemiringan dan intersep), misalnya (menggunakan R):
require(visreg)
fit <- lm(Ozone ~ Solar.R,data=airquality)
visreg(fit)
Tampak bahwa pita terkait dengan batas garis yang dihitung dengan intersep 2,5%, dan kemiringan 97,5%, serta dengan intersep 97,5%, dan kemiringan 2,5% (meskipun tidak cukup):
xnew <- seq(0,400)
int <- confint(fit)
lines(xnew, (int[1,2]+int[2,1]*xnew))
lines(xnew, (int[1,1]+int[2,2]*xnew))
Yang tidak saya mengerti adalah dua hal:
- Bagaimana dengan kombinasi kemiringan 2.5% & 2.5% intersep serta kemiringan 97.5% dan 97.5% intersep? Ini memberikan garis yang jelas di luar band yang diplot di atas. Mungkin saya tidak mengerti arti dari interval kepercayaan, tetapi jika dalam 95% kasus perkiraan saya berada dalam interval kepercayaan, ini sepertinya hasil yang mungkin?
- Apa yang menentukan jarak minimum antara batas atas dan bawah (yaitu dekat dengan titik di mana dua garis yang ditambahkan di atas memotong)?
Saya kira kedua pertanyaan muncul karena saya tidak tahu / mengerti bagaimana sebenarnya band-band ini dihitung.
Bagaimana saya bisa menghitung batas atas dan bawah menggunakan interval kepercayaan dari parameter regresi (tanpa bergantung pada predict () atau fungsi serupa, yaitu dengan tangan)? Saya mencoba menguraikan fungsi predict.lm di R, tetapi pengodeannya berada di luar jangkauan saya. Saya akan menghargai petunjuk apa pun terhadap literatur atau penjelasan yang relevan yang cocok untuk pemula yang statistik.
Terima kasih.
Jawaban:
sumber
Pertanyaan yang bagus Sangat penting untuk memahami konsep-konsep ini dan mereka tidak langsung.
Ketika kami menggabungkan semua interval kepercayaan, untuk setiap kemungkinan x, itu memberi kami pita abu-abu yang Anda lihat di output.
Apa artinya ini secara fungsional adalah bahwa kami 95% yakin bahwa garis regresi sebenarnya terletak di suatu tempat di zona abu-abu itu.
Karena band kepercayaan dihitung menggunakan interval kepercayaan 95% untuk setiap poin individu, itu sangat erat terkait dengan 95% CI untuk intersep. Bahkan, pada x = 0 tepi zona abu-abu akan bertepatan persis dengan 95% CI untuk intersep, karena itulah cara kami membuat pita kepercayaan. Itu sebabnya garis yang Anda tambahkan di atas menyentuh tepi pita abu-abu ke kiri.
Namun, kemiringannya sedikit berbeda. Itu berkontribusi pada batas, seperti yang Anda lihat di atas, tetapi kemiringan dan intersep tidak dapat dipisahkan dalam regresi linier. Jadi, Anda tidak dapat benar-benar mengatakan "baik bagaimana jika intersep berada pada batas minimum kisaran CI dan kemiringan juga pada batas minimum?" Baris ini akan menghasilkan poin yang jauh di luar 95% CI kami untuk banyak x. Ini berarti bahwa kami 95% percaya diri yang bukan garis regresi kami yang sebenarnya.
Ada powerpoint yang layak di sini yang dapat membantu Anda memvisualisasikan beberapa hal ini: http://www.stat.duke.edu/~tjl13/s101/slides/unit6lec3H.pdf
sumber