Apa hubungan antara fungsi dan regresi linier?

9

Pertimbangkan fungsinya

r(x)=E(YX=x)

Ini telah disebut fungsi regresi dalam buku teks yang saya gunakan. Saya mencoba mencari tahu hubungan antara fungsi ini dan model regresi linier klasik.

Jadi, saya tahu bahwa itu adalah teorema * yang dapat kita tulis

Y=r(X)+ϵ

untuk beberapa variabel acak st .ϵE(ϵ)=0

Sekarang anggaplah kita punya

Y=β0+β1X+ϵ

Ini adalah fungsi regresi 1 dimensi klasik (dengan asumsi dan meminimalkan jumlah residu kuadrat).β0β1

Pertanyaan: Apakah kemudian teorema matematika bahwa jika didefinisikan seperti di atas, ituY

r(X)=E(YX)=(β0+β1X)?

Dan apakah ini sebabnya fungsi disebut "fungsi regresi"?E(YX)

EDIT: Teorema yang saya gunakan adalah sebagai berikut (dari Semua Statistik hal. 89):

Model regresi terkadang ditulis sebagai

Y=r(X)+ϵ

di mana . Kami selalu dapat menulis ulang model regresi dengan cara ini. Untuk melihat ini, tentukan dan karenanya . Selain itu, .E(ϵ)=0ϵ=Yr(X)Y=Y+r(X)r(X)=r(X)+ϵE(ϵ)=EE(ϵX)=E(E(Yr(X))X)=E(E(YX)r(X))=E(r(X)r(X))=0

George
sumber
1
Hubungannya adalah bahwa model regresi linier persis dengan klaim bahwa adalah fungsi linier dari beberapa X yang diamati. Secara alami, klaim ini tidak perlu benar, meskipun sebagai perkiraan untuk itu bisa lebih baik atau lebih buruk. Bab 'Ekonometrika Paling Tidak Berbahaya' yang disebut 'Membuat regresi masuk akal' adalah diskusi yang baik. rr
conjugateprior
Atau apakah saya melewatkan apa yang Anda minta?
conjugateprior
Periksa jawaban terkait: stats.stackexchange.com/questions/173660/…
Tim

Jawaban:

9

Merangkum pertanyaan:

Diberikan , apakah ini kemudian merupakan teorema matematika yang ?Y=β0+β1X+εr(X)=E(YX)=(β0+β1X)

Ya, berdasarkan sifat dasar dari harapan:

E(YX)=E(β0+β1X+ε)=E(β0)+E(β1X)+E(ε)(linearity of expectation)=β0+β1X+0(Noting that X is constant herebecause we conditioned on it.)=β0+β1X

Alasan historis untuk regresi yang disebut regresi berkaitan dengan Galton memperhatikan efek " regresi terhadap rata-rata " - awalnya dalam percobaan pada tanaman yang melibatkan ukuran benih keturunan dibandingkan dengan ukuran benih orang tua. Suatu hubungan melalui ukuran benih rata-rata pada kedua variabel akan memiliki kemiringan kurang dari (kemiringan mana yang dapat diperkirakan dengan apa yang kita sebut regresi linier). Semakin kecil kemiringan semakin kuat efek "regresi". Masalah ini diilustrasikan oleh Galton dalam pdf yang ditautkan oleh ketinggian anak-anak (sebagai orang dewasa) dibandingkan dengan tinggi rata-rata orang tua (perempuan ditingkatkan oleh faktor konstan untuk membuat mereka sebanding dengan laki-laki). Diagram pada halaman ketiga hingga kelima menunjukkan sesuatu dari apa yang diamati.18%

Jadi upaya untuk memperkirakan ukuran "regresi terhadap rata-rata" ini diperoleh dengan apa yang kemudian disebut regresi linier. Tentu saja tidak ada yang istimewa yang terjadi - regresi terhadap nilai rata-rata bukanlah suatu "dorongan ke mediokritas" biologis khusus seperti yang semula dapat ditebak, tetapi konsekuensi yang cukup sederhana dari matematika dari situasi pada dasarnya dalam arti yang sama dengan korelasi. selalu antara dan .11

Glen_b -Reinstate Monica
sumber
Saya telah mengganti penggunaan \ qquad Anda yang kasar dengan penggunaan "align" yang benar di MathJax, ditambah beberapa detail MathJax lainnya, dan saya menunggu ulasan dari hasil edit.
Michael Hardy
@Michael Saya sadar menyelaraskan dan telah menggunakannya berkali-kali - tetapi apa manfaat sebenarnya dalam pengeditan dalam kasus ini? Saya ingin itu dibiarkan sejajar daripada di tengah untuk meninggalkan ruang untuk komentar berada pada satu baris dan saya ingin komentar tidak berada dalam teks berat yang MahJax tinggalkan untuk Anda, lebih memilih teks ringan dari markup biasa. Hasil sekarang adalah sesuatu yang tidak lagi sesuai dengan penampilan yang sebenarnya saya cari. Alih-alih menjadi "kasar" itu sengaja dipilih. Jika Anda memiliki cara yang mencapai apa yang saya inginkan dengan sedikit usaha daripada yang saya butuhkan, saya semua telinga.
Glen_b -Reinstate Monica
ok, saya rasa tidak semua selera sesuai satu sama lain
Michael Hardy
Penampilan yang dirancang seperti itu ideal, saya pikir, untuk artikel dan buku tetapi tidak selalu mencerminkan apa yang menurut saya terbaik di forum seperti ini, setidaknya tidak selalu. Saya mengenali selera saya pada masalah ini (dan banyak aspek lain dari penampilan situs yang sering saya coba selesaikan) mungkin berbeda dari norma, jadi saya akan membiarkannya seperti apa adanya, tetapi saya tidak berjanji untuk mencoba terus cobalah untuk menyelaraskan untuk melakukan apa yang saya inginkan ketika tampaknya lebih mudah melakukannya dengan cara lain.
Glen_b -Reinstate Monica
Apakah teorema pergi ke arah lain juga? Yaitu, mengingat dan , dapatkah kita selalu menyimpulkan bahwa untuk koefisien regresi? Jika tidak, bagaimana kondisi saat kita bisa dan tidak bisa mengatakan ini? XYE(YX)=(β0+β1X)+ϵβ0,β1
George