Oke jadi hanya sedikit kabur pada beberapa hal, bantuan apa pun akan sangat dihargai. Ini adalah pemahaman saya bahwa model regresi linier diprediksi melalui ekspektasi kondisional
- Apakah kita berasumsi bahwa dan adalah variabel acak dengan beberapa distribusi probabilitas yang tidak diketahui? itu pemahaman saya bahwa hanya residu dan estimasi koefisien beta adalah variabel acak. jika demikian, sebagai contoh, jika obesitas dan usia, jika kita mengambil ekspektasi bersyarat berarti, berapa nilai yang diharapkan dari obesitas jika individu tersebut berusia di seluruh sampel, apakah kita akan ambil saja rata-rata (rata-rata aritmatika) y untuk pengamatan di mana ? namun bukankah nilai yang diharapkan mensyaratkan bahwa kita harus mengalikannya dengan probabilitas yang terjadi? tetapi bagaimana dalam arti untuk kita menemukan probabilitasY Y = X = E ( Y | X = 35 ) 35 X = 35 Xvariabel -value terjadi jika itu mewakili sesuatu seperti usia?
- Jika mewakili sesuatu seperti nilai tukar, apakah ini akan diklasifikasikan sebagai acak? bagaimana Anda bisa menemukan nilai yang diharapkan ini tanpa mengetahui probabilitasnya? atau apakah nilai yang diharapkan sama dengan rata-rata dalam batas.
- Jika kita tidak menganggap variabel dependen itu sendiri adalah variabel acak, karena kita tidak menentang probabilitas, apa yang kita asumsikan sebagai variabel itu? hanya memperbaiki nilai atau sesuatu? tetapi jika ini masalahnya, bagaimana kita bisa mengkondisikan pada variabel non-acak untuk memulai? apa yang kita asumsikan tentang distribusi variabel independen?
Maaf jika ada yang tidak masuk akal atau jelas bagi siapa pun.
regression
William Carulli
sumber
sumber
Jawaban:
Dalam model probabilitas yang mendasari regresi linier, X dan Y adalah variabel acak.
Tepat sekali. Secara umum, Anda tidak dapat berharap bahwa Anda akan memiliki data yang cukup pada setiap nilai X tertentu, atau mungkin mustahil untuk melakukannya jika X dapat mengambil rentang nilai yang kontinu. Tetapi secara konseptual, ini benar.
Ini adalah perbedaan antara ekspektasi tanpa syarat dan ekspektasi bersyarat . Hubungan di antara mereka adalahE [ Y ∣ X = x ]E[Y] E[Y∣X=x]
yang merupakan hukum harapan total.
Secara umum Anda tidak dalam regresi linier. Karena kita berusaha menentukan , kita tidak perlu tahu .P r [ X = x ]E[Y∣X] Pr[X=x]
Kami tidak menganggap bahwa Y adalah variabel acak. Salah satu cara untuk berpikir tentang regresi linier adalah sebagai model probabilitas untukY
Yang mengatakan bahwa, begitu Anda mengetahui nilai X, variasi acak dalam Y terbatas pada ringkasan .N(0,σ)
sumber
Akan ada BANYAK jawaban untuk pertanyaan ini, tetapi saya masih ingin menambahkannya karena Anda membuat beberapa poin menarik. Untuk kesederhanaan, saya hanya mempertimbangkan model linier sederhana.
Persamaan mendasar dari yang sederhana linier analisis regresi adalah: makna Persamaan ini adalah bahwa nilai rata-rata adalah linear pada nilai-nilai . Orang juga dapat melihat bahwa nilai yang diharapkan juga linier pada parameter dan , itulah sebabnya model ini disebut linear. Persamaan mendasar ini dapat ditulis ulang sebagai: mana adalah variabel acak dengan nol rata-rata:
Variabel independen dapat acak atau tetap. Variabel dependen SELALU acak.X Y
Biasanya orang mengasumsikan bahwa adalah angka tetap. Ini karena analisis regresi dikembangkan dan sangat diterapkan dalam konteks percobaan yang dirancang, di mana nilai sebelumnya ditetapkan.{X1,...,Xn} X
Rumus untuk estimasi kuadrat terkecil dari dan adalah sama bahkan jika diasumsikan acak, tetapi distribusi estimasi ini umumnya tidak akan sama dibandingkan dengan situasi dengan tetap .β0 β1 X X
Dalam model linier sederhana, Anda dapat membuat taksiran dari berdasarkan pada estimasi dan , yaitu: rata-rata kuadrat bersyarat memiliki ekspresi yang sama dengan yang Anda gambarkan jika model Anda memperlakukan bobot yang berbeda sebagai tingkat faktor tunggal. Model-model tersebut juga dikenal sebagai ANOVA satu arah, yang merupakan kasus khusus model linear (tidak sederhana).E(Y|X=x) β 0 β 1 φ (x)= β 0+ β 1xφ^(x) E(Y|X=x) β^0 β^1
sumber