Regresi melalui asal

9

Kami memiliki poin-poin berikut: Bagaimana kita dapat menemukan garis pemasangan terbaik melalui titik-titik? Kalkulator saya memiliki opsi untuk menemukan jalur pemasangan terbaik melalui titik-titik ini, yaitu:

(0,0)(1,51.8)(1.9,101.3)(2.8,148.4)(3.7,201.5)(4.7,251.1)(5.6,302.3)(6.6,350.9)(7.5,397.1)(8.5,452.5)(9.3,496.3)
y=axy=ax+b

y=53.28x+0.37

Bagaimana saya bisa menemukan fitting ? Sepertinya saya kita tidak bisa hanya menghapus tanpa kompensasi di ?y=ax0.37a

Edward Harrison
sumber
2
Apakah ada alasan mengapa Anda menginginkannya? Menekan intersep mengarah ke model bias kecuali jika intersep tepat nol ke tempat desimal tak terbatas. Meski begitu, Anda tidak mendapatkan banyak efisiensi.
gung - Reinstate Monica
1
Ini adalah hasil percobaan fisika. Jika memiliki intersepsi y, itu akan menyebabkan hal-hal yang benar-benar salah.
EdwardHarrison
@ung Apakah itu berarti kita hanya menghapus ? 0,37
EdwardHarrison
5
"Menekan intersep" tidak berarti hanya menghapus perkiraan dari model Anda, itu berarti menyesuaikan model melalui formula berbeda yang memaksa garis untuk melewati titik asal.
gung - Reinstate Monica
6
"Eksperimen fisika. [...] mencegat [...] akan mengarah pada hal yang benar-benar salah." Tetapi jika data eksperimental menunjukkan intersep (btw, Anda dapat memeriksa apakah interval kepercayaan untuk garis mencakup asal), ini akan membuat saya berpikir sangat keras dari mana intersep itu berasal. Saya ahli kimia analitik. Dalam kimia analitik, kami juga memiliki banyak hubungan yang harus linier tanpa intersep. Tetapi mereka hampir tidak pernah dalam praktek, karena rincian instrumen dan pengukuran yang rumit. Jadi, kita biasanya melihat menekan intersepsi sebagai ide yang sangat buruk.
cbeleites tidak senang dengan SX

Jawaban:

13

The Ordinary Least Squares memperkirakan lereng ketika mencegat ditekan adalah:

β^=saya=1Nxsayaysayasaya=1Nxsaya2
gung - Pasang kembali Monica
sumber
10

@gung telah memberikan estimasi OLS. Itu yang kamu cari.

Namun, ketika berhadapan dengan jumlah fisik di mana garis harus melalui titik asal, skala kesalahan umum bervariasi dengan nilai-x (memiliki, secara relatif, kesalahan relatif konstan ). Dalam situasi itu, kuadrat terkecil tanpa bobot biasa tidak pantas.

Dalam situasi itu, satu pendekatan (dari beberapa kemungkinan) akan mengambil log, kurangi x dari y dan estimasi log-slope (dari variabel asli) dengan rata-rata perbedaan.

Atau, kuadrat terkecil tertimbang dapat digunakan. Dalam kasus kesalahan relatif konstan, itu akan mengurangi menggunakan estimatorβ^=1Nsaya=1Nysayaxsaya (rata-rata semua lereng melalui titik asal).

Ada beberapa pendekatan lain (misalnya GLM), tetapi jika Anda melakukannya dengan kalkulator, saya akan cenderung pada saran pertama saya.

Anda juga harus mempertimbangkan kesesuaian asumsi yang Anda buat.


Saya pikir mungkin instruktif untuk menambahkan derivasi garis WLS melalui titik asal dan kemudian "rata-rata lereng" dan usus OLS adalah kasus khusus:

Modelnya adalah ysaya=βxsaya+εsaya, dimana Var(εsaya)=wsayaσ2

Kami ingin meminimalkan S=sayawsaya(ysaya-βxsaya)2

Sβ=-saya2xsaya.wsaya(ysaya-βxsaya)

Pengaturan sama dengan nol untuk mendapatkan solusi LS β^ kami memperoleh wsayaxsayaysaya=β^wsayaxsaya2, atau β^=wsayaxsayaysayawsayaxsaya2.

Kapan wsaya1 untuk semua saya, ini menghasilkan solusi OLS gung.

Kapan wsaya1/xsaya2 (yang optimal untuk kasus di mana penyebaran meningkat dengan rata-rata), ini menghasilkan solusi "rata-rata lereng" di atas.

Glen_b -Reinstate Monica
sumber