Anggaplah saya memiliki -vektor dari variabel dependen, dan -vektor dari variabel independen. Ketika diplot terhadap , saya melihat bahwa ada hubungan linear (tren naik) di antara keduanya. Sekarang, ini juga berarti bahwa ada tren penurunan linear antara dan .Y N X Y 1NYNXY YX1XYX
Sekarang, jika saya menjalankan regresi:
dan dapatkan nilai yang pasY = β XY=β∗X+ϵY^=β^X
Lalu saya menjalankan regresi: dan mendapatkan nilai yang pas ~ Y = α 1Y=α∗1X+ϵY~=α^1X
Akankah dua nilai yang diprediksi, dan kira-kira sama?~ YY^Y~
Ketika Y diplot terhadap , saya melihat bahwa ada hubungan linear (tren naik) di antara keduanya. Sekarang, ini juga berarti bahwa ada tren turun linear antara Y dan X1X
Kalimat terakhir salah: ada tren menurun, tetapi tidak berarti linear:
Saya menggunakan sebagai fungsi ditambah sedikit kebisingan di . Seperti yang Anda lihat, ketika memplot terhadap menghasilkan perilaku linier, terhadap jauh dari linear.f(x)=1xYY1XYX
(@whuber menunjukkan bahwa plot terhadap tidak terlihat homoseksual. Saya pikir tampaknya memiliki varians yang lebih tinggi untuk rendah karena kerapatan huruf yang jauh lebih tinggi mengarah ke rentang yang lebih besar yang pada dasarnya adalah apa yang kami mengartikannya. Sebenarnya, data tersebut adalah homoseks: Saya biasa menghasilkan data, jadi tidak ada ketergantungan pada ukuran )Y1XYY = 1 / X + rnorm (length (X), sd = 0.1)X
Jadi secara umum hubungannya sangat non-linear. Yaitu, kecuali rentang sangat sempit sehingga Anda dapat memperkirakanIni sebuah contoh:Xd1xdx=−1x2≈const.
Intinya:
Secara umum, sangat sulit untuk memperkirakan fungsi tipe < dengan fungsi linear atau polinomial. Dan tanpa istilah offset Anda tidak akan pernah mendapatkan perkiraan yang masuk akal.1X
Jika interval cukup sempit untuk memungkinkan perkiraan linier, Anda tidak akan dapat dari data untuk menebak hubungannya harus dan bukan linear ( ).X1XX
Anda mulai dengan asumsi yang tidak valid: OP tidak pernah menyatakan dan terkait linier. Satu-satunya pernyataan adalah bahwa dan tampaknya terkait linier (dengan kemiringan negatif). Itu, tentu saja, menunjukkan bahwa dan yang nonlinearly terkait. Saya pikir ini adalah penyimpangan yang sangat besar dari pertanyaan yang diajukan sehingga sisa posting Anda mungkin hanya akan menyesatkan pembaca. YXY1/XYX
whuber
2
@whuber: Saya benar-benar minta maaf tetapi tampaknya cukup padat sekarang. Pertanyaan mengatakan: "Ketika Y diplot terhadap 1 / X, saya melihat bahwa ada hubungan linier (tren naik)". Itulah yang saya coba gambarkan dalam gambar 1 dan 3: Y lebih dari 1 / X meningkat secara linear. Saya kemudian merencanakan Y yang sesuai X (nonlinier, menurun). Di mana saya salah mengerti OP?
cbeleites tidak senang dengan SX
1
Y1/X
Terima kasih atas pengamatan pada homoseksualitas. Dengan mengubah variabel independen, Anda tidak mengubah homoseksualitas respons - tetapi penampilannya tentu saja dapat berubah, seperti yang Anda tunjukkan, yang berguna untuk diketahui. (Kami telah melihat fenomena ini di beberapa pos lain, di mana orang salah mengartikan heteroskedastisitas menjadi sekadar perbedaan dalam populasi kelompok, misalnya.)
whuber
Jawaban dan komentar yang sangat menyeluruh! Terima kasih @cbeleites dan @whuber!
Mayou
2
Saya melihat tidak ada alasan bagi mereka untuk menjadi "kira-kira sama" secara umum - tetapi apa sebenarnya yang Anda maksud dengan kira-kira sama?
Berikut ini contoh mainan:
library(ggplot2)
n <- 10^3
df <- data.frame(x=runif(n, min=1, max=2))
df$y <- 5 / df$x + rnorm(n)
p <- (ggplot(df, aes(x=x, y=y)) +
geom_point() +
geom_smooth(method="lm", formula=y ~ 0 + x) + # Blue, OP's y hat
geom_smooth(method="lm", formula=y ~ 0 + I(x^-1), color="red")) # Red, OP's y tilde
p
Gambar:
Model "biru" akan jauh lebih baik jika diizinkan untuk memiliki istilah intersep (yaitu konstan) ...
Sulit untuk mengatakan apa yang Anda lakukan dengan model biru, tetapi tentu saja tidak seperti yang dijelaskan OP! Yang merah jauh lebih dekat dengan situasi yang disajikan dalam pertanyaan.
Saya melihat tidak ada alasan bagi mereka untuk menjadi "kira-kira sama" secara umum - tetapi apa sebenarnya yang Anda maksud dengan kira-kira sama?
Berikut ini contoh mainan:
Gambar:
Model "biru" akan jauh lebih baik jika diizinkan untuk memiliki istilah intersep (yaitu konstan) ...
sumber