Regresi dengan variabel independen terbalik

10

Anggaplah saya memiliki -vektor dari variabel dependen, dan -vektor dari variabel independen. Ketika diplot terhadap , saya melihat bahwa ada hubungan linear (tren naik) di antara keduanya. Sekarang, ini juga berarti bahwa ada tren penurunan linear antara dan .Y N X Y 1NYNXY YX1XYX

Sekarang, jika saya menjalankan regresi: dan dapatkan nilai yang pasY = β XY=βX+ϵY^=β^X

Lalu saya menjalankan regresi: dan mendapatkan nilai yang pas ~ Y = α 1Y=α1X+ϵY~=α^1X

Akankah dua nilai yang diprediksi, dan kira-kira sama? ~ YY^Y~

Mayou
sumber

Jawaban:

10

 Ketika Y diplot terhadap , saya melihat bahwa ada hubungan linear (tren naik) di antara keduanya. Sekarang, ini juga berarti bahwa ada tren turun linear antara Y dan X1X

Kalimat terakhir salah: ada tren menurun, tetapi tidak berarti linear: Y ~ 1 / X Y ~ X

Saya menggunakan sebagai fungsi ditambah sedikit kebisingan di . Seperti yang Anda lihat, ketika memplot terhadap menghasilkan perilaku linier, terhadap jauh dari linear.f(x)=1xYY1XYX

(@whuber menunjukkan bahwa plot terhadap tidak terlihat homoseksual. Saya pikir tampaknya memiliki varians yang lebih tinggi untuk rendah karena kerapatan huruf yang jauh lebih tinggi mengarah ke rentang yang lebih besar yang pada dasarnya adalah apa yang kami mengartikannya. Sebenarnya, data tersebut adalah homoseks: Saya biasa menghasilkan data, jadi tidak ada ketergantungan pada ukuran )Y1XYY = 1 / X + rnorm (length (X), sd = 0.1)X

Jadi secara umum hubungannya sangat non-linear. Yaitu, kecuali rentang sangat sempit sehingga Anda dapat memperkirakanIni sebuah contoh:Xd1xdx=1x2const.

Y ~ 1 / X Y ~ X

Intinya:

  • Secara umum, sangat sulit untuk memperkirakan fungsi tipe < dengan fungsi linear atau polinomial. Dan tanpa istilah offset Anda tidak akan pernah mendapatkan perkiraan yang masuk akal.1X
  • Jika interval cukup sempit untuk memungkinkan perkiraan linier, Anda tidak akan dapat dari data untuk menebak hubungannya harus dan bukan linear ( ).X1XX
cbeleites tidak senang dengan SX
sumber
Anda mulai dengan asumsi yang tidak valid: OP tidak pernah menyatakan dan terkait linier. Satu-satunya pernyataan adalah bahwa dan tampaknya terkait linier (dengan kemiringan negatif). Itu, tentu saja, menunjukkan bahwa dan yang nonlinearly terkait. Saya pikir ini adalah penyimpangan yang sangat besar dari pertanyaan yang diajukan sehingga sisa posting Anda mungkin hanya akan menyesatkan pembaca. YXY1/XYX
whuber
2
@whuber: Saya benar-benar minta maaf tetapi tampaknya cukup padat sekarang. Pertanyaan mengatakan: "Ketika Y diplot terhadap 1 / X, saya melihat bahwa ada hubungan linier (tren naik)". Itulah yang saya coba gambarkan dalam gambar 1 dan 3: Y lebih dari 1 / X meningkat secara linear. Saya kemudian merencanakan Y yang sesuai X (nonlinier, menurun). Di mana saya salah mengerti OP?
cbeleites tidak senang dengan SX
1
Y1/X
Terima kasih atas pengamatan pada homoseksualitas. Dengan mengubah variabel independen, Anda tidak mengubah homoseksualitas respons - tetapi penampilannya tentu saja dapat berubah, seperti yang Anda tunjukkan, yang berguna untuk diketahui. (Kami telah melihat fenomena ini di beberapa pos lain, di mana orang salah mengartikan heteroskedastisitas menjadi sekadar perbedaan dalam populasi kelompok, misalnya.)
whuber
Jawaban dan komentar yang sangat menyeluruh! Terima kasih @cbeleites dan @whuber!
Mayou
2

Saya melihat tidak ada alasan bagi mereka untuk menjadi "kira-kira sama" secara umum - tetapi apa sebenarnya yang Anda maksud dengan kira-kira sama?

Berikut ini contoh mainan:

library(ggplot2)
n <- 10^3
df <- data.frame(x=runif(n, min=1, max=2))
df$y <- 5 / df$x + rnorm(n)
p <- (ggplot(df, aes(x=x, y=y)) +
      geom_point() +
      geom_smooth(method="lm", formula=y ~ 0 + x) +  # Blue, OP's y hat
      geom_smooth(method="lm", formula=y ~ 0 + I(x^-1), color="red"))  # Red, OP's y tilde
p

Gambar:

Saya akan mengatakan ini jauh dari "kurang lebih sama"

Model "biru" akan jauh lebih baik jika diizinkan untuk memiliki istilah intersep (yaitu konstan) ...

Adrian
sumber
Sulit untuk mengatakan apa yang Anda lakukan dengan model biru, tetapi tentu saja tidak seperti yang dijelaskan OP! Yang merah jauh lebih dekat dengan situasi yang disajikan dalam pertanyaan.
whuber
Y1/XYXY1/X