Jenis regresi mana yang digunakan, dengan mempertimbangkan satu variabel dengan batas atas?

9

Saya tidak yakin metode mana yang digunakan untuk memodelkan hubungan antara dua variabel ( dan y ) dalam percobaan yang dijelaskan sebagai berikut:xy

  • Ada 3 variabel: , x dan y .xaimxy
  • Nilai diatur saat mengoperasikan percobaan. Namun, x dan x a i m tidak selalu sama.xaimxxaim
  • Koefisien korelasi Pearson antara dan x adalah sekitar 0,9.xaimx
  • Koefisien korelasi Pearson antara dan y jauh lebih sedikit: sekitar 0,5.xy
  • memiliki nilai maksimum yang mungkin ( y m a x ) yang tidak dapat dilampaui.yymax
  • Setiap titik data diperoleh setelah pengaturan dan membaca x dan y .xaimxy

Meskipun koefisien korelasi Pearson antara dan y tidak besar, sepertinya y cenderung meningkat dengan x .xyyx

Setelah melakukan regresi linier sederhana dan x = g ( y ) (dan mengonversi yang terakhir sebagai g - 1 , sehingga ditampilkan pada grafik yang sama dengan f misalnya), kedua lereng positif, tetapi kemiringan g - 1 lebih besar dari pada f .y=f(x)x=g(y)g1fg1f

Apakah masuk akal untuk mengatakan atau x m a x = g ( y m a x ) ? ( x m a x akan dicapai lebih awal dalam kasus kedua.)xmax=f1(ymax)xmax=g(ymax)xmax

Menimbang bahwa terikat oleh y m a x , apa yang dapat dikatakan tentang nilai maksimum yang mungkin dari x yang bisa dicapai?yymaxx

Sejauh yang saya mengerti, masuk akal untuk melakukan regresi linier dari bentuk ketika x adalah variabel independen dan y adalah variabel dependen. Namun, dalam konteks ini, saya tidak yakin apakah masuk akal untuk mempertimbangkan bahwa x independen dan y tergantung.y=f(x)xyxy

Apakah total regresi kuadrat terkecil lebih tepat? Apakah ada metode lain untuk menentukan nilai dari dapat dicapai (dan dengan yang kemungkinan)?xmax

(Jika ini penting, dan y tampaknya tidak mengikuti distribusi normal, karena lebih banyak upaya telah dilakukan untuk mencoba mencapai nilai x yang lebih tinggi .)xyx

Bruno
sumber
Apa yang akan Anda lakukan dengan hubungan ini, jika Anda akan menemukannya? Apakah Anda akan menguji hipotesis, atau hanya tertarik dengan tampilannya? Jika ada banyak titik data, Anda harus mempertimbangkan model non-linear.
mpiktas
@mpiktas, pada akhirnya, saya ingin tahu x_max mana yang merupakan target wajar yang dapat saya coba jangkau secara teratur (tidak hanya sekali), mengingat bahwa menjangkau atau melampaui y_max membuat eksperimen batal (efektif menyiratkan x = x_min untuk usaha itu).
Bruno
xyxaimxxaimxyxaimymaxxaim, itu pertimbangan penting.
Whuber

Jawaban:

4

yxxyyxrxy=1.0yxxmax=f1(ymax)

Mengenai masalah variabel terikat, biasanya dapat dibayangkan bahwa jumlah 'nyata' bisa lebih tinggi, tetapi Anda tidak bisa mengukurnya. Misalnya, termometer luar di luar jendela saya mencapai 120, tetapi bisa saja 140 di luar di beberapa tempat, dan Anda hanya akan memiliki 120 sebagai pengukuran Anda. Dengan demikian, variabel akan memiliki batas atas, tetapi hal yang Anda benar-benar ingin pikirkan tidak. Jika ini masalahnya, model-model tobit hanya ada untuk situasi seperti itu.

Pendekatan lain adalah menggunakan sesuatu yang lebih kuat seperti loess, yang mungkin cukup memadai untuk kebutuhan Anda.

gung - Pasang kembali Monica
sumber
Mohon maaf atas keterlambatan ini, saya tidak memperhatikan jawaban Anda. Saya perlu membaca tentang model Tobit.
Bruno
Tidak masalah. Untuk lebih lanjut tentang sifat regresi (vs regresi mundur) lihat di sini . Untuk bantuan w / menerapkan regresi tobit menggunakan berbagai perangkat lunak coba di sini .
gung - Reinstate Monica
3

xmax=f1(ymax)xmax

xy

Jika memungkinkan, lihat residu dan lihat apakah Anda dapat memerasnya. Mungkin ada variabel lain yang Anda lupa; atau mungkin membantu untuk mengubah variabel Anda.

Raja
sumber