Saya tidak yakin metode mana yang digunakan untuk memodelkan hubungan antara dua variabel ( dan y ) dalam percobaan yang dijelaskan sebagai berikut:
- Ada 3 variabel: , x dan y .
- Nilai diatur saat mengoperasikan percobaan. Namun, x dan x a i m tidak selalu sama.
- Koefisien korelasi Pearson antara dan x adalah sekitar 0,9.
- Koefisien korelasi Pearson antara dan y jauh lebih sedikit: sekitar 0,5.
- memiliki nilai maksimum yang mungkin ( y m a x ) yang tidak dapat dilampaui.
- Setiap titik data diperoleh setelah pengaturan dan membaca x dan y .
Meskipun koefisien korelasi Pearson antara dan y tidak besar, sepertinya y cenderung meningkat dengan x .
Setelah melakukan regresi linier sederhana dan x = g ( y ) (dan mengonversi yang terakhir sebagai g - 1 , sehingga ditampilkan pada grafik yang sama dengan f misalnya), kedua lereng positif, tetapi kemiringan g - 1 lebih besar dari pada f .
Apakah masuk akal untuk mengatakan atau x m a x = g ( y m a x ) ? ( x m a x akan dicapai lebih awal dalam kasus kedua.)
Menimbang bahwa terikat oleh y m a x , apa yang dapat dikatakan tentang nilai maksimum yang mungkin dari x yang bisa dicapai?
Sejauh yang saya mengerti, masuk akal untuk melakukan regresi linier dari bentuk ketika x adalah variabel independen dan y adalah variabel dependen. Namun, dalam konteks ini, saya tidak yakin apakah masuk akal untuk mempertimbangkan bahwa x independen dan y tergantung.
Apakah total regresi kuadrat terkecil lebih tepat? Apakah ada metode lain untuk menentukan nilai dari dapat dicapai (dan dengan yang kemungkinan)?
(Jika ini penting, dan y tampaknya tidak mengikuti distribusi normal, karena lebih banyak upaya telah dilakukan untuk mencoba mencapai nilai x yang lebih tinggi .)
sumber
Jawaban:
Mengenai masalah variabel terikat, biasanya dapat dibayangkan bahwa jumlah 'nyata' bisa lebih tinggi, tetapi Anda tidak bisa mengukurnya. Misalnya, termometer luar di luar jendela saya mencapai 120, tetapi bisa saja 140 di luar di beberapa tempat, dan Anda hanya akan memiliki 120 sebagai pengukuran Anda. Dengan demikian, variabel akan memiliki batas atas, tetapi hal yang Anda benar-benar ingin pikirkan tidak. Jika ini masalahnya, model-model tobit hanya ada untuk situasi seperti itu.
Pendekatan lain adalah menggunakan sesuatu yang lebih kuat seperti loess, yang mungkin cukup memadai untuk kebutuhan Anda.
sumber
Jika memungkinkan, lihat residu dan lihat apakah Anda dapat memerasnya. Mungkin ada variabel lain yang Anda lupa; atau mungkin membantu untuk mengubah variabel Anda.
sumber