Bahasa untuk menggambarkan model regresi, seperti regresi linier sangat sederhana yang ditentukan di atas sering bervariasi dan variasi tersebut sering membawa pergeseran makna yang halus. Misalnya, bagian model di sisi kiri persamaan dapat disebut (antara lain saya tidak tahu) dengan konotasi dan denotasi dalam tanda kurung:
- Variabel dependen (petunjuk pada ketergantungan kausal)
- Variabel terprediksi (menyiratkan model perkiraan / membuat prediksi)
- Variabel respons (menyiratkan hubungan sebab akibat, atau setidaknya urutan sementara)
- Variabel hasil (menyiratkan hubungan sebab akibat)
Variasi dalam nomenklatur juga berlaku di sisi kanan persamaan (penafian yang sama bahwa saya bodoh tentang istilah lain):
- Variabel independen (menyiratkan prioritas kausal, petunjuk pada desain eksperimental)
- Variabel prediktor (menyiratkan prakiraan, menyiratkan bahwa variabel memiliki taksiran parameter nol yang terkait dengannya)
Dalam rangka mengajukan skrining, atau mengkomunikasikan penelitian, saya berkesempatan tidak hanya dipanggil untuk penggunaan satu istilah atau lainnya, tetapi kemudian dipanggil dengan istilah yang saya pilih untuk menggantikannya. Sementara orang-orang yang menelepon tentu saja bertele-tele (NB: Saya seorang pedant profesional, jadi saya bersimpati), karena tentu saja kita semua mengerti apa yang dikomunikasikan , saya masih bertanya-tanya:
Adakah istilah yang biasa digunakan untuk variabel kiri dan kanan dalam model regresi yang agnostik sehubungan dengan (a) penggunaan eksternal model, (b) hubungan sebab akibat antara variabel, dan (c) aspek penelitian desain yang digunakan untuk menghasilkan variabel sendiri?
NB: Saya tidak bertanya tentang masalah penting pemodelan yang tepat dan interpretasi yang tepat (yaitu saya sangat peduli tentang hubungan sebab akibat, desain studi, dll.), Tetapi saya lebih tertarik pada bahasa untuk berbicara tentang model seperti itu secara umum.
(Saya menyadari bahwa "variabel kiri" dan "variabel kanan" mungkin, saya kira, ditafsirkan sebagai jawaban yang kredibel, tetapi istilah ini tampaknya kikuk ... mungkin ini adalah pertanyaan kikuk. :)
sumber
Jawaban:
Ini adalah pertanyaan yang sangat bagus. Sebenarnya, itu sangat bagus sehingga tidak ada jawaban untuk itu. Sepengetahuan saya, tidak ada istilah "agnostik" untuk menggambarkan Y.
Dalam pengalaman dan bacaan saya, saya menemukan bahwa semantik adalah spesifik-domain dan juga model-objektif-spesifik.
Ahli ekonometrika akan menggunakan istilah variabel Dependent ketika membangun model yang jelas. Mereka dapat menggunakan istilah Predicted atau Fitted atau Estimated variable ketika mereka membangun model peramalan yang lebih fokus pada estimasi / prediksi akurat daripada pada kekuatan penjelas teoretis.
Kerumunan Big Data / Deep Learning menggunakan bahasa yang sama sekali berbeda. Dan, mereka biasanya akan menggunakan istilah Variabel respons atau variabel Target. Model mereka adalah kotak hitam sedemikian rupa sehingga mereka biasanya tidak berusaha menjelaskan suatu fenomena melainkan memprediksi dan memperkirakannya secara akurat. Tapi, entah bagaimana mereka tidak akan tertangkap menggunakan istilah Predicted. Mereka jauh lebih suka istilah Respon atau Target.
Saya kurang akrab dengan istilah variabel Hasil. Ini mungkin lazim di daerah lain saya kurang terkena seperti ilmu sosial termasuk psikologi, kedokteran, uji klinis, epidemiologi.
Mengingat hal di atas, saya tidak bisa memberi Anda semantik "agnostik" untuk menggambarkan Y. Sebaliknya, saya memberikan sedikit informasi tentang semantik apa yang akan digunakan ketika melayani audiens yang berbeda dan juga mencerminkan tujuan model Anda. Singkatnya, saya tidak berpikir ada orang yang terluka jika Anda berbicara tentang variabel Dependent dengan econometricians dan Response atau variabel Target dengan tipe Deep Learning. Mudah-mudahan, Anda dapat memisahkan kerumunan itu terpisah jika tidak, Anda bisa memiliki perkelahian makanan verbal di tangan Anda.
sumber