Nomenklatur sisi kiri & kanan dalam model regresi

9

y=β0+β1x1+ε0

Bahasa untuk menggambarkan model regresi, seperti regresi linier sangat sederhana yang ditentukan di atas sering bervariasi dan variasi tersebut sering membawa pergeseran makna yang halus. Misalnya, bagian model di sisi kiri persamaan dapat disebut (antara lain saya tidak tahu) dengan konotasi dan denotasi dalam tanda kurung:

  • Variabel dependen (petunjuk pada ketergantungan kausal)
  • Variabel terprediksi (menyiratkan model perkiraan / membuat prediksi)
  • Variabel respons (menyiratkan hubungan sebab akibat, atau setidaknya urutan sementara)
  • Variabel hasil (menyiratkan hubungan sebab akibat)

Variasi dalam nomenklatur juga berlaku di sisi kanan persamaan (penafian yang sama bahwa saya bodoh tentang istilah lain):

  • Variabel independen (menyiratkan prioritas kausal, petunjuk pada desain eksperimental)
  • Variabel prediktor (menyiratkan prakiraan, menyiratkan bahwa variabel memiliki taksiran parameter nol yang terkait dengannya)

Dalam rangka mengajukan skrining, atau mengkomunikasikan penelitian, saya berkesempatan tidak hanya dipanggil untuk penggunaan satu istilah atau lainnya, tetapi kemudian dipanggil dengan istilah yang saya pilih untuk menggantikannya. Sementara orang-orang yang menelepon tentu saja bertele-tele (NB: Saya seorang pedant profesional, jadi saya bersimpati), karena tentu saja kita semua mengerti apa yang dikomunikasikan , saya masih bertanya-tanya:

Adakah istilah yang biasa digunakan untuk variabel kiri dan kanan dalam model regresi yang agnostik sehubungan dengan (a) penggunaan eksternal model, (b) hubungan sebab akibat antara variabel, dan (c) aspek penelitian desain yang digunakan untuk menghasilkan variabel sendiri?

NB: Saya tidak bertanya tentang masalah penting pemodelan yang tepat dan interpretasi yang tepat (yaitu saya sangat peduli tentang hubungan sebab akibat, desain studi, dll.), Tetapi saya lebih tertarik pada bahasa untuk berbicara tentang model seperti itu secara umum.

(Saya menyadari bahwa "variabel kiri" dan "variabel kanan" mungkin, saya kira, ditafsirkan sebagai jawaban yang kredibel, tetapi istilah ini tampaknya kikuk ... mungkin ini adalah pertanyaan kikuk. :)

Alexis
sumber
Seharusnya tidak ada kebingungan tentang ini.
Carl
1
Saya pikir jawaban singkatnya adalah tidak. Ini untuk alasan yang bagus menurut saya. Dalam contoh formal, bahasa yang digunakan untuk mengidentifikasi variabel harus cukup bernuansa untuk menyiratkan interpretasi yang dibedakan dalam model / domain aplikasi yang dimaksudkan (yaitu sangat penting untuk mengetahui apakah kausalitas tersirat dalam model regresi atau tidak dan penggunaan tata nama yang tepat akan membantu. dengan ini).
Zachary Blumenfeld
2
@ZacharyBlumenfeld (a) Jangan menjawab dalam komentar. :) (b) Namun, kita berbicara tentang "regresi" itu sendiri secara umum, tanpa bantuan untuk mempelajari desain, domain pengetahuan disiplin, dll. (mis. banyak orang berbicara dan menulis tentang estimator kuadrat terkecil tanpa menggunakan desain studi, kausalitas , dll.). Jika kita memiliki bahasa aplikasi-agnostik untuk menggambarkan kelas yang luas dari upaya statistik, mengapa tidak ada bahasa agnostik yang serupa untuk komponen-komponen dari upaya seperti itu?
Alexis
1
Tidak yakin apakah ini layak dianggap sebagai jawaban, jadi saya mempostingnya sebagai komentar: Mungkin ada beberapa terminologi yang berasal dari proyeksi (seperti adalah proyeksi dari ke ruang )? Seperti proyektor dan projectand (saya membuat ini sekarang karena saya tidak ingat istilah yang relevan). Terminologi itu harus bebas dari (a), (b), dan (c) Anda. X(XX)1XyyX
Richard Hardy
1
@ Kenji Saya setuju dengan sepenuh hati dengan sebagian besar perspektif Anda. Namun, saya tidak setuju bahwa seseorang hanya dapat / seharusnya berbicara tentang persamaan regresi dalam kasus yang diterapkan: kita harus memiliki bahasa yang dapat berbicara tentang variabel kiri dan kanan dari semua model regresi, misalnya, ketika memeriksa penerapan metode tersebut pada tingkat meta lintas disiplin ilmu.
Alexis

Jawaban:

6

Ini adalah pertanyaan yang sangat bagus. Sebenarnya, itu sangat bagus sehingga tidak ada jawaban untuk itu. Sepengetahuan saya, tidak ada istilah "agnostik" untuk menggambarkan Y.

Dalam pengalaman dan bacaan saya, saya menemukan bahwa semantik adalah spesifik-domain dan juga model-objektif-spesifik.

Ahli ekonometrika akan menggunakan istilah variabel Dependent ketika membangun model yang jelas. Mereka dapat menggunakan istilah Predicted atau Fitted atau Estimated variable ketika mereka membangun model peramalan yang lebih fokus pada estimasi / prediksi akurat daripada pada kekuatan penjelas teoretis.

Kerumunan Big Data / Deep Learning menggunakan bahasa yang sama sekali berbeda. Dan, mereka biasanya akan menggunakan istilah Variabel respons atau variabel Target. Model mereka adalah kotak hitam sedemikian rupa sehingga mereka biasanya tidak berusaha menjelaskan suatu fenomena melainkan memprediksi dan memperkirakannya secara akurat. Tapi, entah bagaimana mereka tidak akan tertangkap menggunakan istilah Predicted. Mereka jauh lebih suka istilah Respon atau Target.

Saya kurang akrab dengan istilah variabel Hasil. Ini mungkin lazim di daerah lain saya kurang terkena seperti ilmu sosial termasuk psikologi, kedokteran, uji klinis, epidemiologi.

Mengingat hal di atas, saya tidak bisa memberi Anda semantik "agnostik" untuk menggambarkan Y. Sebaliknya, saya memberikan sedikit informasi tentang semantik apa yang akan digunakan ketika melayani audiens yang berbeda dan juga mencerminkan tujuan model Anda. Singkatnya, saya tidak berpikir ada orang yang terluka jika Anda berbicara tentang variabel Dependent dengan econometricians dan Response atau variabel Target dengan tipe Deep Learning. Mudah-mudahan, Anda dapat memisahkan kerumunan itu terpisah jika tidak, Anda bisa memiliki perkelahian makanan verbal di tangan Anda.

Sympa
sumber
Saya berharap saya bisa memberi Anda suara tambahan untuk "pertarungan makanan verbal": D
Alexis