Pemahaman saya adalah bahwa bahkan regresi tidak memberikan hubungan sebab akibat. Itu hanya dapat memberikan hubungan antara variabel y dan variabel x dan mungkin arah. Apakah saya benar? Saya sering menemukan frasa yang mirip dengan "x prediksi y" bahkan di sebagian besar buku pelajaran dan pada berbagai halaman kursus online. Dan Anda sering menyebut para regressor sebagai prediktor dan y sebagai respons.
- Seberapa adil menggunakannya untuk regresi linier?
- Bagaimana dengan regresi logistik? (jika saya memiliki t ambang batas dengan mana saya dapat membandingkan probabilitas?)
Jawaban:
Tidak ada masalah dengan menggunakan kata "prediksi".
Penting untuk mengetahui bahwa prediksi tidak terkait dengan kausalitas. Pertimbangkan kasus di mana sebagian besar orang yang meninggal di ruang gawat darurat rumah sakit meninggal karena serangan jantung. Jika Anda mendengar bahwa seorang pasien meninggal, tetapi tidak tahu penyebabnya, Anda dapat memperkirakan bahwa itu mungkin karena serangan jantung, karena Anda tahu bahwa serangan jantung bertanggung jawab atas> 50%. Anda membuat prediksi, tetapi Anda memprediksi penyebab yang tidak diketahui dari efek yang diketahui. Juga, prediksi dalam contoh ini adalah kategoris, sehingga analog dengan regresi logistik. (Analogi ini mungkin lebih kuat untuk regresi logistik multinomial , tetapi itu tidak masalah di sini.)
Untuk apa nilainya, prediksi tidak harus terkait dengan hubungan sebab akibat langsung sama sekali. Anda dapat membuat prediksi berdasarkan korelasi palsu, asalkan hubungannya dapat diandalkan. Pertimbangkan memprediksi ketinggian kembar identik yang tidak diketahui berdasarkan saudara kembarnya. Dalam hal ini, kedua ketinggian adalah efek dari serangkaian penyebab umum (genetika dan lingkungan bersama). Ketinggian dari kedua kembar adalah sebab atau akibat dari yang lain. Meskipun demikian, Anda dapat membuat prediksi yang sangat baik dalam situasi ini.
sumber