Saya sedang menyelidiki interaksi antara dua variabel ( dan ). Ada banyak korelasi linier antara variabel-variabel ini dengan . Dari sifat masalah saya tidak bisa mengatakan apa-apa tentang penyebabnya (apakah menyebabkan x 2 atau sebaliknya). Saya ingin mempelajari penyimpangan dari garis regresi, untuk mendeteksi outlier. Untuk melakukan ini, saya dapat membangun regresi linier x 1 sebagai fungsi x 2 , atau sebaliknya. Dapatkah pilihan urutan variabel saya memengaruhi hasil saya?
regression
outliers
linear-model
George
sumber
sumber
Jawaban:
Itu pasti bisa (sebenarnya, itu bahkan penting berkenaan dengan asumsi pada data Anda - Anda hanya membuat asumsi tentang distribusi hasil yang diberikan kovariat). Dalam terang ini, Anda mungkin mencari istilah seperti "varians prediksi terbalik". Either way, regresi linier tidak mengatakan apa pun tentang sebab akibat! Paling-paling, Anda dapat mengatakan sesuatu tentang sebab akibat melalui desain yang cermat.
sumber
Untuk membuat kasus simetris, orang dapat mundur perbedaan antara dua variabel ( ) vs nilai rata-rata mereka.Δ x
sumber
Regresi standar meminimalkan jarak vertikal antara titik-titik dan garis, sehingga beralih 2 variabel sekarang akan meminimalkan jarak horizontal (diberi sebar sebaran yang sama). Pilihan lain (yang menggunakan beberapa nama) adalah untuk meminimalkan jarak tegak lurus, ini dapat dilakukan dengan menggunakan komponen utama.
Berikut ini beberapa kode R yang menunjukkan perbedaan:
Untuk mencari pencilan Anda cukup memplot hasil analisis komponen utama.
Anda mungkin juga ingin melihat:
sumber
Variabel x1 dan x2 Anda adalah collinear. Di hadapan multikolinearitas, estimasi parameter Anda masih tidak bias, tetapi variansnya besar, yaitu, kesimpulan Anda tentang pentingnya estimasi parameter tidak valid, dan prediksi Anda akan memiliki interval kepercayaan yang besar.
Interpretasi estimasi parameter juga sulit. Dalam kerangka regresi linier, estimasi parameter pada x1 adalah perubahan Y untuk perubahan unit di x1 mengingat setiap variabel eksogen lainnya dalam model dijaga konstan. Dalam kasus Anda, x1 dan x2 sangat berkorelasi, dan Anda tidak dapat menahan x2 konstan ketika x1 berubah.
sumber