Grafik di bawah ini adalah plot pencar residual dari uji regresi yang asumsi "normalitas", "homoscedasticity", dan "independensi" telah dipenuhi! Untuk menguji asumsi "linearitas" , walaupun, dengan melihat grafik, dapat ditebak bahwa hubungannya adalah curvilinear, tetapi pertanyaannya adalah: Bagaimana nilai "R2 Linear" dapat digunakan untuk menguji asumsi linearitas? Berapa kisaran yang dapat diterima untuk nilai "R2 Linear" untuk memutuskan apakah hubungannya sedang linear? Apa yang harus dilakukan ketika asumsi linearitas tidak terpenuhi dan mentransformasikan IV juga tidak membantu? !!
Inilah tautan ke hasil tes lengkap.
Plot pencar:
Jawaban:
Perhatikan bahwa asumsi linearitas yang Anda bicarakan hanya mengatakan bahwa rata-rata bersyarat diberikan X i adalah fungsi linierYi Xi . Anda tidak dapat menggunakan nilai untuk menguji asumsi ini.R2
Ini karena hanyalah korelasi kuadrat antara nilai yang diamati dan yang diprediksi serta nilai koefisien korelasi tidak secara unik menentukan hubungan antara X dan Y (linier atau lainnya) dan kedua skenario berikut dimungkinkan:R2 X Y
Tinggi tapi asumsi linearitas masih salah dalam cara pentingR2
rendah tetapi asumsi linearitas masih memuaskanR2
Saya akan membahas masing-masing pada gilirannya:
(1) tetapi asumsi linieritas tetap salah dengan cara yang penting:R2 Kuncinya di sini adalah memanipulasi fakta bahwa korelasi sangat sensitif terhadap pencilan . Misalkan Anda memiliki prediktor yang dihasilkan dari distribusi campuran yang normal standar 99 % dari waktu dan massa titik di M yang lain 1 % dan variabel respon yangX1,...,Xn 99% M 1%
Re: Apa yang harus dilakukan ketika asumsi linearitas tidak terpenuhi dan mentransformasikan IV juga tidak membantu? !!
Ketika non-linearitas menjadi masalah, mungkin akan membantu untuk melihat plot residual vs setiap prediktor - jika ada pola yang terlihat, ini dapat menunjukkan non-linearitas pada prediktor tersebut. Misalnya, jika plot ini mengungkapkan hubungan "berbentuk mangkuk" antara residu dan prediktor, ini mungkin menunjukkan istilah kuadratik yang hilang dalam prediktor itu. Pola lain dapat menunjukkan bentuk fungsional yang berbeda. Dalam beberapa kasus, mungkin Anda belum mencoba melakukan transformasi yang benar atau bahwa model yang sebenarnya tidak linier dalam versi variabel yang diubah (meskipun dimungkinkan untuk menemukan perkiraan yang masuk akal).
sumber
sumber