Kapan R kuadrat negatif?

77

Pemahaman saya adalah bahwa tidak dapat negatif karena merupakan persegi R. Namun aku berlari regresi linier sederhana dalam SPSS dengan satu variabel bebas dan variabel terikat. Output SPSS saya memberi saya nilai negatif untuk R 2 . Jika saya menghitung ini dengan tangan dari R maka R 2 akan positif. Apa yang telah dilakukan SPSS untuk menghitung ini sebagai negatif?R2R2R2

R=-.395
R squared =-.156
B (un-standardized)=-1261.611

Kode yang saya gunakan:

DATASET ACTIVATE DataSet1. 
REGRESSION /MISSING LISTWISE /STATISTICS COEFF OUTS R ANOVA 
           /CRITERIA=PIN(.05) POUT(.10) /NOORIGIN 
           /DEPENDENT valueP /METHOD=ENTER ageP

Saya mendapat nilai negatif. Adakah yang bisa menjelaskan apa artinya ini?

Negatif RSquared

masukkan deskripsi gambar di sini

Anne
sumber
3
Apakah ini menjawab pertanyaan Anda? stats.stackexchange.com/questions/6181/… Jika tidak, silakan berikan informasi lebih lanjut: ini adalah "output SPSS" dari prosedur apa?
whuber
2
Apakah model regresi linier Anda memiliki intersep?
NPE
2
@ Anne Sekali lagi, prosedur SPSS mana yang Anda gunakan?
whuber
1
@ Anne Saya sarankan Anda mengabaikan balasan deret waktu, karena data Anda bukan deret waktu dan Anda tidak menggunakan prosedur deret waktu. Apakah Anda benar-benar yakin R kuadrat diberikan sebagai nilai negatif? Besarnya benar: . Saya telah melihat melalui bantuan SPSS untuk melihat apakah mungkin sebagai konvensi nilai R-kuadrat untuk R negatif dinegasikan, tetapi saya tidak melihat bukti bahwa ini adalah masalahnya. Mungkin Anda bisa memposting tangkapan layar output di mana Anda membaca R-squared? (-0,395)2=0,156
whuber
1
Variabel dependen adalah harga rumah sehingga layak bahwa CI 95% mungkin 120.000. Sayangnya saya tidak dapat memposting data di sini karena akan bertentangan dengan kondisi penggunaan data.
Anne

Jawaban:

106

membandingkan fit dari model yang dipilih dengan yang dari garis lurus horizontal (hipotesis nol). Jika model yang dipilih cocok lebih buruk dari garis horizontal, maka R 2 adalah negatif. Perhatikan bahwa R 2 tidak selalu kuadrat dari apa pun, sehingga dapat memiliki nilai negatif tanpa melanggar aturan matematika. R 2 adalah negatif hanya ketika model yang dipilih tidak mengikuti tren data, sehingga cocok lebih buruk dari garis horizontal.R2R2R2R2

Contoh: mencocokkan data dengan model regresi linier dibatasi sehingga intersep harus sama dengan 1500 .Y1500

masukkan deskripsi gambar di sini

Model tidak masuk akal sama sekali mengingat data ini. Ini jelas model yang salah, mungkin dipilih secara tidak sengaja.

(SSreg)(SStot)R21-SSregSStotSSregSStotR2

R2rR2R2

R2

Harvey Motulsky
sumber
3
@ JMS Itulah kebalikan dari yang ditunjukkan oleh Google saya: "/ ASLI" memperbaiki intersep pada 0; "/ NOORIGIN" "memberi tahu SPSS untuk tidak menekan konstanta" ( Panduan Pengantar untuk SPSS untuk Windows )
whuber
10
@whuber Benar. @ harvey-motulsky Nilai negatif R ^ 2 adalah ketidakmungkinan matematis (dan menyarankan bug komputer) untuk regresi OLS reguler (dengan intersep). Inilah yang dilakukan perintah 'REGRESI' dan apa yang ditanyakan oleh pengirim aslinya. Juga, untuk regresi OLS, R ^ 2 adalah korelasi kuadrat antara nilai yang diprediksi dan yang diamati. Karenanya, itu harus non-negatif. Untuk regresi OLS sederhana dengan satu prediktor, ini setara dengan korelasi kuadrat antara prediktor dan variabel dependen - sekali lagi, ini harus non-negatif.
Wolfgang
1
@whuber Memang. Salahku; jelas saya tidak menggunakan SPSS - atau membaca, rupanya :)
JMS
1
@whuber. Saya menambahkan sebuah paragraf yang menunjukkan bahwa dengan regresi linier, R2 dapat menjadi negatif hanya ketika intersep (atau mungkin kemiringan) dibatasi. Tanpa kendala, R2 harus positif dan sama dengan kuadrat r, koefisien korelasi.
Harvey Motulsky
1
@ HarveyMotulsky, dalam hal ini intersep atau kemiringan tidak dibatasi. Tampaknya Anda mengatakan bahwa Rsquared hanya dapat menjadi negatif jika ini dibatasi. Bisakah Anda menguraikan apa yang mungkin terjadi dalam kasus khusus ini?
Anne
18

Apakah Anda lupa menyertakan intersepsi dalam regresi Anda? Saya tidak terbiasa dengan kode SPSS, tetapi pada halaman 21 dari Hayon's Econometrics:

R2

R2=1-saya=1nesaya2saya=1n(ysaya-y¯)2

R2

Saya akan memeriksa dan memastikan bahwa SPSS termasuk intersep dalam regresi Anda.

jefflovejapan
sumber
4
Sub-perintah NOORIGIN dalam kodenya memberi tahu bahwa intersep dimasukkan dalam model
ttnphns
2
itu aneh. Saya akan menebak bahwa NOORIGINitu berarti intersep tidak termasuk dalam model, hanya pergi nama.
Matt O'Brien
6

Ini bisa terjadi jika Anda memiliki deret waktu Niid dan Anda membuat model ARIMA yang tidak sesuai dari formulir (0,1,0) yang merupakan model jalan acak perbedaan pertama tanpa drift, kemudian varian (jumlah kuadrat - SSE) dari residu akan lebih besar dari varian (jumlah kuadrat SSO) dari seri asli. Dengan demikian persamaan 1-SSE / SSO akan menghasilkan angka negatif ketika SSE mengeksekusi SSO. Kami telah melihat ini ketika pengguna cukup mencocokkan model yang diasumsikan atau menggunakan prosedur yang tidak memadai untuk mengidentifikasi / membentuk struktur ARIMA yang sesuai. Pesan yang lebih besar ADALAH bahwa model dapat mendistorsi (seperti kacamata buruk) penglihatan Anda. Tanpa memiliki akses ke data Anda, saya akan memiliki masalah dalam menjelaskan hasil yang salah. Sudahkah Anda membawa ini ke perhatian IBM?

Gagasan tentang model yang dianggap kontraproduktif telah digemakan oleh Harvey Motulsky. Pos Hebat Harvey!

IrishStat
sumber
1
stat. Terima kasih. Tidak, saya belum berbicara dengan IBM. Data bukan deret waktu. Itu dari titik waktu data.
Anne
5
@ Anne dan yang lainnya: Karena data Anda bukan deret waktu dan Anda tidak menggunakan prosedur deret waktu, harap abaikan jawaban saya. Orang lain yang telah mengamati R Squares negatif ketika terlibat dengan seri waktu mungkin menemukan posting saya menarik dan informatif. Sayangnya, yang lain mungkin tidak.
IrishStat
@IrishStat: Bisakah Anda menambahkan tautan ke pos Harvey Motulsky?
kjetil b halvorsen
Harvey menjawab pertanyaan di sini.
IrishStat