The Wikipedia halaman di R2 kata dapat mengambil lebih besar nilai dari 1. Saya tidak melihat bagaimana hal ini mungkin.
Nilai luar rentang 0 hingga 1 dapat terjadi di mana ia digunakan untuk mengukur kesepakatan antara nilai yang diamati dan yang dimodelkan dan di mana nilai "yang dimodelkan" tidak diperoleh dengan regresi linier dan tergantung pada formulasi mana yang digunakan. . Jika rumus pertama di atas digunakan, nilainya bisa kurang dari nol. Jika ekspresi kedua digunakan, nilai bisa lebih besar dari satu.
Kutipan itu merujuk pada "ekspresi kedua" tetapi saya tidak melihat ekspresi kedua pada halaman.
Apakah ada skenario di mana bisa lebih besar dari 1? Saya sedang memikirkan pertanyaan ini untuk regresi nonlinier, tetapi ingin mendapatkan jawaban umum.
[Untuk seseorang yang melihat halaman ini dengan pertanyaan yang berlawanan: Ya; bisa negatif. Ini terjadi ketika Anda memasukkan model yang sesuai dengan data lebih buruk daripada garis horizontal. Ini biasanya disebabkan oleh kesalahan dalam memilih model atau kendala.]
sumber
Jawaban:
Saya menemukan jawabannya, sehingga akan memposting jawaban untuk pertanyaan saya. Seperti yang ditunjukkan Martijn, dengan regresi linier Anda dapat menghitungR2 oleh dua ekspresi yang setara:
Dengan regresi nonlinier, Anda tidak dapat menjumlahkan jumlah kuadrat dari residu dan jumlah kuadrat dari regresi untuk mendapatkan jumlah total kuadrat. Persamaan itu tidak benar. Jadi persamaan di atas tidak benar. Dua pengalaman itu menghitung dua nilai berbeda untukR2 .
Satu-satunya persamaan yang masuk akal dan (saya pikir) digunakan secara universal adalah:
Nilainya tidak pernah lebih besar dari 1,0, tetapi bisa negatif ketika Anda cocok dengan model yang salah (atau kendala yang salah) sehinggaSSe (jumlah kuadrat residu) lebih besar dari SSt (jumlah kuadrat dari perbedaan antara nilai Y aktual dan rata-rata).
Persamaan lainnya tidak digunakan dengan regresi nonlinear:
Tetapi jika persamaan ini digunakan, itu menghasilkanR2 lebih besar dari 1,0 dalam kasus di mana model cocok dengan data yang sangat buruk SSm lebih besar dari SSt . Ini terjadi ketika kesesuaian model lebih buruk daripada kesesuaian garis horizontal, kasus yang sama yang menyebabkanR2 <0 dengan persamaan lainnya.
Intinya:R2 bisa lebih besar dari 1,0 hanya ketika persamaan yang tidak valid (atau tidak standar) digunakan untuk menghitung R2 dan ketika model yang dipilih (dengan kendala, jika ada) cocok dengan data yang sangat buruk, lebih buruk daripada kecocokan garis horizontal.
sumber
Menurut definisi,R2=1−SSe/SSt di mana kedua istilah SS adalah jumlah kuadrat dan dengan demikian tidak negatif. Maksimum dicapai padaSSe=0 yang menghasilkan R2=1 .
sumber