Saya menjalankan regresi dengan 4 variabel, dan semuanya sangat signifikan secara statistik, dengan nilai T dan (saya katakan karena tampaknya tidak relevan untuk memasukkan desimal) yang sangat tinggi dan jelas signifikan. Tapi kemudian hanya 0,2284. Apakah saya salah menafsirkan nilai t di sini untuk berarti sesuatu yang bukan? Reaksi pertama saya saat melihat nilai-nilai t adalah bahwa akan cukup tinggi, tapi mungkin itu adalah tinggi ?
17
Jawaban:
Thet -values dan R2 digunakan untuk menilai hal yang sangat berbeda. Nilai- t digunakan untuk menilai keakuratan estimasi βi , tetapi R2 mengukur jumlah variasi dalam variabel respons yang dijelaskan oleh kovariat Anda. Misalkan Anda memperkirakan model regresi dengan n pengamatan,
dimanaϵi∼i.i.dN(0,σ2) , i=1,...,n .
Nilai-t besar (dalam nilai absolut) mengarahkan Anda untuk menolak hipotesis nol bahwa βi=0 . Ini berarti Anda dapat yakin bahwa Anda telah memperkirakan tanda koefisien dengan benar. Juga, jika |t| > 4 dan Anda memiliki n>5 , maka 0 tidak berada dalam interval kepercayaan 99% untuk koefisien. Nilai- t untuk koefisien βi adalah selisih antara estimasi βi^ dan 0 yang dinormalisasi dengan standar kesalahan se{βi^} .
yang hanyalah perkiraan dibagi dengan ukuran variabilitasnya. Jika Anda memiliki dataset yang cukup besar, Anda akan selalu memiliki nilai-t signifikan secara statistik (besar) . Ini tidak berarti bahwa kovariat Anda menjelaskan banyak variasi dalam variabel respons.
Seperti yang disebutkan @Stat,R2 mengukur jumlah variasi dalam variabel respons Anda yang dijelaskan oleh variabel dependen Anda. Untuk informasi lebih lanjut tentang R2 , buka wikipedia . Dalam kasus Anda, tampaknya Anda memiliki set data yang cukup besar untuk memperkirakan βi secara akurat , tetapi kovariat Anda melakukan pekerjaan yang buruk dalam menjelaskan dan \ atau memprediksi nilai respons.
sumber
Untuk mengatakan hal yang sama dengan caburke tetapi lebih sederhana, Anda sangat percaya bahwa respons rata-rata yang disebabkan oleh variabel Anda tidak nol. Tetapi ada banyak hal lain yang tidak Anda miliki dalam regresi yang menyebabkan respons melompat-lompat.
sumber
Mungkinkah meskipun prediktor Anda cenderung linier dalam hal variabel respons Anda (kemiringan secara signifikan berbeda dari nol), yang membuat nilai t signifikan, tetapi R kuadrat rendah karena kesalahannya besar, yang berarti bahwa variabilitas dalam data Anda besar dan dengan demikian model regresi Anda tidak cocok (prediksi tidak seakurat)?
Hanya 2 sen saya.
Perhaps this post can help: http://blog.minitab.com/blog/adventures-in-statistics/how-to-interpret-a-regression-model-with-low-r-squared-and-low-p-values
sumber
Several answers given are close but still wrong.
"The t-values are used to judge the accurary of your estimate of the βi's" is the one that concerns me the most.
The T-value is merely an indication of the likelihood of random occurrence. Large means unlikely. Small means very likely. Positive and Negative don't matter to the likelihood interpretation.
"R2 measures the amount of variation in your response variable explained by your covariates" is correct.
(I would have commented but am not allowed by this platform yet.)
sumber
The only way to deal with a small R squared, check the following:
How many covariates did you use for your model estimation? If more than 1 as in your case, deal with the problem of multicolinearity of the covariates or simply, run the regression again and this time without the constant which is known as beta zero.
However, if the problem still persists, then do a stepwise regression and select the model with a high R squared. But which I cannot recommend to you because it brings about bias in the covariates
sumber