Menafsirkan fungsi ringkasan untuk model lm di R

11

Apa arti dari t valuedan Pr(>|t|)kapan menggunakan summary()fungsi pada model regresi linier dalam R?

Coefficients:
                              Estimate Std. Error t value Pr(>|t|)    
(Intercept)                    10.1595     1.3603   7.469 1.11e-13 ***
log(var)                        0.3422     0.1597   2.143   0.0322 *
itamarbe
sumber
2
Lihat di sini, kalimat terakhir dari paragraf pertama , dan di sini dan di sini .
Glen_b -Reinstate Monica
Dan untuk kesalahan standar, lihat di sini
Glen_b -Reinstate Monica

Jawaban:

9

Nilai t kolom menunjukkan kepada Anda uji-t yang terkait dengan pengujian signifikansi parameter yang tercantum dalam kolom pertama. Misalnya nilai t dari 7,369 mengacu pada uji-t dari (Intercept) 10,1595 dibagi dengan kesalahan standar estimasi yang 1,3603. Pr (> | t |) memberi Anda nilai p untuk uji-t itu (proporsi distribusi t pada df yang lebih besar dari nilai absolut statistik t Anda). 1.11e-13 adalah notasi ilmiah. Tanda bintang yang mengikuti Pr (> | t |) menyediakan cara yang dapat diakses secara visual untuk menilai apakah statistik memenuhi berbagai kriteria .α

russellpierce
sumber
4

Saya tidak cukup grok t-test, tetapi wikipedia memiliki artikel bagus tentang p-value - pada dasarnya p-value adalah kemungkinan bahwa hasil yang Anda lihat terjadi karena variasi acak. Umumnya nilai-p 0,05 atau kurang (diartikan secara kasar sebagai "ada peluang 5% atau kurang dari ini terjadi hanya karena variasi acak") diambil untuk berarti bahwa hasilnya signifikan.

Aerik
sumber
4
Karena masalah ini telah dibahas secara luas di situs ini, saya akan singkat: (1) nilai-p adalah probabilitas yang bersyarat pada asumsi hipotesis nol (ini bukan "peluang" tanpa syarat dan kemungkinan kontrafaktual ) dan (2) bukan peluang "hasil yang Anda lihat" - yang dalam kasus ini praktis nol - melainkan kesempatan - di bawah hipotesis nol - bahwa hasil Anda akan berada dalam "wilayah kritis" untuk uji hipotesis. Meskipun ini mungkin tampak seperti memetik, banyak kebingungan dapat timbul dari salah menafsirkan bahasa yang longgar.
whuber
2
@whuber - terima kasih telah meluangkan waktu untuk menyusun deskripsi nilai-p yang benar dan akurat. Sejujurnya, saya hanya memahami itu sendiri, tetapi dengan sengaja memberikan jawaban "bahasa yang longgar" untuk membantu penanya mendapatkan ide dasar tanpa membuatnya kewalahan ... bagi saya tampaknya banyak statistik seperti itu - apa yang sebenarnya dikatakan oleh statistik tidak begitu ramah, jadi orang memberikan perkiraan kasar yang lebih mudah dicerna. Saya pikir dalam "Enam Potongan Mudah" Feynman menjelaskan fisika seperti itu. "Ini tidak akurat, tapi ini perkiraan yang berguna"
Aerik
1
Sayangnya, bahasa yang longgar menyebabkan banyak tindakan salah arah yang diambil sebagai akibat dari kesalahpahaman.
Glen_b -Reinstate Monica