Menafsirkan output langkah dalam R

11

Dalam R, stepperintah ini dimaksudkan untuk membantu Anda memilih variabel input ke model Anda, bukan?

Berikut ini berasal dari example(step)#-> swiss& step(lm1)

> step(lm1)
Start:  AIC=190.69
Fertility ~ Agriculture + Examination + Education + Catholic + 
    Infant.Mortality

                   Df Sum of Sq    RSS    AIC
- Examination       1     53.03 2158.1 189.86
<none>                          2105.0 190.69
- Agriculture       1    307.72 2412.8 195.10
- Infant.Mortality  1    408.75 2513.8 197.03
- Catholic          1    447.71 2552.8 197.75
- Education         1   1162.56 3267.6 209.36

Step:  AIC=189.86
Fertility ~ Agriculture + Education + Catholic + Infant.Mortality

                   Df Sum of Sq    RSS    AIC
<none>                          2158.1 189.86
- Agriculture       1    264.18 2422.2 193.29
- Infant.Mortality  1    409.81 2567.9 196.03
- Catholic          1    956.57 3114.6 205.10
- Education         1   2249.97 4408.0 221.43

Call:
lm(formula = Fertility ~ Agriculture + Education + Catholic +     Infant.Mortality, data = swiss)

Coefficients:
     (Intercept)       Agriculture         Education  
         62.1013           -0.1546           -0.9803  
        Catholic  Infant.Mortality  
          0.1247            1.0784  

Sekarang, ketika saya melihat ini, saya kira tabel Langkah terakhir adalah model yang harus kita gunakan? Beberapa baris terakhir termasuk fungsi "Panggilan", yang menggambarkan model aktual dan variabel input apa yang dimasukkannya, dan "Koefisien" adalah estimasi parameter aktual untuk nilai-nilai ini, bukan? Jadi ini model yang saya inginkan, kan? Saya mencoba memperkirakan ini untuk proyek saya, di mana ada lebih banyak variabel.

gakera
sumber

Jawaban:

7

Tabel langkah terakhir memang merupakan hasil akhir dari "regresi bertahap". Peringatan di sini adalah bahwa biasanya Anda tidak ingin menggunakan pendekatan ini ketika ada cara berprinsip untuk mendekati spesifikasi model Anda. Panggilan adalah panggilan lm yang akan menghasilkan persamaan yang digunakan pada langkah terakhir. Koefisien adalah estimasi parameter aktual. Perlu dicatat bahwa karena Anda tidak mendefinisikan langkah-langkah parameter lingkup atau arah default untuk pendekatan langkah 'mundur', di mana istilah variabel dievaluasi untuk menjatuhkan pada setiap langkah, pada setiap langkah jika menjatuhkan variabel yang dipilih mengurangi AIC itu dihapus dari model dan seluruh proses berulang sampai menjadi kasus bahwa tidak ada variabel tunggal yang bisa dijatuhkan. Dalam contoh Anda di langkah terakhir Kesuburan ~ Pertanian + Pendidikan + Katolik + Bayi.

russellpierce
sumber
2

Bagian dari hasil cetak di bagian akhir adalah model yang tersisa. Anda juga bisa mendapatkannya jika menangkap nilai stepfungsi:

final.mod <- step(lm1)
final.mod
Aniko
sumber