Apakah itu dalam varian standardisasi diketahui sementara dalam siswaisasi itu tidak diketahui dan karenanya diperkirakan? Terima kasih.
standardization
58485362
sumber
sumber
Jawaban:
Rekap pendek. Diberikan model , di mana adalah , dan , di mana adalah "topi matriks". Residual adalah Varians populasi tidak diketahui dan dapat diperkirakan oleh , kesalahan kuadrat rata-rata.X n × p β = ( X ' X ) - 1 X ' y y = X β = X ( X ' X ) - 1 X ' y = H y H = X ( X ' X ) - 1 X ' e = y -y= Xβ+ ε X n × p β^= ( X′X)- 1X′y y^= Xβ^= X( X′X)- 1X′y= Hy H= X( X′X)- 1X′ σ2MSE
Residual semistudentisasi didefinisikan sebagai tetapi, karena varian residu bergantung pada dan , varians perkiraan mereka adalah: mana adalah elemen diagonal ke- dari matriks topi. σ2XV(ei)=MSE(1-hii)hiii
Residual terstandarisasi , juga disebut residual yang internal , adalah:
Namun dan tunggal tidak independen, jadi tidak dapat memiliki distribusi . Prosedurnya adalah untuk menghapus observasi ke- , menyesuaikan fungsi regresi dengan observasi tersisa , dan mendapatkan yang baru yang dapat dilambangkan dengan . Perbedaannya: disebut residual yang dihapus . Ekspresi setara yang tidak memerlukan perhitungan ulang adalah: Menandakan dan dengan dan M S E r i t i n - 1 y y i ( i ) d i = y i - y i ( i ) d i = e iesaya M.SE rsaya t saya n - 1 y^ y^i ( i )
Lihat Kutner et al., Model Statistik Linier Terapan , Bab 10.
Sunting: Saya harus mengatakan bahwa jawaban oleh rpierce sempurna. Saya berpikir bahwa OP adalah tentang residu terstandarisasi dan terstandarisasi (dan membaginya dengan deviasi standar populasi untuk mendapatkan residu terstandarisasi tampak aneh bagi saya, tentu saja), tetapi saya salah. Saya berharap jawaban saya dapat membantu seseorang bahkan jika PL.
sumber
Dalam ilmu-ilmu sosial itu biasanya mengatakan bahwa skor Studentizated menggunakan / Gosset ini perhitungan Mahasiswa untuk memperkirakan varians populasi / standar deviasi dari sampel varians / standar deviasi ( ). Sebaliknya, skor standar (kata benda, tipe statistik tertentu, skor Z) dikatakan menggunakan deviasi standar populasi? ( ).σs σ
Namun, tampaknya ada beberapa perbedaan terminologis lintas bidang (silakan lihat komentar pada jawaban ini). Karena itu, kita harus berhati-hati dalam membuat perbedaan ini. Terlebih lagi, nilai-nilai siswa jarang disebut demikian dan orang biasanya melihat nilai-nilai 'pelajar' dalam konteks regresi. @Sergio memberikan perincian tentang jenis residu yang dihapus yang telah diubah menjadi mahasiswa dalam jawabannya.
sumber
Saya sangat terlambat menjawab pertanyaan ini !!. Tetapi tidak dapat menemukan jawabannya dalam bahasa yang sangat sederhana sehingga upaya sederhana untuk menjawab ini.
Mengapa kami melakukan standarisasi? Bayangkan Anda memiliki dua model - satu memprediksi kegilaan dari jumlah waktu yang dihabiskan untuk mempelajari statistik sementara yang lain memprediksi log (kegilaan) dengan jumlah waktu pada statistik.
akan sulit untuk memahami residu keduanya di unit yang berbeda. Jadi kami membakukan mereka (teori yang sama dengan Z-score)
Residu terstandarisasi: - Ketika residu dibagi dengan estimasi deviasi standar. Secara umum jika nilai absolut> 3 maka itu menjadi perhatian.
Kami menggunakan ini untuk menyelidiki outlier dalam model.
Residual Pelajar: Kami menggunakan ini untuk mempelajari stabilitas model.
Prosesnya sederhana. Kami menghapus setiap kasus uji dari model dan mencari nilai prediksi baru. Perbedaan antara nilai baru dan nilai pengamatan asli dapat distandarisasi dengan membagi kesalahan standar. nilai ini adalah Residual Pelajar
Untuk info lebih lanjut temukan statika menggunakan R - http://www.statisticshell.com/html/dsur.html
sumber
Wikipedia memiliki tinjauan yang baik di https://en.wikipedia.org/wiki/Normalization_(statistics) :
sumber