Dalam keadaan apa yang ingin Anda, atau tidak ingin skala atau standarisasi variabel sebelum pemasangan model? Dan apa keuntungan / kerugian dari penskalaan variabel?
57
Dalam keadaan apa yang ingin Anda, atau tidak ingin skala atau standarisasi variabel sebelum pemasangan model? Dan apa keuntungan / kerugian dari penskalaan variabel?
Jawaban:
Standardisasi adalah tentang bobot variabel yang berbeda untuk model. Jika Anda melakukan standarisasi "hanya" demi stabilitas numerik, mungkin ada transformasi yang menghasilkan sifat numerik yang sangat mirip tetapi makna fisik berbeda yang mungkin jauh lebih tepat untuk interpretasi. Hal yang sama berlaku untuk pemusatan, yang biasanya merupakan bagian dari standardisasi.
Situasi di mana Anda mungkin ingin melakukan standarisasi:
Situasi di mana Anda mungkin tidak ingin membakukan:
Anda dapat melakukan sesuatu "di antara", dan mentransformasikan variabel atau memilih unit sehingga variabel baru masih memiliki makna fisik tetapi variasi dalam nilai numerik tidak jauh berbeda, misalnya
Mirip untuk pemusatan:
sumber
Satu hal yang selalu saya tanyakan pada diri saya sebelum standardisasi adalah, "Bagaimana saya akan menafsirkan output?" Jika ada cara untuk menganalisis data tanpa transformasi, ini mungkin lebih baik murni dari sudut pandang interpretasi.
sumber
Secara umum saya tidak merekomendasikan penskalaan atau standardisasi kecuali jika benar-benar diperlukan. Keuntungan atau daya tarik dari proses semacam itu adalah bahwa, ketika variabel penjelas memiliki dimensi fisik dan besaran yang sama sekali berbeda dari variabel respons, penskalaan melalui pembagian dengan deviasi standar dapat membantu dalam hal stabilitas numerik, dan memungkinkan seseorang untuk membandingkan efek di beberapa variabel penjelas. Dengan standardisasi yang paling umum, efek variabel adalah jumlah perubahan dalam variabel respon ketika variabel penjelas meningkat satu standar deviasi; itu juga menunjukkan bahwa makna dari pengaruh variabel (jumlah perubahan dalam variabel respon ketika variabel penjelas meningkat satu unit) akan hilang meskipun nilai statistik untuk variabel penjelas tetap tidak berubah. Namun, ketika interaksi dipertimbangkan dalam suatu model, penskalaan bisa sangat bermasalah bahkan untuk pengujian statistik karena suatu komplikasi yang melibatkan penyesuaian penskalaan stokastik dalam menghitung kesalahan standar dari efek interaksi (Pengkhotbah, 2003). Untuk alasan ini, penskalaan dengan standar deviasi (atau standardisasi / normalisasi) umumnya tidak dianjurkan, terutama ketika interaksi terlibat.
Pengkhotbah, KJ, Curran, PJ, dan Bauer, DJ, 2006. Alat komputasi untuk menyelidiki efek interaksi dalam regresi linier berganda, pemodelan multilevel, dan analisis kurva laten. Jurnal Statistik Pendidikan dan Perilaku, 31 (4), 437-448.
sumber