Saya melakukan regresi linier dengan variabel dependen berubah. Transformasi berikut dilakukan sehingga asumsi normalitas residual akan berlaku. Variabel dependen yang tidak ditransformasi miring secara negatif, dan transformasi berikut membuatnya mendekati normal:
di mana adalah variabel dependen pada skala asli.
Saya pikir masuk akal untuk menggunakan beberapa transformasi pada koefisien untuk kembali ke skala semula. Menggunakan persamaan regresi berikut,
dan dengan memperbaiki , yang kita miliki
Dan akhirnya,
Menggunakan logika yang sama, saya temukan
Sekarang semuanya bekerja sangat baik untuk model dengan 1 atau 2 prediktor; koefisien back-transformed menyerupai yang asli, hanya sekarang saya dapat mempercayai kesalahan standar. Masalahnya muncul saat menyertakan istilah interaksi, seperti
Kemudian transformasi balik untuk s tidak begitu dekat dengan yang dari skala asli, dan saya tidak yakin mengapa itu terjadi. Saya juga tidak yakin apakah rumus yang ditemukan untuk mentransformasikan kembali koefisien beta dapat digunakan seperti untuk 3 (untuk istilah interaksi). Sebelum masuk ke aljabar gila, saya pikir saya akan meminta saran ...
sumber
Jawaban:
Satu masalah adalah Anda sudah menulis
Itu adalah model deterministik sederhana (yaitu non-acak). Dalam hal ini, Anda dapat kembali mengubah koefisien pada skala asli, karena itu hanya masalah beberapa aljabar sederhana. Tetapi, dalam regresi biasa Anda hanya memiliki ; Anda telah meninggalkan istilah kesalahan dari model Anda. Jika transformasi dari kembali ke non-linear, Anda mungkin memiliki masalah karena , secara umum. Saya pikir itu mungkin ada hubungannya dengan perbedaan yang Anda lihat.E(Y|X)=α+β⋅X Y Yorig E(f(X))≠f(E(X))
Sunting: Perhatikan bahwa jika transformasi itu linier, Anda dapat kembali mentransformasikannya untuk mendapatkan estimasi koefisien pada skala asli, karena ekspektasinya linier.
sumber
Saya salut atas upaya Anda di sini, tetapi Anda menggonggong pohon yang salah. Anda tidak kembali mengubah beta. Model Anda berlaku di dunia data yang diubah. Jika Anda ingin membuat prediksi, misalnya, Anda kembali mengubah , tapi hanya itu. Tentu saja, Anda juga bisa mendapatkan interval prediksi dengan menghitung nilai batas tinggi dan rendah, dan kemudian mengubahnya kembali, tetapi dalam kasus apa pun Anda tidak mengubah beta.y^i
sumber
ASK QUESTION
); akan ada lebih banyak sumber daya untuk menjawab, Anda akan mendapatkan perhatian lebih banyak CVer, & informasi akan lebih mudah diakses untuk anak cucu.