Saya menggunakan 1/4
transformasi kekuatan root keempat ( ) pada variabel respons saya, sebagai hasil dari heteroskedastisitas. Tapi sekarang saya tidak yakin bagaimana menafsirkan koefisien regresi saya.
Saya berasumsi bahwa saya perlu membawa koefisien ke kekuatan keempat ketika saya melakukan transformasi balik (lihat di bawah hasil regresi). Semua variabel dalam satuan dolar dalam jutaan, tetapi saya ingin mengetahui perubahan dolar dalam miliaran.
Sementara memegang variabel independen konstan lainnya, perubahan biaya satu miliar dolar, secara rata-rata, mengarah pada perubahan 32
koleksi (atau 32.000 dolar). Saya ambil 0.000075223 * 1000
(untuk mencapai miliaran) ^ 4 = 0.000032
. Sekarang apakah saya mengalikan angka ini dengan 1 juta atau 1 miliar (unit asli dari variabel dependen adalah dalam jutaan)?
lm(formula = (Collections^(1/4)) ~ Fees + DIR)
Estimate Std. Error t value Pr(>|t|)
(Intercept) 2.094573355 0.112292375 18.653 0.0000000000000151
Fees **0.000075223 **0.000008411 8.943 0.0000000131878713
DIR 0.000022279 0.000004107 5.425 0.0000221138881913
sumber
Jawaban:
Solusi terbaik adalah, pada awalnya, untuk memilih ekspresi ulang yang memiliki makna di bidang studi.
(Misalnya, ketika regresi bobot tubuh terhadap faktor independen, kemungkinan bahwa baik akar pangkat ( power) atau akar kuadrat ( 1 / 2 listrik) akan ditunjukkan. Memperhatikan berat badan yang proxy yang baik untuk volume, kubus root adalah panjang yang mewakili ukuran linear karakteristik ini endows dengan intuitif, artinya berpotensi ditafsirkan Meskipun akar kuadrat sendiri tidak memiliki interpretasi yang jelas seperti itu, dekat dengan.. 2 / 3 listrik, yang memiliki dimensi luas permukaan : itu mungkin sesuai dengan total area kulit.)1 / 3 1 / 2 2 / 3
Kekuatan keempat cukup dekat dengan logaritma sehingga Anda harus mempertimbangkan untuk menggunakan log , yang maknanya dipahami dengan baik. Tetapi kadang-kadang kita benar-benar menemukan bahwa akar kubus atau akar kuadrat atau kekuatan fraksional semacam itu bekerja dengan baik dan tidak memiliki interpretasi yang jelas. Kemudian, kita harus melakukan sedikit aritmatika.
Model regresi yang ditunjukkan dalam pertanyaan melibatkan variabel dependen ("Koleksi") dan dua variabel independen X 1 ("Biaya") dan X 2 ("DIR"). Mengatakan ituY X1 X2
Kode memperkirakan sebagai b 0 = 2.094573355 , β 1 sebagai b 1 = 0,000075223 , dan β 2 sebagai b 2 = 0,000022279 . Ini juga menganggap ε adalah normal dengan nol rata-rata dan memperkirakan varians umum mereka (tidak ditampilkan). Dengan perkiraan ini, nilai pas dari Y 1 / 4 adalahβ0 b0= 2.094573355 β1 b1= 0,000075223 β2 b2= 0,000022279 ε Y1 / 4
Koefisien regresi "Interpreting" biasanya berarti menentukan perubahan apa dalam variabel dependen yang disarankan oleh perubahan yang diberikan pada masing-masing variabel independen. Perubahan-perubahan ini adalah turunannya , yang dikatakan oleh Aturan Rantai sama dengan 4 β i Y 3 . Kami akan memasukkan perkiraan, lalu, dan mengatakan sesuatu sepertidY/ dXsaya 4 βsayaY3
Ketergantungan interpretasi pada dan X 2 tidak hanya diungkapkan dalam kata-kata,X1 X2 tidak seperti situasi tanpa transformasi (satu unit perubahan dalam X i dikaitkan dengan perubahan b i di Y ) atau dengan logaritma (satu perubahan persen dalam X i dikaitkan dengan b i perubahan persen dalam Y ). Namun, dengan mempertahankan bentuk pertama dari interpretasi, dan menghitung 4 b 1 = 4 × 0,000075223 = 0,000301Y Xi bi Y Xi bi Y 4b1 4×0.000075223 0.000301 , kita mungkin nyatakan sesuatu seperti
Saat mengambil akar selain keempat - mengatakan, bila menggunakan sebagai respon daripada Y itu sendiri, dengan p nol - cukup mengganti semua penampilan dari " 4 " dalam analisis ini dengan " 1 / p ".Yp Y p 4 1/p
sumber
Alternatif untuk transformasi di sini adalah dengan menggunakan model linier umum dengan daya fungsi tautan dan daya 1/4. Kesalahan apa yang digunakan keluarga adalah terbuka, yang memberi Anda lebih banyak fleksibilitas daripada yang Anda miliki dengan regresi linier dan asumsi normalitas bersyarat. Satu keuntungan utama dari prosedur ini adalah bahwa prediksi secara otomatis dihasilkan pada skala pengukuran asli, sehingga tidak ada pertanyaan tentang transformasi balik.
sumber
Saya telah melihat makalah menggunakan koefisien regresi akar kuartik dalam berpikir tentang perubahan persentase, sambil menghindari mengambil log (dan menjatuhkan pengamatan).
Jika kami tertarik menggunakan akar kuartik untuk menghitung perubahan persentase, kami tahu bahwa:
It doesn't seem especially convenient (I prefer the log transformation), but it can be done, either evaluating theX values at the sample means or at hypothetical values.
I suppose, actually, you could replace the denominator with the sample average value ofY1/4 , and that would be a bit more convenient.
sumber