Bagaimana menafsirkan koefisien regresi ketika respons ditransformasikan oleh root ke-4?

20

Saya menggunakan 1/4transformasi kekuatan root keempat ( ) pada variabel respons saya, sebagai hasil dari heteroskedastisitas. Tapi sekarang saya tidak yakin bagaimana menafsirkan koefisien regresi saya.

Saya berasumsi bahwa saya perlu membawa koefisien ke kekuatan keempat ketika saya melakukan transformasi balik (lihat di bawah hasil regresi). Semua variabel dalam satuan dolar dalam jutaan, tetapi saya ingin mengetahui perubahan dolar dalam miliaran.

Sementara memegang variabel independen konstan lainnya, perubahan biaya satu miliar dolar, secara rata-rata, mengarah pada perubahan 32koleksi (atau 32.000 dolar). Saya ambil 0.000075223 * 1000(untuk mencapai miliaran) ^ 4 = 0.000032. Sekarang apakah saya mengalikan angka ini dengan 1 juta atau 1 miliar (unit asli dari variabel dependen adalah dalam jutaan)?

lm(formula = (Collections^(1/4)) ~ Fees + DIR)

                 Estimate      Std. Error  t value            Pr(>|t|)
(Intercept)   2.094573355     0.112292375   18.653  0.0000000000000151
Fees        **0.000075223   **0.000008411    8.943  0.0000000131878713
DIR           0.000022279     0.000004107    5.425  0.0000221138881913
pengguna13968
sumber
4
Anda mungkin ingin membaca ini: back-transformation-of-regression-koefisien .
gung - Reinstate Monica

Jawaban:

24

Solusi terbaik adalah, pada awalnya, untuk memilih ekspresi ulang yang memiliki makna di bidang studi.

(Misalnya, ketika regresi bobot tubuh terhadap faktor independen, kemungkinan bahwa baik akar pangkat ( power) atau akar kuadrat ( 1 / 2 listrik) akan ditunjukkan. Memperhatikan berat badan yang proxy yang baik untuk volume, kubus root adalah panjang yang mewakili ukuran linear karakteristik ini endows dengan intuitif, artinya berpotensi ditafsirkan Meskipun akar kuadrat sendiri tidak memiliki interpretasi yang jelas seperti itu, dekat dengan.. 2 / 3 listrik, yang memiliki dimensi luas permukaan : itu mungkin sesuai dengan total area kulit.)1/31/22/3

Kekuatan keempat cukup dekat dengan logaritma sehingga Anda harus mempertimbangkan untuk menggunakan log , yang maknanya dipahami dengan baik. Tetapi kadang-kadang kita benar-benar menemukan bahwa akar kubus atau akar kuadrat atau kekuatan fraksional semacam itu bekerja dengan baik dan tidak memiliki interpretasi yang jelas. Kemudian, kita harus melakukan sedikit aritmatika.

Model regresi yang ditunjukkan dalam pertanyaan melibatkan variabel dependen ("Koleksi") dan dua variabel independen X 1 ("Biaya") dan X 2 ("DIR"). Mengatakan ituYX1X2

Y1/4=β0+β1X1+β2X2+ε.

Kode memperkirakan sebagai b 0 = 2.094573355 , β 1 sebagai b 1 = 0,000075223 , dan β 2 sebagai b 2 = 0,000022279 . Ini juga menganggap ε adalah normal dengan nol rata-rata dan memperkirakan varians umum mereka (tidak ditampilkan). Dengan perkiraan ini, nilai pas dari Y 1 / 4 adalahβ0b0=2.094573355β1b1=0,000075223β2b2=0,000022279εY1/4

Y1/4^=b0+b1X1+b2X2.

Koefisien regresi "Interpreting" biasanya berarti menentukan perubahan apa dalam variabel dependen yang disarankan oleh perubahan yang diberikan pada masing-masing variabel independen. Perubahan-perubahan ini adalah turunannya , yang dikatakan oleh Aturan Rantai sama dengan 4 β i Y 3 . Kami akan memasukkan perkiraan, lalu, dan mengatakan sesuatu sepertidY/dXsaya4βsayaY3

Regresi perkiraan bahwa perubahan unit akan terkait dengan perubahan Y dari 4 b i Y 3 = 4 b i ( b 0 + b 1 X 1 + b 2 X 2 ) 3 .XiY4biY^34bi(b0+b1X1+b2X2)3

Ketergantungan interpretasi pada dan X 2 tidak hanya diungkapkan dalam kata-kata,X1X2 tidak seperti situasi tanpa transformasi (satu unit perubahan dalam X i dikaitkan dengan perubahan b i di Y ) atau dengan logaritma (satu perubahan persen dalam X i dikaitkan dengan b i perubahan persen dalam Y ). Namun, dengan mempertahankan bentuk pertama dari interpretasi, dan menghitung 4 b 1 = 4 × 0,000075223 = 0,000301YXibiYXibiY4b14×0.0000752230.000301, kita mungkin nyatakan sesuatu seperti

Perubahan satuan dalam biaya dikaitkan dengan perubahan dalam koleksi sebesar kali kubus dari koleksi saat ini; misalnya, jika koleksi saat ini adalah 10 , maka kenaikan unit dalam biaya dikaitkan dengan peningkatan 0,301 dalam koleksi dan jika koleksi saat ini adalah 20 , maka kenaikan unit yang sama dalam biaya dikaitkan dengan peningkatan 2,41 dalam koleksi.0.000301100.301202.41


Saat mengambil akar selain keempat - mengatakan, bila menggunakan sebagai respon daripada Y itu sendiri, dengan p nol - cukup mengganti semua penampilan dari " 4 " dalam analisis ini dengan " 1 / p ". YpYp41/p

whuber
sumber
12

Alternatif untuk transformasi di sini adalah dengan menggunakan model linier umum dengan daya fungsi tautan dan daya 1/4. Kesalahan apa yang digunakan keluarga adalah terbuka, yang memberi Anda lebih banyak fleksibilitas daripada yang Anda miliki dengan regresi linier dan asumsi normalitas bersyarat. Satu keuntungan utama dari prosedur ini adalah bahwa prediksi secara otomatis dihasilkan pada skala pengukuran asli, sehingga tidak ada pertanyaan tentang transformasi balik.

Nick Cox
sumber
4

Saya telah melihat makalah menggunakan koefisien regresi akar kuartik dalam berpikir tentang perubahan persentase, sambil menghindari mengambil log (dan menjatuhkan pengamatan).

Jika kami tertarik menggunakan akar kuartik untuk menghitung perubahan persentase, kami tahu bahwa:

Y^=(α+β^1X1+β^2X2)4dY^dX1=4β^1(α+β^1X1+β^2X2)3

YXX

dY^/dX1Y=4β^1α+β^1X1+β^2X2

YX

dY^dX1X1Y^=4β^1X1α+β^1X1+β^2X2

It doesn't seem especially convenient (I prefer the log transformation), but it can be done, either evaluating the X values at the sample means or at hypothetical values.

I suppose, actually, you could replace the denominator with the sample average value of Y1/4, and that would be a bit more convenient.

user68005
sumber