Bagaimana menafsirkan koefisien regresi ketika respons ditransformasikan oleh root ke-4?

20

Saya menggunakan 1/4transformasi kekuatan root keempat ( ) pada variabel respons saya, sebagai hasil dari heteroskedastisitas. Tapi sekarang saya tidak yakin bagaimana menafsirkan koefisien regresi saya.

Saya berasumsi bahwa saya perlu membawa koefisien ke kekuatan keempat ketika saya melakukan transformasi balik (lihat di bawah hasil regresi). Semua variabel dalam satuan dolar dalam jutaan, tetapi saya ingin mengetahui perubahan dolar dalam miliaran.

Sementara memegang variabel independen konstan lainnya, perubahan biaya satu miliar dolar, secara rata-rata, mengarah pada perubahan 32koleksi (atau 32.000 dolar). Saya ambil 0.000075223 * 1000(untuk mencapai miliaran) ^ 4 = 0.000032. Sekarang apakah saya mengalikan angka ini dengan 1 juta atau 1 miliar (unit asli dari variabel dependen adalah dalam jutaan)?

lm(formula = (Collections^(1/4)) ~ Fees + DIR)

                 Estimate      Std. Error  t value            Pr(>|t|)
(Intercept)   2.094573355     0.112292375   18.653  0.0000000000000151
Fees        **0.000075223   **0.000008411    8.943  0.0000000131878713
DIR           0.000022279     0.000004107    5.425  0.0000221138881913

regression data-transformation pengguna13968
sumber

4

Anda mungkin ingin membaca ini: back-transformation-of-regression-koefisien .

gung - Reinstate Monica

24

Solusi terbaik adalah, pada awalnya, untuk memilih ekspresi ulang yang memiliki makna di bidang studi.

(Misalnya, ketika regresi bobot tubuh terhadap faktor independen, kemungkinan bahwa baik akar pangkat ( power) atau akar kuadrat ( listrik) akan ditunjukkan. Memperhatikan berat badan yang proxy yang baik untuk volume, kubus root adalah panjang yang mewakili ukuran linear karakteristik ini endows dengan intuitif, artinya berpotensi ditafsirkan Meskipun akar kuadrat sendiri tidak memiliki interpretasi yang jelas seperti itu, dekat dengan.. listrik, yang memiliki dimensi luas permukaan : itu mungkin sesuai dengan total area kulit.) $1/3$ $1/2$ $2/3$

Kekuatan keempat cukup dekat dengan logaritma sehingga Anda harus mempertimbangkan untuk menggunakan log , yang maknanya dipahami dengan baik. Tetapi kadang-kadang kita benar-benar menemukan bahwa akar kubus atau akar kuadrat atau kekuatan fraksional semacam itu bekerja dengan baik dan tidak memiliki interpretasi yang jelas. Kemudian, kita harus melakukan sedikit aritmatika.

Model regresi yang ditunjukkan dalam pertanyaan melibatkan variabel dependen ("Koleksi") dan dua variabel independen ("Biaya") dan ("DIR"). Mengatakan itu $Y$ $X_1$ $X_2$

Y^{1 / 4} = β_{0} + β_{1} X_{1} + β_{2} X_{2} + ε .

$Y^{1/4} = \beta_0 + \beta_1 X_1 + \beta_2 X_2 +\varepsilon.$

Kode memperkirakan sebagai , sebagai , dan sebagai . Ini juga menganggap adalah normal dengan nol rata-rata dan memperkirakan varians umum mereka (tidak ditampilkan). Dengan perkiraan ini, nilai pas dari adalah $\beta_0$ $b_0=2.094573355$ $\beta_1$ $b_1=0.000075223$ $\beta_2$ $b_2=0.000022279$ $\varepsilon$ $Y^{1/4}$

\hat{Y^{1 / 4}} = b_{0} + b_{1} X_{1} + b_{2} X_{2} .

$\widehat{Y^{1/4}} = b_0 + b_1 X_1 + b_2 X_2.$

Koefisien regresi "Interpreting" biasanya berarti menentukan perubahan apa dalam variabel dependen yang disarankan oleh perubahan yang diberikan pada masing-masing variabel independen. Perubahan-perubahan ini adalah turunannya , yang dikatakan oleh Aturan Rantai sama dengan . Kami akan memasukkan perkiraan, lalu, dan mengatakan sesuatu seperti $dY/dX_i$ $4\beta_iY^3$

Regresi perkiraan bahwa perubahan unit akan terkait dengan perubahan dari = . $X_i$ $Y$ $4b_i\widehat{Y}^3$ $4b_i\left(b_0+b_1X_1+b_2X_2\right)^3$

Ketergantungan interpretasi pada dan tidak hanya diungkapkan dalam kata-kata, $X_1$ $X_2$ tidak seperti situasi tanpa transformasi (satu unit perubahan dalam dikaitkan dengan perubahan di ) atau dengan logaritma (satu perubahan persen dalam dikaitkan dengan perubahan persen dalam ). Namun, dengan mempertahankan bentuk pertama dari interpretasi, dan menghitung = = $Y$ $X_i$ $b_i$ $Y$ $X_i$ $b_i$ $Y$ $4b_1$ $4\times 0.000075223$ $0.000301$ , kita mungkin nyatakan sesuatu seperti

Perubahan satuan dalam biaya dikaitkan dengan perubahan dalam koleksi sebesar kali kubus dari koleksi saat ini; misalnya, jika koleksi saat ini adalah , maka kenaikan unit dalam biaya dikaitkan dengan peningkatan dalam koleksi dan jika koleksi saat ini adalah , maka kenaikan unit yang sama dalam biaya dikaitkan dengan peningkatan dalam koleksi. $0.000301$ $10$ $0.301$ $20$ $2.41$

Saat mengambil akar selain keempat - mengatakan, bila menggunakan sebagai respon daripada itu sendiri, dengan nol - cukup mengganti semua penampilan dari " " dalam analisis ini dengan " ". $Y^p$ $Y$ $p$ $4$ $1/p$

whuber
sumber

12

Alternatif untuk transformasi di sini adalah dengan menggunakan model linier umum dengan daya fungsi tautan dan daya 1/4. Kesalahan apa yang digunakan keluarga adalah terbuka, yang memberi Anda lebih banyak fleksibilitas daripada yang Anda miliki dengan regresi linier dan asumsi normalitas bersyarat. Satu keuntungan utama dari prosedur ini adalah bahwa prediksi secara otomatis dihasilkan pada skala pengukuran asli, sehingga tidak ada pertanyaan tentang transformasi balik.

Nick Cox
sumber

4

Saya telah melihat makalah menggunakan koefisien regresi akar kuartik dalam berpikir tentang perubahan persentase, sambil menghindari mengambil log (dan menjatuhkan pengamatan).

Jika kami tertarik menggunakan akar kuartik untuk menghitung perubahan persentase, kami tahu bahwa:

$\hat{Y} = (\alpha + \hat{\beta}_1 X_1 + \hat{\beta}_2 X_2)^4 \implies \frac{d\hat{Y}}{dX_1} = 4\hat{\beta}_1(\alpha+\hat{\beta}_1 X_1 + \hat{\beta}_2 X_2)^3$

$Y$ $X$ $X$

$\frac{d\hat{Y}/dX_1}{Y} = \frac{4\hat{\beta}_1}{\alpha + \hat{\beta}_1 X_1 + \hat{\beta}_2 X_2}$

$Y$ $X$

$\frac{d\hat{Y}}{dX_1}\frac{X_1}{\hat{Y}} = \frac{4\hat{\beta}_1 X_1}{\alpha + \hat{\beta}_1 X_1 + \hat{\beta}_2 X_2}$

It doesn't seem especially convenient (I prefer the log transformation), but it can be done, either evaluating the $X$ values at the sample means or at hypothetical values.

I suppose, actually, you could replace the denominator with the sample average value of $Y^{1/4}$ , and that would be a bit more convenient.

user68005
sumber

Bagaimana menafsirkan koefisien regresi ketika respons ditransformasikan oleh root ke-4?

Jawaban: