Interpretasi dari prediktor dan / atau respons yang diubah log

46

Saya bertanya-tanya apakah itu membuat perbedaan dalam interpretasi apakah hanya dependen, baik dependen dan independen, atau hanya variabel independen yang ditransformasikan log.

Pertimbangkan kasus

log(DV) = Intercept + B1*IV + Error 

Saya bisa menafsirkan IV sebagai peningkatan persen tetapi bagaimana ini berubah ketika saya punya

log(DV) = Intercept + B1*log(IV) + Error

atau ketika saya punya

DV = Intercept + B1*log(IV) + Error

?

di atas
sumber
1
Saya merasa interpretasi "peningkatan persen" tidak benar, tetapi saya tidak memiliki cukup pemahaman untuk mengatakan mengapa tepatnya. Saya harap seseorang dapat membantu .... Di luar itu, saya akan merekomendasikan pemodelan menggunakan log jika mereka membantu untuk lebih baik membangun hubungan XY, tetapi melaporkan contoh-contoh yang dipilih dari hubungan itu menggunakan variabel asli. Terutama jika berhadapan dengan audiens yang tidak terlalu mengerti teknis.
rolando2
3
@ rolando2: Saya tidak setuju. Jika model yang valid membutuhkan transformasi, maka interpretasi yang valid biasanya akan bergantung pada koefisien dari model yang diubah. Tetap menjadi tanggung jawab simpatisan untuk mengomunikasikan secara tepat makna koefisien-koefisien tersebut kepada audiens. Itu, tentu saja, mengapa kita dibayar mahal seperti itu sehingga gaji harus diubah terlebih dahulu.
jthetzel
1
@BigBucks: Baiklah, lihat seperti ini. Misalkan audiens Anda tidak dapat memahami apa yang Anda maksudkan ketika Anda menjelaskan bahwa untuk setiap perubahan 1 pada log (basis 10) X, Y akan berubah sebesar b. Tetapi anggaplah mereka dapat memahami 3 contoh menggunakan nilai X 10, 100, dan 1000. Mereka pada saat itu kemungkinan akan menangkap sifat hubungan nonlinier. Anda masih bisa melaporkan keseluruhan, berbasis log b, tetapi memberikan contoh-contoh itu bisa membuat perbedaan.
rolando2
1
.... Meskipun sekarang setelah saya membaca penjelasan hebat Anda di bawah ini, mungkin menggunakan "templat" itu dapat membantu banyak dari kita mengatasi masalah seperti ini dalam memahami.
rolando2
1
Pembaca di sini mungkin juga ingin melihat utas yang terkait erat ini: Bagaimana menafsirkan koefisien yang ditransformasikan secara logaritma dalam regresi linier , & kapan-dan-mengapa-untuk-mengambil-log-dari-distribusi-angka-angka .
gung - Reinstate Monica

Jawaban:

42

Charlie memberikan penjelasan yang bagus dan benar. Situs Computing Statistik di UCLA memiliki beberapa contoh lebih lanjut: http://www.ats.ucla.edu/stat/sas/faq/sas_interpret_log.htm , dan http://www.ats.ucla.edu/stat/mult_pkg/ faq / general / log_transformed_regress.htm

Hanya untuk melengkapi jawaban Charlie, di bawah ini adalah interpretasi spesifik dari contoh Anda. Seperti biasa, interpretasi koefisien mengasumsikan bahwa Anda dapat mempertahankan model Anda, bahwa diagnostik regresi memuaskan, dan bahwa data berasal dari studi yang valid.

Contoh A : Tidak ada transformasi

DV = Intercept + B1 * IV + Error 

"Satu peningkatan unit IV dikaitkan dengan ( B1) peningkatan unit DV."

Contoh B : Hasil berubah

log(DV) = Intercept + B1 * IV + Error 

"Satu peningkatan unit IV dikaitkan dengan ( B1 * 100) persen peningkatan DV."

Contoh C : Eksposur berubah

DV = Intercept + B1 * log(IV) + Error 

"Satu persen peningkatan IV dikaitkan dengan ( B1 / 100) peningkatan unit DV."

Contoh D : Hasil berubah dan paparan berubah

log(DV) = Intercept + B1 * log(IV) + Error 

"Satu persen peningkatan IV dikaitkan dengan ( B1) persen peningkatan DV."

jthetzel
sumber
1
Apakah interpretasi ini berlaku terlepas dari dasar logaritma?
Ayalew A.
Contoh B: Log hasil transformasi (DV) = Intersepsi + B1 * IV + Kesalahan "Satu peningkatan unit IV dikaitkan dengan peningkatan (B1 * 100) persen dalam DV Dalam hal ini, bagaimana Anda lakukan jika Anda ingin 30 liter dari Reduksi DV? Terima kasih atas jawaban Anda
Antouria
Jadi log DV ~ B1 * (IV) adalah model yang baik untuk variabel dependen kontinu nol terikat?
Bakaburg
2
Saya mungkin bingung. Jika Anda mentransformasikan hasilnya, Anda harus mengekspansi ulang koefisien untuk menemukan perbedaan multiplikatif. Menafsirkannya pada skala log hanya berfungsi sebagai perkiraan ketika rasionya sangat dekat dengan 1.
AdamO
Tautan rusak.
Nick Cox
22

β1=log(y)log(x).
log(y)y=1y
log(y)=yy.
yx

β1yx

Mengikuti logika yang sama, untuk model level-log, yang kita miliki

β1=ylog(x)=100y100×log(x).
β1/100yx
Charlie
sumber
log(y)=yy?
1
log(y)yyyy1-y0yyy
7

Tujuan utama dari regresi linier adalah untuk memperkirakan perbedaan rata-rata hasil yang membandingkan tingkat yang berdekatan dari seorang regressor. Ada banyak jenis cara. Kami paling akrab dengan rata-rata aritmatika.

SEBUAHM.(X)=(X1+X2+...+Xn)n

AM adalah apa yang diperkirakan menggunakan OLS dan variabel yang tidak diubah. Mean geometrik berbeda:

GM.(X)=(X1×X2×...×Xn)n=exp(SEBUAHM.(catatan(X))

masukkan deskripsi gambar di sini

Praktis perbedaan GM adalah perbedaan multiplikatif: Anda membayar X% dari bunga saat mengambil pinjaman, kadar hemoglobin Anda berkurang X% setelah memulai metformin, tingkat kegagalan pegas meningkat X% sebagai sebagian kecil dari lebar. Dalam semua contoh ini, perbedaan rerata baku kurang masuk akal.

log(y) ~ xβ1Xeβ1

eβ1=0,40

catatan(x)1-xXexp(0,05)1,05Xexp(0,5)=1.65YX

y ~ log(x, base=2)xXβ1

Terakhir, log(y) ~ log(x)hanya menerapkan kedua definisi untuk mendapatkan perbedaan multiplikasi membandingkan kelompok yang berbeda secara multiplikasi dalam tingkat paparan.

AdamO
sumber