Apakah

12

Kolega saya ingin menganalisis beberapa data setelah mengubah variabel respons dengan menaikkannya menjadi kekuatan (yaitu,y0,125).18y0.125

Saya tidak nyaman dengan ini, tetapi berjuang untuk mengartikulasikan mengapa. Saya tidak dapat memikirkan alasan mekanistik untuk transformasi ini. Saya juga belum pernah melihatnya sebelumnya, dan saya khawatir mungkin itu mengembang tingkat kesalahan Tipe I atau sesuatu - tetapi saya tidak memiliki apa pun untuk mendukung masalah ini!

Selain itu, kolega saya menemukan bahwa model yang diubah ini mengungguli model yang tidak diubah dalam perbandingan AIC. Apakah ini, dengan sendirinya, membenarkan penggunaannya?

AndrewMacDonald
sumber
9
Hanya fyi, terlihat sebuah banyak seperti log ( y ) bagi banyak rentang y . Transformasi log seringkali dibenarkan dalam banyak kasus (tetapi juga sering digunakan dalam kasus yang tidak dapat dibenarkan). y1/8log(y)y
Cliff AB
2
Ini adalah diskusi terkait
user603
5
Anda tidak dapat membandingkan AIC secara bermakna antara model dengan variabel dependen yang diubah. (Mengubah variabel independen tidak masalah.)
Stephan Kolassa
5
y=(xp1)/pp
3
Ini adalah riff kecil pada gagasan bahwa transformasi ini dapat menjadi pengganti logaritma jika nol terjadi. Tautan logaritmik untuk model linier umum mengatakan bahwa tanggapan rata-rata bervariasi secara eksponensial tetapi tidak mengasumsikan bahwa semua nilainya bernilai positif. Jadi itu menoleransi beberapa nol dalam data. Secara kasar implikasinya adalah bahwa mereka harus atau akan positif jika mereka dapat: misalnya melaporkan nol (nol spesimen dalam sampel, nol konsentrasi menurut mesin) kadang-kadang berarti tidak terdeteksi. Terlepas dari namanya yang luar biasa, Box-Cox tampak oversold setiap kali ada tautan alami di GLMs.
Nick Cox

Jawaban:

10

Merupakan praktik umum untuk menerapkan transformasi daya (Tukey, Box-Cox) dengan nilai arbitrer pada respons. Dari perspektif itu, saya tidak melihat kekhawatiran khusus mengenai nilai Anda 1/8 - jika transformasi itu memberi Anda residu yang baik, lakukanlah.

Tentu saja, setiap transformasi mengubah hubungan fungsional yang Anda cocok, dan mungkin 1/8 tidak masuk akal secara mekanis, tetapi itu tidak akan menjadi masalah bagi saya ketika tujuannya bukan untuk mengekstrapolasi atau menyesuaikan parameter fisik. hukum, tetapi untuk mendapatkan nilai-p yang tepat pada tanda efek (saya berpendapat itu adalah kasus penggunaan normal dalam regresi). Untuk tujuan itu, satu-satunya kekhawatiran Anda adalah bahwa fungsi tersebut cocok dengan data dalam domain nilai prediktor Anda (rata-rata wrt dan variasi residu), dan itu mudah untuk diperiksa.

Jika Anda tidak yakin tentang nilai terbaik untuk transformasi daya, dan ingin membandingkan antara opsi yang berbeda, Anda tidak boleh langsung membandingkan nilai AIC / kemungkinan karena transformasi daya mengubah skala respons. Untungnya, ternyata relatif mudah untuk menghitung koreksi untuk transformasi, sedemikian rupa sehingga transformasi yang berbeda dapat dibandingkan melalui kemungkinan (dikoreksi) mereka (lihat, misalnya di sini ).

Dalam R, ini diterapkan dalam MASS :: boxcox - ini adalah cara yang mudah untuk memilih nilai yang tepat untuk daya.

Florian Hartig
sumber