Akar kuadrat kira-kira menstabilkan varian untuk Poisson . Ada sejumlah variasi pada akar kuadrat yang meningkatkan properti, seperti menambahkan38 sebelum mengambil akar kuadrat, atau Freeman-Tukey ( - meskipun sering disesuaikan dengan rata-rata juga).X−−√+X+1−−−−−√
Transformasi root kuadrat agak meningkatkan simetri - meskipun tidak sebaik kekuatan tidak [1]:23
Jika Anda ingin mendekati normalitas (selama parameter Poisson tidak terlalu kecil) dan tidak peduli / dapat menyesuaikan heteroskedastisitas, coba power.23
Tautan kanonik umumnya bukan transformasi yang sangat baik untuk data Poisson ; log nol menjadi masalah tertentu (yang lain adalah heteroskedastisitas; Anda juga bisa mendapatkan kecenderungan-kiri meskipun Anda tidak memiliki 0). Jika nilai terkecil tidak terlalu dekat dengan 0, akan berguna untuk meratakan nilai rata-rata. Ini adalah 'transformasi' yang baik untuk rata - rata populasi bersyarat dari Poisson dalam sejumlah konteks, tetapi tidak selalu dari data Poisson. Namun jika Anda ingin mengubah, salah satu strategi umum adalah menambahkan konstanta yang menghindari masalah . Dalam hal ini kita harus mempertimbangkan apa yang konstan untuk ditambahkan. Tanpa terlalu jauh dari pertanyaan yang ada, nilai antaray∗=log(y+c)0c0.4dan bekerja dengan sangat baik (misalnya dalam kaitannya dengan bias dalam estimasi kemiringan) melintasi rentang nilai . Saya biasanya hanya menggunakan karena sederhana, dengan nilai sekitar sering melakukan sedikit lebih baik.0.5μ120.43
Adapun mengapa orang memilih satu transformasi dari yang lain (atau tidak ada) - itu benar-benar masalah apa yang mereka lakukan untuk mencapainya.
[1]: Plot berpola setelah plot Henrik Bengtsson dalam handout-nya "Generalized Linear Models and Transformed Residuals" lihat di sini
(lihat slide pertama pada hal. 4). Saya menambahkan sedikit y-jitter dan menghilangkan garis.