Apakah ada alternatif (lebih kuat?) Untuk transformasi root arcsin kuadrat untuk data persentase / proporsi? Dalam set data yang saya kerjakan saat ini, heteroskedastisitas yang ditandai tetap setelah saya menerapkan transformasi ini, yaitu plot residual vs nilai yang dipasang masih sangat rhoid.
Diedit untuk menanggapi komentar: data adalah keputusan investasi oleh peserta eksperimental yang dapat menginvestasikan 0-100% dari dana abadi dalam kelipatan 10%. Saya juga telah melihat data ini menggunakan regresi logistik ordinal, tetapi ingin melihat apa yang akan dihasilkan oleh GLM. Ditambah lagi, saya bisa melihat jawabannya bermanfaat untuk pekerjaan di masa depan, karena root arcsin square tampaknya digunakan sebagai solusi satu ukuran untuk semua solusi di bidang saya dan saya belum menemukan alternatif apa pun yang digunakan.
sumber
Jawaban:
Yakin. John Tukey menggambarkan keluarga transformasi (peningkatan, satu-ke-satu) dalam EDA . Ini didasarkan pada ide-ide ini:
Untuk dapat memperpanjang ekor (menuju 0 dan 1) sebagaimana dikendalikan oleh parameter.
Namun demikian, untuk mencocokkan nilai-nilai asli (untransformed) dekat tengah (1/2 ), yang membuat transformasi lebih mudah untuk menafsirkan.
Untuk membuat ekspresi ulang simetris sekitar1/2. Artinya, jika p diekspresikan kembali sebagai f(p) , maka 1−p akan dinyatakan kembali sebagai −f(p) .
Jika Anda mulai dengan meningkatkan monoton fungsig:(0,1)→R terdiferensiasi pada 1/2 Anda dapat menyesuaikan untuk memenuhi kriteria kedua dan ketiga: hanya mendefinisikan
Pembilang secara simetris (kriteria(3) ), karena menukar p dengan 1−p membalikkan pengurangan, sehingga meniadakannya. Untuk melihat bahwa (2) puas, catatan bahwa penyebut justru faktor yang diperlukan untuk membuat f′(1/2)=1. Ingat bahwa mendekati turunan perilaku lokal dari fungsi dengan fungsi linear; kemiringan 1=1:1 dengan demikian berarti bahwa f(p)≈p (ditambah konstan −1/2 ) ketika p cukup dekat dengan 1/2. Ini adalah rasa di mana nilai-nilai asli yang "cocok dekat tengah."
Tukey menyebut ini versi "lipat" darig . Keluarganya terdiri dari transformasi daya dan log g(p)=pλ mana, ketika λ=0 , kami menganggap g(p)=log(p) .
Mari kita lihat beberapa contoh. Ketikaλ=1/2 kita mendapatkan akar dilipat, atau "froot," f(p)=1/2−−−√(p–√−1−p−−−−√) . Ketikaλ=0 kita memiliki logaritma terlipat, atau "belasan,"f(p)=(log(p)−log(1−p))/4. Jelas ini hanyalah kelipatan konstan daritransformasilogit,log(p1−p) .
Dalam grafik ini garis berkorespondensi biru untukλ=1 , garis merah menengah untuk λ=1/2 , dan garis hijau ekstrim untuk λ=0 . Garis emas putus-putus adalah transformasi arcsine , arcsin(2p−1)/2=arcsin(p–√)−arcsin(1/2−−−√) . The "cocok" dari lereng (kriteria(2) ) menyebabkan semua grafik untuk bertepatan dekatp=1/2.
Nilai-nilai yang paling berguna dari parameterλ terletak antara 1 dan 0 . (Anda dapat membuat ekor bahkan lebih berat dengan nilai-nilai negatif λ , tapi penggunaan ini jarang terjadi.) λ=1 tidak melakukan apa-apa kecuali recenter nilai ( f(p)=p−1/2 ). Saat λ menyusut ke arah nol, ekornya ditarik lebih jauh ke arah ±∞ . Ini memenuhi kriteria # 1. Dengan demikian, dengan memilih nilai λ sesuai , Anda dapat mengontrol "kekuatan" dari ekspresi ulang ini di bagian ekor.
sumber
Salah satu cara untuk memasukkan adalah memasukkan transformasi yang diindeks. Salah satu cara umum adalah dengan menggunakan fungsi distribusi kumulatif simetris (terbalik), sehingga dan F ( x ) = 1 - F ( - x ) . Salah satu contoh adalah distribusi t siswa standar, dengan ν derajat kebebasan. Parameter v mengontrol seberapa cepat variabel yang diubah mengembara menjadi tak terbatas. Jika Anda menetapkan v = 1 maka Anda memiliki transformasi arctan:F(0)=0.5 F(x)=1−F(−x) ν v v=1
Ini jauh lebih ekstrem daripada arcsine, dan lebih ekstrem daripada transformasi logit. Perhatikan bahwa transformasi logit dapat diperkirakan secara kasar dengan menggunakan distribusi-t dengan . SO dengan cara tertentu menyediakan tautan perkiraan antara transformasi logit dan probit ( ν = ∞ ), dan perluasannya ke transformasi yang lebih ekstrem.ν≈8 ν=∞
Masalah dengan transformasi ini adalah bahwa mereka memberi ketika proporsi yang diamati sama dengan 1 atau 0 . Jadi, Anda perlu entah bagaimana mengecilkan ini entah bagaimana - cara paling sederhana yang menambahkan + 1 "keberhasilan" dan + 1 "kegagalan".±∞ 1 0 +1 +1
sumber