Asumsikan bahwa saya memiliki variabel yang distribusinya condong positif ke tingkat yang sangat tinggi, sehingga mengambil log tidak akan cukup untuk membawanya dalam kisaran skewness untuk distribusi normal. Apa opsi saya saat ini? Apa yang bisa saya lakukan untuk mengubah variabel menjadi distribusi normal?
data-transformation
skewness
histelheim
sumber
sumber
Jawaban:
Coba langsung transformasi Box-Cox sesuai Box, GEP dan Cox, DR (1964), "An Analysis of Transformations," Jurnal Masyarakat Statistik Kerajaan, Seri B , 26, 211--234. SAS memiliki deskripsi fungsi kemungkinan loglikasinya dalam Transformasi Normalisasi , yang dapat Anda gunakan untuk menemukan parameter optimal , yang dijelaskan dalam Atkinson, AC (1985), Plot, Transformasi, dan Regresi , New York: Oxford University Press.λ
Sangat mudah untuk mengimplementasikannya dengan fungsi LL, atau jika Anda memiliki paket stat seperti SAS atau MATLAB gunakan perintah mereka: itu perintah boxcox di MATLAB dan PROC TRANSREG di SAS.
Juga, dalam R ini dalam paket MASS, function boxcox ().
sumber
Untuk kemiringan positif (ekor berada di ujung positif sumbu x), terdapat transformasi akar kuadrat, transformasi log, dan transformasi invers / timbal balik (dalam urutan meningkatnya keparahan). Dengan demikian, jika transformasi log tidak cukup, Anda dapat menggunakan tingkat transformasi berikutnya. Box Cox menjalankan semua transformasi secara otomatis sehingga Anda dapat memilih yang terbaik.
sumber
Sebagian besar suite perangkat lunak akan menggunakan nomor Euler sebagai basis log default, AKA: natural log. Anda dapat menggunakan nomor pangkalan yang lebih tinggi untuk mengekang data yang terlalu miring kanan. Bagaimana Anda melakukannya sintaks tergantung pada perangkat lunak yang Anda gunakan.
Jika Anda perlu keluar dari Anda nilai-nilai yang ditransformasi setelah estimasi dilakukan, mungkin akan sedikit lebih mudah untuk menggunakan metode ini karena yang harus Anda lakukan adalah melakukan operator eksponensial pada variabel Anda dengan apa pun basis log Anda.
sumber