Dalam analisis skor tes (misalnya, dalam Pendidikan atau Psikologi), teknik analisis umum sering mengasumsikan bahwa data terdistribusi secara normal. Namun, mungkin lebih sering daripada tidak, skor cenderung menyimpang kadang-kadang liar dari normal.
Saya akrab dengan beberapa transformasi normalisasi dasar, seperti: akar kuadrat, logaritma, transformasi timbal balik untuk mengurangi kemiringan positif, mencerminkan versi di atas untuk mengurangi kemiringan negatif, mengkuadratkan distribusi leptokurtik. Saya telah mendengar tentang transformasi arcsine dan transformasi kekuatan, meskipun saya tidak benar-benar tahu tentang mereka.
Jadi, saya ingin tahu seperti apa transformasi lain yang biasa digunakan oleh analis?
Langkah pertama adalah menanyakan mengapa variabel Anda terdistribusi secara tidak normal. Ini bisa mencerahkan. Temuan umum dari pengalaman saya:
Langkah pertama ini mungkin menyarankan modifikasi desain untuk pengujian. Jika Anda mengetahui masalah ini sebelumnya, Anda bahkan dapat merancang tes untuk menghindarinya, jika Anda melihatnya bermasalah.
Langkah kedua adalah memutuskan apa yang harus dilakukan dalam situasi di mana Anda memiliki data yang tidak normal. Catatan transformasi hanyalah salah satu strategi yang mungkin. Saya akan mengulangi saran umum dari jawaban sebelumnya tentang non-normalitas :
sumber
John Tukey secara sistematis membahas transformasi dalam bukunya tentang EDA. Selain keluarga Box-Cox (transformasi daya yang diskalakan dengan baik) ia mendefinisikan keluarga transformasi "terlipat" untuk proporsi (pada dasarnya kekuatan x / (1-x)) dan jumlah "mulai" (menambahkan offset positif untuk data yang dihitung) sebelum mengubahnya). Transformasi terlipat, yang pada dasarnya menggeneralisasi logit, sangat berguna untuk skor tes.
Dalam nada yang sama sekali berbeda, Johnson & Kotz dalam buku mereka tentang distribusi menawarkan banyak transformasi yang dimaksudkan untuk mengubah statistik uji untuk mendekati normalitas (atau ke beberapa distribusi target lainnya), seperti transformasi akar-pangkat untuk chi-square. Materi ini adalah sumber ide bagus untuk transformasi yang berguna ketika Anda mengantisipasi data Anda akan mengikuti beberapa distribusi tertentu.
sumber
Pilihan sederhana adalah menggunakan jumlah skor alih-alih skor itu sendiri. Jumlah distribusi cenderung normal. Misalnya, dalam Pendidikan Anda dapat menambahkan skor siswa di atas serangkaian tes.
Pilihan lain, tentu saja, adalah menggunakan teknik yang tidak menganggap normal, yang dianggap remeh dan kurang dimanfaatkan.
sumber
Sekarang sebagai transformasi data, ini menjadi menarik karena transformasi bersifat bijective (hampir bijective untuk kasus miring) dan dapat diperoleh secara eksplisit menggunakan fungsi Lambert's W (maka nama Lambert W x F). Ini berarti kita dapat menghapus kemiringan dari data dan juga menghilangkan ekor yang berat (secara objektif!).
Anda dapat mencobanya menggunakan paket LambertW R, dengan manual yang menunjukkan banyak contoh cara menggunakannya.
Untuk aplikasi lihat posting ini
sumber