Apakah transformasi log merupakan teknik yang valid untuk menguji-t data yang tidak normal?

19

Dalam meninjau sebuah makalah, penulis menyatakan, "Variabel hasil kontinyu yang menunjukkan distribusi miring diubah, menggunakan logaritma alami, sebelum uji t dilakukan untuk memenuhi asumsi prasyarat normalitas."

Apakah ini cara yang dapat diterima untuk menganalisis data yang tidak normal, terutama jika distribusi yang mendasarinya tidak selalu lognormal?

Ini mungkin pertanyaan yang sangat bodoh, tetapi saya belum pernah melihat ini dilakukan sebelumnya ....

CLS
sumber
3
Nah, jika distribusi awal tidak log-normal, maka data yang diubah tidak memenuhi asumsi prasyarat normalitas, jadi apa yang diperoleh dengan transformasi?
Makro
@ Macro - cukup benar! (+1) - mereka mungkin hanya ingin mendapatkan distribusi yang lebih dekat ke simetris, yang bukan hal buruk yang ingin dilakukan untuk pengujian-t, tetapi, kecuali mereka memeriksa dan menulisnya, kita tidak tahu apakah log Transformasi menyebabkan kemiringan negatif yang mungkin membuat segalanya lebih buruk ...
jbowman
2
Kita dapat menyimpulkan bahwa karena itu dilakukan untuk memenuhi normalitas, dan normalitas diperiksa di tempat pertama, normalitas diperiksa sesudahnya. Ini sangat tersirat dalam bahasa di sini.
John
10
Uji-t untuk logaritma tidak sama dengan uji-t untuk data yang tidak diubah atau uji nonparametrik. Uji-t pada log membandingkan rata-rata geometrik , bukan rata-rata (biasanya). Ini adalah salah satu dari beberapa pertimbangan penting dalam memutuskan apakah menggunakan logaritma dapat diterima (bisa jadi, tergantung pada aplikasi).
whuber

Jawaban:

9

Adalah umum untuk mencoba menerapkan semacam transformasi ke normalitas (menggunakan misalnya logaritma, akar kuadrat, ...) ketika ditemui dengan data yang tidak normal. Sementara logaritma menghasilkan hasil yang baik untuk data yang miring sering, tidak ada jaminan bahwa itu akan bekerja dalam kasus khusus ini. Kita juga harus memperhatikan komentar @whubers di atas ketika menganalisis data yang diubah: "Uji-t untuk logaritma juga tidak sama dengan uji-t untuk data yang tidak diubah atau tes nonparametrik. Uji-t pada log membandingkan geometri berarti, bukan berarti aritmatika (biasa). "

n-1saya=1n(xsaya-x¯)3(n-1saya=1n(xsaya-x¯)2)3/2

Daripada memilih transformasi (seperti logaritma) karena ia berfungsi sebagian besar waktu, saya lebih suka menggunakan prosedur Box-Cox untuk memilih transformasi menggunakan data yang diberikan. Namun ada beberapa masalah filosofis dengan ini; khususnya apakah ini akan memengaruhi jumlah derajat kebebasan dalam uji-t, karena kami telah menggunakan beberapa informasi dari sampel ketika memilih transformasi mana yang akan digunakan.

Akhirnya, alternatif yang baik untuk menggunakan baik uji-t setelah transformasi atau uji nonparametrik klasik adalah dengan menggunakan analog bootstrap dari uji-t. Itu tidak memerlukan asumsi normalitas dan merupakan ujian tentang cara-cara yang tidak diubah (dan bukan tentang hal lain).

MånsT
sumber
1
+1 Diskusi yang bagus dan bijaksana dengan rekomendasi yang bagus di bagian akhir. Untuk informasi lebih lanjut tentang tes-bootstrap / resampling / permutasi, silakan lihat utas terbaru di stats.stackexchange.com/q/24911 .
whuber
0

Secara umum jika asumsi yang diperlukan untuk melakukan uji-t tidak terpenuhi, maka akan lebih tepat untuk menggunakan tes non-parametrik.

pengguna7045
sumber
5
Mungkin. Tes non-parametrik hampir selalu membandingkan median (atau persentil lainnya) daripada sarana dan karena itu benar-benar mengatasi pertanyaan yang sedikit berbeda. Tapi ini sepertinya bukan jawaban yang membantu untuk pertanyaan saat ini, yang menanyakan secara khusus (dan hanya) tentang t-menguji log data.
Whuber