Apa yang harus dilakukan ketika beberapa titik waktu memiliki tanggapan yang sangat miring dan beberapa tidak dalam studi tindakan berulang?

Biasanya, ketika seseorang menjumpai ukuran hasil yang kontinu tetapi condong dalam desain longitudinal (katakanlah, dengan satu efek antar-subjek) pendekatan yang umum adalah mengubah hasilnya menjadi normal. Jika situasinya ekstrem, seperti dengan pengamatan terpotong, orang mungkin menyukai dan menggunakan model kurva pertumbuhan Tobit, atau semacamnya.

Tetapi saya bingung ketika saya melihat hasil yang biasanya didistribusikan pada titik waktu tertentu dan kemudian sangat condong ke orang lain; transformasi mungkin menyumbat satu kebocoran tetapi memunculkan lainnya. Apa yang mungkin Anda sarankan dalam kasus seperti itu? Apakah ada versi "non-parametrik" model efek campuran yang tidak saya sadari?

Catatan: contoh yang diterapkan adalah skor tes pengetahuan sebelum / sesudah serangkaian intervensi pendidikan. Skor mulai normal tetapi kemudian mengelompok di ujung atas skala nanti.

repeated-measures data-transformation skewness Brenden Dufault
sumber

Contohnya menarik karena terjadi setiap saat. Ada beberapa transformasi terkenal untuk menghadapinya, seperti transformasi kekuatan "lipatan" Tukey. Ini membuat sedikit perubahan di tengah skala namun menyembuhkan kemiringan di kedua ujungnya. Saya telah menemukan bahwa root yang dilipat dan log bekerja sangat baik untuk perbandingan pra / post test terstandarisasi.

whuber

Terima kasih, Whuber . Saya akan melihat pendekatan transformasi terlipat.

Brenden Dufault

Untuk definisi dan contoh, Brenden, lihat stats.stackexchange.com/a/10979 . Untuk instruksi tentang penggunaannya, lihat beberapa bab terakhir dalam buku Tukey EDA .

whuber

Catatan tambahan - ingat bahwa asumsi dibuat tentang residual model, bukan variabel aktual yang terlibat.

Peter Flom - Reinstate Monica

Jawaban:

Dengan asumsi bahwa masalah terjadi pada residu Anda (karena distribusi variabel hasil itu sendiri biasanya bukan masalah), saya akan mencari untuk menyelidiki penyebab masalah daripada mencoba untuk "memperbaikinya" melalui transformasi atau aplikasi dari model nonparametrik.

Jika memang ada kecenderungan (misalnya, semakin atau semakin normal), atau, jeda yang jelas antara ketika berubah dari normal menjadi tidak normal, maka ini menunjukkan "perubahan rezim" semacam di data Anda (yaitu, mekanisme menghasilkan data berubah dari waktu ke waktu) atau beberapa jenis masalah variabel yang hilang.

Jika tidak ada pola yang jelas (misalnya, periode waktu 1 dan 3 terlihat normal dan periode 2 dan 4 tidak) saya akan mencari dengan sangat hati-hati untuk masalah integritas data.

Cara sederhana untuk memeriksa apakah Anda memang memiliki perubahan rezim adalah dengan memperkirakan model hanya menggunakan periode waktu "normal" dan kemudian memperkirakan kembali menggunakan periode waktu lainnya dan melihat perbedaan apa yang terjadi. Pendekatan yang lebih rumit adalah dengan menggunakan model kelas laten, mungkin dengan waktu sebagai variabel bersamaan.

Mengenai pertanyaan Anda tentang model efek campuran nonparametrik, itu tergantung pada apa yang Anda maksud dengan nonparametrik. Jika Anda bermaksud model yang tidak mengasumsikan variabel dependen numerik maka ada banyak model seperti itu (misalnya, LIMDEP memiliki cukup banyak). Juga, perlu diingat bahwa pelanggaran terhadap asumsi normalitas mungkin hanya akan bermasalah dari perspektif inferensi jika ukuran sampel Anda kecil. Salah satu cara untuk menyelidiki ini adalah dengan mencoba berbagai transformasi yang dibahas dalam komentar dan jawaban lain dan melihat apakah itu berdampak besar pada kesimpulan Anda.

Tim
sumber

+1 Terima kasih, Tim. Saya menghargai saran Anda mengenai model kelas laten dan LIMDEP. Pendekatan-pendekatan ini semakin menarik bagi saya ketika saya mulai belajar lebih banyak tentang mereka.

Brenden Dufault

Ada transformasi Box-Cox yang menaikkan variabel ke power lambda di mana lambda termasuk dalam estimasi parameter model. Saya tidak terbiasa dengan transformasi kekuatan Tukey yang terlipat, jadi saya tidak tahu apakah kita berbicara tentang hal yang sama. Dalam orde untuk memperkirakan lambda, Anda perlu beberapa poin di pas. Apakah Anda ingin menyesuaikan distribusi yang berbeda pada setiap titik waktu di mana distribusi ditentukan pada serangkaian subjek yang mengikuti tes pada setiap titik waktu? Bahkan jika itu masalahnya jika Anda tahu bahwa beberapa titik waktu harus memiliki distribusi yang sama Anda mungkin ingin menggabungkan mereka dalam satu pas.

Pendekatan lain yang nonparametrik dan tidak melibatkan transformasi normal adalah dengan menerapkan bootstrap pada setiap titik waktu atau pada setiap set titik waktu gabungan.

Michael R. Chernick
sumber