Apa perbedaan utama antara analisis Taxometrik (misalnya, MAXCOV, MAXEIG) dan analisis Kelas Laten?

8

Penelitian terbaru telah berusaha untuk menentukan apakah konstruksi psikologis tertentu adalah dimensi laten atau taksononik (yaitu, termasuk takson atau kelas). Sebagai contoh, para peneliti mungkin tertarik untuk mencari tahu apakah ada "kelas" tertentu dari orang-orang yang lebih mungkin mengembangkan nyeri kronis setelah cedera, atau jika risiko mengembangkan nyeri kronis dikonseptualisasikan dengan lebih baik sebagai dimensi mulai dari risiko terbatas hingga risiko yang sangat tinggi. Saya perhatikan bahwa para peneliti mencoba menjawab jenis pertanyaan ini menggunakan dua jenis analisis: Analisis taksometrik (MAMBAC, MAXEIG, MAXCOV) biasanya dilakukan dalam analisis R, dan analisis Kelas Laten.

Berikut adalah beberapa contoh studi taksometrik:

Berikut adalah beberapa contoh menggunakan analisis Kelas Laten:

Ini pertanyaan saya:

  1. Dalam bahasa Inggris, apa perbedaan utama antara kedua jenis analisis ini? Jika memungkinkan, uraikan jika mereka menjawab pertanyaan yang berbeda dan bagaimana mereka secara analitik (matematis) berbeda.

  2. Yang mana yang lebih baik untuk menjawab jenis pertanyaan yang saya soroti dalam "pengantar" saya, dan mengapa? Mungkin ini benar-benar tidak dapat dijawab pada saat ini.

Tolong juga bagikan informasi apa pun yang Anda rasa mungkin relevan dengan topik ini. Saya punya perasaan saya akan memiliki pertanyaan lanjutan!

Behacad
sumber

Jawaban:

7

Lihat Tueller (2010) , Tueller dan Lubke (2010) , dan [Ruscio et al.'l book] [3] untuk detail lengkap tentang apa yang dirangkum di bawah ini. Prosedur taksometrik umumnya bekerja dengan menghitung statistik sederhana pada himpunan bagian data yang diurutkan. MAMBAC menggunakan nilai tengah, MAXCOV menggunakan nilai kovarians, dan MAXEIG menggunakan nilai eigen. Analisis kelas laten adalah kasus khusus dari model campuran variabel laten umum (LVMM). LVMM menentukan model untuk data yang mungkin termasuk kelas laten, faktor laten, atau keduanya. Parameter model diperoleh dengan menggunakan kemungkinan maksimum atau perkiraan Bayesian. Lihat literatur di atas untuk detail lengkap.

Yang lebih penting bahwa dasar-dasar matematika (yang berada di luar ruang lingkup forum ini) adalah hipotesis yang dapat diuji di bawah setiap pendekatan. Prosedur taksometrik menguji hipotesis

H1: Dua kelas menjelaskan semua (atau sebagian besar) korelasi yang diamati di antara sekumpulan indikator H0: Satu (atau lebih) dimensi yang mendasari kontinu menjelaskan semua korelasi yang diamati di antara sekumpulan indikator

Biasanya CCFI digunakan untuk memastikan hipotesis mana yang akan ditolak / dipertahankan. Lihat [buku John Ruscio tentang topik] [4]. Prosedur taksometrik hanya dapat menguji dua hipotesis ini dan tidak ada yang lain.

Digunakan sendiri, analisis kelas laten tidak dapat menguji hipotesis alternatif taksometrik, H0 di atas. Namun, analisis kelas laten dapat menguji hipotesis alternatif berikut:

H1a: Dua kelas menjelaskan semua korelasi yang diamati di antara seperangkat indikator H1b: Tiga kelas menjelaskan semua korelasi yang diamati di antara seperangkat indikator ... H1k: k kelas menjelaskan semua korelasi yang diamati di antara serangkaian indikator

Untuk menguji H0 dari atas dalam kerangka variabel laten, muat model analisis faktor konfirmatori faktor tunggal (CFA) ke data (sebut H0cfa ini yang berbeda dari H0 - H0 hanya menguji hipotesis kecocokan di bawah kerangka taksometrik, tetapi tidak t menghasilkan estimasi parameter seperti yang Anda dapatkan dengan memasang model CFA). Untuk membandingkan H0cfa dengan H1a, H1b, ..., H1k, gunakan Bayesian Information Criterion (BIC) ala [Nylund et al. (2007)] [5].

Untuk meringkas sejauh ini, prosedur taksometrik dapat melihat solusi dua vs satu kelas, sedangkan kelas laten + CFA dapat menguji satu vs dua atau lebih solusi kelas. Kita melihat bahwa prosedur taksometrik menguji sebagian hipotesis yang diuji dengan perbandingan model laten + CFA.

Semua hipotesis yang ada sejauh ini ekstrem di dua ujung spektrum. Hipotesis yang lebih umum adalah bahwa sejumlah kelas laten dan beberapa dimensi laten (atau faktor laten) paling baik menjelaskan data. Pendekatan yang dijelaskan di atas menolak hal ini, yang merupakan asumsi yang sangat kuat. Dengan kata lain, model kelas laten dan prosedur taksometrik yang mengarah pada kesimpulan struktur taksonik (bukan dimensi) diasumsikan dalam perbedaan individu kelas selain kesalahan acak. Dalam konteks Anda, ini sama dengan mengatakan bahwa dalam kelas nyeri kronis, tidak ada variasi sistematis dalam kecenderungan untuk mengembangkan nyeri kronis, hanya peluang acak.

Kelemahan dari asumsi ini lebih baik diilustrasikan dengan contoh dari psikopatologi. Katakanlah Anda memiliki serangkaian indikator untuk depresi, dan model taksometrik dan / atau kelas laten Anda membuat Anda menyimpulkan ada kelas yang tertekan dan kelas yang tidak tertekan. Model-model ini secara implisit mengasumsikan tidak ada perbedaan tingkat keparahan depresi di dalam kelas (di luar kesalahan acak atau kebisingan). Dengan kata lain, Anda mengalami depresi, atau tidak, dan di antara yang tertekan, semua orang sama-sama tertekan (di luar variasi dalam variabel yang rentan kesalahan yang diamati). Jadi kita hanya perlu satu perawatan untuk depresi pada satu tingkat dosis! Dapat dengan mudah dilihat bahwa asumsi ini tidak masuk akal untuk depresi, dan seringkali sama terbatasnya untuk sebagian besar konteks penelitian lainnya.

Untuk menghindari membuat asumsi ini, gunakan pendekatan pemodelan campuran faktor mengikuti makalah [Lubke dan Muthen dan Lubke dan Neale] [6].

stueller
sumber
(+1) Selamat datang di situs kami dan terima kasih telah berkontribusi atas jawaban yang berkembang dengan baik!
whuber
Wow! Saya hampir merasa seolah-olah Anda mendaftar hanya untuk menjawab pertanyaan ini. Terima kasih, sangat jelas. Bisakah Anda menguraikan cara untuk menghindari keterbatasan yang Anda soroti? Saya menganggap itu ada hubungannya dengan invarian yang lemah (dan sejenisnya)? Program yang saya gunakan memiliki kapasitas untuk membuat varians kesalahan independen, kovariansi kesalahan independen, dan efek faktor independen. Saya punya perasaan ini mungkin arah yang benar, tetapi karena terminologi yang berbeda sulit untuk memastikan.
Behacad