Apakah akan menggunakan pemodelan persamaan struktural untuk menganalisis studi observasional dalam psikologi

20

Saya perhatikan masalah ini banyak muncul dalam pengaturan konsultasi statistik dan saya ingin sekali mendapatkan pemikiran Anda.

Konteks

Saya sering berbicara dengan mahasiswa riset yang telah melakukan studi kira-kira sebagai berikut:

  • Studi observasional
  • Ukuran sampel mungkin 100, 200, 300, dll.
  • Berbagai skala psikologis telah diukur (misalnya, mungkin kecemasan, depresi, kepribadian, sikap, skala klinis lainnya, mungkin kecerdasan, dll.)

Para peneliti telah membaca literatur yang relevan dan memiliki beberapa pemikiran tentang kemungkinan proses sebab akibat. Seringkali akan ada beberapa konseptualisasi umum variabel menjadi anteseden, variabel proses, dan variabel hasil. Mereka juga sering mendengar bahwa pemodelan persamaan struktural lebih tepat untuk menguji keseluruhan model hubungan antara set variabel yang mereka pelajari.

Pertanyaan

  • Menurut kondisi apa menurut Anda pemodelan persamaan struktural adalah teknik yang tepat untuk menganalisis studi tersebut?
  • Jika Anda tidak akan merekomendasikan pemodelan persamaan struktural, teknik alternatif apa yang akan Anda rekomendasikan?
  • Apa saran yang akan Anda berikan kepada peneliti mempertimbangkan menggunakan pemodelan persamaan struktural dalam kasus seperti itu?
Jeromy Anglim
sumber

Jawaban:

14

Penafian saya : Saya menyadari pertanyaan ini tidak aktif selama beberapa waktu, tetapi tampaknya ini penting, dan yang Anda maksudkan untuk mendapatkan banyak tanggapan. Saya seorang Psikolog Sosial, dan dari suaranya, mungkin sedikit lebih nyaman dengan desain seperti itu daripada Henrik (meskipun kekhawatirannya tentang interpretasi kausal benar-benar sah).

Dibawah Kondisi Apa SEM Merupakan Teknik Analisis Data yang Tepat?

Bagi saya, pertanyaan ini sebenarnya ada pada dua sub-pertanyaan yang berbeda:

  1. Mengapa menggunakan SEM?
  2. Jika seorang peneliti telah memutuskan untuk menggunakan SEM, apa persyaratan terkait data untuk menggunakan SEM?

Mengapa menggunakan SEM?

SEM adalah pendekatan yang lebih bernuansa dan rumit - dan karenanya kurang dapat diakses - untuk analisis data dibandingkan pendekatan pemodelan linear umum lainnya (misalnya, ANOVA, korelasi, regresi, dan ekstensi mereka, dll.). Apa pun yang dapat Anda pikirkan untuk dilakukan dengan pendekatan itu, Anda dapat melakukannya dengan SEM.

Karena itu, saya pikir para calon pengguna harus terlebih dahulu mengevaluasi dengan kuat mengapa mereka terpaksa menggunakan SEM. Yang pasti, SEM menawarkan beberapa manfaat yang kuat bagi penggunanya, tetapi saya telah meninjau makalah di mana tidak ada manfaat yang digunakan, dan produk akhir adalah bagian analisis data dalam makalah yang tentu saja lebih sulit bagi pembaca biasa untuk memahami . Hanya saja tidak sebanding dengan masalahnya - untuk peneliti, atau pembaca - jika manfaat dari SEM vs pendekatan analisis data lainnya tidak sedang menuai.

Jadi apa yang saya lihat sebagai manfaat utama dari pendekatan SEM? Yang besar menurut saya adalah:

(1) Pemodelan variabel laten : SEM memungkinkan pengguna untuk memeriksa hubungan struktural (varian, kovarian / korelasi, regresi, perbedaan rata-rata kelompok) di antara variabel laten yang tidak teramati, yang pada dasarnya adalah kovarians bersama antara sekelompok variabel (misalnya, item dari kegelisahan ukur yang mungkin digunakan siswa Anda).

Titik penjualan besar untuk menganalisis variabel laten (misalnya, kecemasan laten) vs skor konstruksi yang diamati (misalnya, rata-rata item kecemasan) adalah bahwa variabel laten bebas kesalahan - variabel laten dibentuk dari kovarians bersama, dan kesalahan berteori menjadi kovari tanpa apa pun. Ini berarti peningkatan daya statistik, karena pengguna tidak perlu lagi khawatir tentang pengukuran yang tidak dapat diandalkan, melemahkan efek yang mereka coba modelkan.

Alasan lain, lebih bersahaja, untuk mempertimbangkan menggunakan SEM adalah dalam beberapa kasus itu adalah cara yang lebih konstruk untuk menguji teori kita tentang konstruk. Jika siswa Anda, misalnya, menggunakan tiga ukuran kecemasan yang berbeda, bukankah akan lebih baik untuk memahami penyebab / konsekuensi dari kesamaan ketiga ukuran tersebut - mungkin kecemasan - dalam kerangka SEM, alih-alih mengistimewakan khususnya salah satu ukuran sebagai satu ukuran kecemasan?

(2) Pemodelan beberapa variabel dependen: Bahkan jika seseorang tidak akan menggunakan SEM untuk memodelkan variabel laten, itu masih bisa sangat berguna sebagai kerangka kerja untuk secara bersamaan menganalisis berbagai variabel hasil dalam satu model. Misalnya, mungkin siswa Anda tertarik untuk mengeksplorasi bagaimana prediktor yang sama dikaitkan dengan sejumlah hasil yang relevan secara klinis (misalnya, kecemasan, depresi, kesepian, harga diri, dll.). Mengapa menjalankan empat model terpisah (meningkatkan tingkat kesalahan Tipe I), ketika Anda bisa menjalankan satu model untuk keempat hasil yang Anda minati? Ini juga merupakan alasan untuk menggunakan SEM ketika berhadapan dengan tipe tertentu dari data dependen, di mana banyak, responden dependen dapat menghasilkan respons prediktor dan hasil (misalnya, data diad; lihat Kenny, Kashy, dan Cook, 2006,

(3) Memodelkan asumsi, alih-alih membuatnya : Dengan banyak pendekatan lain untuk analisis data (misalnya, ANOVA, korelasi, regresi), kami membuat satu ton asumsi tentang sifat-sifat data yang kami hadapi - seperti homogenitas dari varian / homoskedastisitas. SEM (biasanya dikombinasikan dengan pendekatan variabel laten) memungkinkan pengguna untuk benar-benar memodelkan parameter varians secara bersamaan di samping sarana dan / atau korelasi / jalur regresif. Ini berarti bahwa pengguna dapat mulai berteori tentang dan menguji hipotesis tentang variabilitas, di samping perbedaan rata-rata / kovariabilitas, alih-alih hanya memperlakukan variabilitas sebagai asumsi yang berkaitan dengan asumsi yang berkaitan setelah itu.

Asumsi lain yang dapat diuji, ketika membandingkan tingkat rata-rata kelompok pada beberapa variabel, adalah apakah variabel itu benar-benar berarti hal yang sama untuk setiap kelompok - disebut sebagai invarian pengukuran dalam literatur SEM (lihat Vandenberg & Lance, 2000, untuk tinjauan proses ini ). Jika demikian, maka perbandingan tingkat rata-rata dari variabel itu valid, tetapi jika kelompok memiliki pemahaman yang sangat berbeda tentang apa sesuatu itu, membandingkan tingkat rata-rata antara kelompok dipertanyakan. Kami membuat asumsi khusus ini secara implisit sepanjang waktu dalam penelitian menggunakan perbandingan kelompok.

Dan kemudian ada asumsi, bahwa ketika Anda rata-rata atau menjumlahkan skor item (misalnya, pada ukuran kecemasan) untuk membuat indeks agregat, bahwa setiap item adalah ukuran yang sama baiknya dari konstruk yang mendasarinya (karena setiap item ditimbang sama rata dalam rata-rata / jumlah). SEM menghilangkan asumsi ini ketika variabel laten digunakan, dengan memperkirakan nilai loading factor yang berbeda (hubungan antara item dan variabel laten) untuk setiap item.

Terakhir, asumsi lain tentang data (misalnya, normalitas), meskipun masih penting untuk SEM, dapat dikelola (misalnya, melalui penggunaan estimator "kuat", lihat Finney & DiStefano, 2008) ketika data gagal memenuhi kriteria tertentu (tingkat kemiringan dan kurtosis rendah).

(4) Menentukan batasan model: Alasan besar terakhir, menurut pendapat saya, untuk mempertimbangkan menggunakan SEM, adalah karena membuatnya sangat mudah untuk menguji hipotesis tertentu yang mungkin Anda miliki tentang model data Anda, dengan memaksa ("membatasi" dalam istilah SEM) jalur tertentu dalam model Anda untuk mengambil nilai-nilai tertentu, dan memeriksa bagaimana hal itu berdampak pada kecocokan model Anda dengan data Anda. Beberapa contoh termasuk: (A) membatasi jalur regresi ke nol, untuk menguji apakah perlu dalam model; (B) yang mengandung jalur regresi berganda sama besarnya (misalnya, apakah kekuatan asosiatif untuk beberapa prediktor kira-kira sama untuk kecemasan dan depresi?); (C) membatasi parameter pengukuran yang diperlukan untuk mengevaluasi invarian pengukuran (dijelaskan di atas); (D) membatasi jalur regresi untuk memiliki kekuatan yang sama antara dua kelompok yang berbeda,

Apa persyaratan terkait data untuk SEM?

Persyaratan terkait data untuk SEM cukup sederhana; Anda memerlukan ukuran sampel yang memadai, dan agar data Anda memenuhi asumsi penduga model yang telah Anda pilih (Maksimum-Kemungkinan adalah tipikal).

Sulit untuk memberikan rekomendasi satu ukuran untuk semua ukuran sampel. Berdasarkan beberapa simulasi langsung, Little (2013) menunjukkan bahwa untuk model yang sangat sederhana, 100-150 pengamatan mungkin cukup, tetapi kebutuhan ukuran sampel akan meningkat ketika model menjadi lebih kompleks, dan / atau sebagai keandalan / validitas dari variabel yang digunakan dalam model berkurang. Jika kompleksitas model menjadi perhatian, Anda dapat mempertimbangkan mem-parsing indikator variabel laten Anda, tetapi tidak semua setuju dengan pendekatan ini (Little, Cunningham, Shahar, & Widaman, 2002). Tapi secara umum, semua sama, sampel yang lebih besar (saya berusaha untuk minimum 200 dalam penelitian saya sendiri) lebih baik.

Sedangkan untuk memenuhi asumsi estimator yang dipilih, biasanya ini cukup mudah untuk dinilai (misalnya, lihat nilai skewness dan kurtosis untuk estimator kemungkinan maksimum). Dan bahkan jika data berangkat dari properti yang diasumsikan, sebuah penelitian dapat mempertimbangkan penggunaan penaksir "kuat" (Finney & DiStefano, 2008), atau penaksir yang mengasumsikan jenis data yang berbeda (misalnya, penaksir kategori, seperti penaksir berbobot paling sedikit secara diagonal). kotak).

Alternatif Untuk SEM untuk Analisis Data?

Jika seorang peneliti tidak akan mengambil keuntungan dari manfaat yang diberikan oleh pendekatan SEM yang telah saya soroti di atas, saya akan merekomendasikan tetap berpegang pada versi analisis yang lebih mudah dan mudah diakses itu (e..g, t -test, ANOVA, analisis korelasi, model regresi [termasuk mediasi, moderasi, dan model proses bersyarat]). Pembaca lebih akrab dengan mereka, dan karenanya akan lebih mudah memahaminya. Tidak ada gunanya membingungkan pembaca dengan hal-hal kecil dari SEM jika pada dasarnya Anda menggunakan SEM dengan efek yang sama dengan pendekatan analitik yang lebih sederhana.

Saran untuk Peneliti Mengingat Penggunaan SEM?

Bagi mereka yang baru mengenal SEM:

  1. Dapatkan teks SEM pondasi yang komprehensif dan dapat diakses secara tertulis. Saya suka Beaujean (2014), Brown (2015; edisi sebelumnya juga solid), dan Little (2013; pengantar keseluruhan yang baik, meskipun kemudian berfokus secara khusus pada model longitudinal).
  2. Pelajari cara menggunakan lavaanpaket untuk R(Rosseel, 2012). Sintaksnya semudah sintaks SEM, fungsinya cukup luas untuk kebutuhan SEM banyak orang (pasti untuk pemula), dan gratis. Buku Beaujean memberikan pengantar yang bagus untuk SEM dan lavaanpaket.
  3. Konsultasikan / gunakan CrossValidated dan StacksOverflow secara teratur. Hal-hal yang tidak terduga dapat terjadi ketika memasang model SEM, dan kemungkinannya, banyak hal aneh yang mungkin Anda alami telah dijelaskan dan bermasalah di Stacks.
  4. Seperti yang ditunjukkan oleh Herik, perhatikan bahwa hanya karena Anda menentukan model yang menyiratkan hubungan sebab-akibat, itu tidak berarti bahwa SEM membantu membangun hubungan sebab-akibat dalam studi cross-sectional / non-eksperimental. Selain itu, sangat layak mempertimbangkan penggunaan SEM untuk menganalisis data dari desain longitudinal dan / atau eksperimental.

Dan bagi mereka yang mulai benar-benar menggunakan SEM:

  1. Anda akan, pada suatu saat, tergoda untuk menentukan residu yang berkorelasi mau tak mau, dalam upaya untuk meningkatkan kesesuaian model Anda. Jangan. Setidaknya bukan tanpa alasan a priori yang bagus . Lebih sering daripada tidak, sampel yang lebih besar, atau model yang lebih sederhana adalah obatnya.
  2. Hindari penggunaan metode identifikasi variabel-penanda untuk variabel laten (yaitu, memperbaiki pemuatan faktor pertama ke 1). Ini istimewa bahwa indikator sebagai indikator "standar emas" dari variabel laten Anda, ketika dalam kebanyakan kasus, tidak ada alasan untuk menganggap ini adalah masalahnya. Ketahuilah bahwa ini adalah pengaturan identifikasi default di sebagian besar program.

Referensi

Beaujean, AA (2014). Pemodelan variabel laten menggunakan R: Panduan langkah demi langkah . New York, NY: Routledge.

Brown, TA (2015). Analisis faktor konfirmasi untuk peneliti terapan (edisi ke-2). New York, NY: Guilford Press.

Finney, SJ, & DiStefano, C. (2008). Data non-normal dan kategorikal dalam pemodelan persamaan struktural. Dalam GR Hancock & RD Mueller (Eds.), Pemodelan persamaan struktural: Kursus kedua (hal. 269-314). Penerbitan Era Informasi.

Kenny, DA, Kashy, DA, & Cook, WL (2006). Analisis data diad . New York, NY: Guilford Press.

Little, TD (2013). Pemodelan persamaan struktural longitudinal . New York, NY: Guilford Press.

Little, TD, Cunningham, WA, Shahar, G., & Widaman, KF (2002). Untuk membagi atau tidak membagi: Menjelajahi pertanyaan, menimbang manfaat. Pemodelan Persamaan Struktural , 9 , 151-173.

Rosseel, Y. (2012). lavaan: Paket R untuk pemodelan persamaan struktural. Jurnal Perangkat Lunak Statistik , 48 (2), 1-36.

Vandenberg, RJ, & Lance, CE (2000). Tinjauan dan sintesis literatur invarian pengukuran: Saran, praktik, dan rekomendasi untuk peneliti organisasi. Metode Penelitian Organisasi , 3 , 4-70.

jsakaluk
sumber
1
+1 jawaban yang bagus. Saya menantikan kontribusi Anda yang lain!
Momo
1
+1 Jawaban bagus. Saya setuju dengan sebagian besar dari apa yang Anda katakan. Satu titik tindak lanjut: Saya tidak berpikir SEM memiliki kekuatan statistik yang lebih besar karena memperkirakan hubungan antara variabel laten. Secara umum, saya akan berpikir bahwa jika SEM memperkenalkan sumber kesalahan tambahan. Dengan demikian, ada kesalahan umum dalam memperkirakan variabel yang diamati, dan kesalahan tambahan dalam memperkirakan varians kesalahan atau elemen lain dari struktur laten.
Jeromy Anglim
Saya masing-masing akan mempertahankan bahwa SEM, dengan pemodelan kesalahan dalam faktor-faktor unik, memang, pada kenyataannya, meningkatkan daya. Hal ini dapat paling mudah ditunjukkan, saya pikir, dengan membandingkan model SEM perbedaan kelompok dalam cara laten dengan model perbedaan rerata yang diamati. data yang sama. Jika Anda menjalankan SEM menggunakan pendekatan pengkodean efek (lihat Little, Slegers, & Card, 2006), sarana laten Anda untuk setiap grup akan memiliki nilai yang sama dengan sarana yang Anda amati. Tetapi varians untuk setiap kelompok dalam model SEM akan lebih kecil dari pada yang diamati, memberikan ukuran efek yang lebih besar yang lebih mudah untuk dideteksi.
jsakaluk
Saya menyadari komentar di atas mungkin bukan cara terbaik untuk menanggapi kekhawatiran Anda; jika Anda mengajukan pertanyaan terpisah tentang SEM dan menyalakan CV, dengan senang hati saya akan mengirim jawaban yang lebih rumit, dengan beberapa contoh keluaran yang bisa membantu.
jsakaluk
12

Penafian: Saya menganggap diri saya seorang psikolog berpengalaman dengan penekanan pada eksperimen. Karenanya, saya merasa tidak nyaman alami dengan desain seperti ini.

Untuk menjawab pertanyaan pertama dan kedua Anda: Saya pikir untuk desain seperti ini SEM atau, tergantung pada jumlah variabel yang terlibat, analisis mediasi atau moderasi adalah cara alami untuk menangani data. Saya tidak tahu harus merekomendasikan apa lagi.

Untuk pertanyaan ketiga Anda: Saya pikir keunggulan utama dengan desain seperti ini adalah kerugian utamanya. Yaitu bahwa Anda (diberi variabel yang cukup) akan menemukan hasil yang signifikan. Pertanyaannya adalah, bagaimana Anda menafsirkan hasil ini.

Artinya, Anda dapat melihat begitu banyak hipotesis (beberapa lagi beberapa kurang terinspirasi oleh literatur yang relevan) bahwa Anda mungkin akan menemukan sesuatu yang signifikan (bukan dalam arti harfiah menolak SEM) yang akan dapat ditafsirkan dalam arti psikologis. Oleh karena itu, saran saya kepada siapa pun yang melakukan ini ada dua:

  1. Tekankan masalah dengan interpretasi kausal dari desain ini. Saya bukan ahli dalam hal ini tetapi tahu, bahwa desain cross-sectional sepenuhnya sulit ditafsirkan kausal, terlepas dari bagaimana secara intuitif masuk akal yang mungkin terdengar. Desain yang lebih maju seperti desain pnael lintas-tertinggal atau hal-hal seperti ini diperlukan untuk interpetasi kausal. Saya pikir karya Shadish, Cook & Campbell (atau setidaknya beberapa di antaranya) adalah sumber daya yang bagus untuk diskusi lebih lanjut tentang topik-topik ini.
  2. Tekankan tanggung jawab individu dan etika ilmiah. Jika Anda melihat bahwa ide awal Anda tidak didukung oleh data, itu adalah langkah alami berikutnya untuk memeriksa data lebih lanjut. Namun, Anda tidak akan pernah bergantung pada HARKing (Hipotesis Setelah Hasilnya Diketahui; Kerr, 1998 , lihat juga Maxwell, 2004 ). Artinya, Anda harus menekankan bahwa ada garis tipis antara adaptasi yang wajar dari hipotesis Anda mengingat data dan memetik ceri hasil yang signifikan.
Henrik
sumber
1
dan Bernd: Ditto! Akronim yang bagus dan saya harap ini masuk akal.
rolando2