Saya tertarik untuk menerima saran tentang kapan harus menggunakan " skor faktor " dibandingkan jumlah skor saat membuat skala. Yaitu metode "Refined" daripada "non-refined" untuk menilai suatu faktor. Dari DiStefano et al. (2009; pdf ), penekanan ditambahkan:
Ada dua kelas utama metode perhitungan skor faktor: disempurnakan dan tidak disempurnakan. Metode non-rafinasi relatif sederhana, prosedur kumulatif untuk memberikan informasi tentang penempatan individu pada distribusi faktor. Kesederhanaan cocok untuk beberapa fitur menarik, yaitu, metode non-halus keduanya mudah untuk dihitung dan mudah diinterpretasikan. Metode perhitungan yang disempurnakan menciptakan skor faktor menggunakan pendekatan yang lebih canggih dan teknis. Mereka lebih tepat dan kompleks daripada metode yang tidak disempurnakan dan memberikan perkiraan yang merupakan skor terstandarisasi.
Menurut saya, jika tujuannya adalah untuk menciptakan skala yang dapat digunakan lintas studi dan pengaturan, maka jumlah sederhana atau skor rata-rata dari semua item skala masuk akal. Tetapi katakanlah tujuannya adalah untuk mengevaluasi efek pengobatan dari suatu program dan perbedaan penting ada di dalam sampel — kelompok perlakuan vs kelompok kontrol. Apakah ada alasan mengapa kita lebih suka skor faktor daripada menghitung jumlah atau rata-rata?
Agar nyata tentang alternatif, ambil contoh sederhana ini:
library(lavaan)
library(devtools)
# read in data from gist ======================================================
# gist is at https://gist.github.com/ericpgreen/7091485
# this creates data frame mydata
gist <- "https://gist.github.com/ericpgreen/7091485/raw/f4daec526bd69557874035b3c175b39cf6395408/simord.R"
source_url(gist, sha1="da165a61f147592e6a25cf2f0dcaa85027605290")
head(mydata)
# v1 v2 v3 v4 v5 v6 v7 v8 v9
# 1 3 4 3 4 3 3 4 4 3
# 2 2 1 2 2 4 3 2 1 3
# 3 1 3 4 4 4 2 1 2 2
# 4 1 2 1 2 1 2 1 3 2
# 5 3 3 4 4 1 1 2 4 1
# 6 2 2 2 2 2 2 1 1 1
# refined and non-refined factor scores =======================================
# http://pareonline.net/pdf/v14n20.pdf
# non-refined -----------------------------------------------------------------
mydata$sumScore <- rowSums(mydata[, 1:9])
mydata$avgScore <- rowSums(mydata[, 1:9])/9
hist(mydata$avgScore)
# refined ---------------------------------------------------------------------
model <- '
tot =~ v1 + v2 + v3 + v4 + v5 + v6 + v7 + v8 + v9
'
fit <- sem(model, data = mydata, meanstructure = TRUE,
missing = "pairwise", estimator = "WLSMV")
factorScore <- predict(fit)
hist(factorScore[,1])
sumber
They are more exact
Penekanan tambahan ini seharusnya tidak mengalihkan kita dari kenyataan bahwa bahkan skor faktor pun pasti tidak pasti ("tidak ditentukan")."more exact"
. Di antara skor faktor yang dihitung secara linear, metode regresi adalah yang paling "tepat" dalam arti "paling berkorelasi dengan nilai-nilai faktor benar yang tidak diketahui". Jadi ya, lebih tepat (dalam pendekatan aljabar linier), tetapi tidak sepenuhnya tepat.Jawaban:
Saya sendiri pernah bergulat dengan ide ini di beberapa proyek saat ini. Saya pikir Anda perlu bertanya pada diri sendiri apa yang diperkirakan di sini. Jika model satu faktor cocok, maka skor faktor memperkirakan faktor laten. Jumlah langsung atau rata-rata dari variabel manifes Anda memperkirakan sesuatu yang lain, kecuali jika setiap pengamatan memuat faktor yang sama, dan keunikannya juga sama. Dan sesuatu yang lain mungkin bukan jumlah yang menarik secara teoritis.
Jadi, jika model satu faktor cocok, Anda mungkin disarankan untuk menggunakan skor faktor. Saya mengambil poin Anda tentang perbandingan antar studi, tetapi dalam studi tertentu, saya pikir skor faktor memiliki banyak hal untuk mereka.
Yang menarik adalah ketika model satu faktor tidak cocok, baik karena model dua faktor berlaku (atau lebih tinggi), atau karena struktur kovarians lebih rumit daripada yang diprediksi oleh model faktor. Bagi saya, pertanyaannya adalah apakah total variabel mengacu pada sesuatu yang nyata. Ini terutama benar jika data memiliki lebih dari satu dimensi. Dalam praktiknya, yang sering terjadi adalah Anda memiliki banyak variabel terkait (item pada survei, mungkin), dengan satu atau dua di antaranya sangat berbeda dari yang lain. Anda bisa mengatakan, "Persetan dengan ini", dan ambil rata-rata dari segalanya, apa pun artinya. Atau Anda bisa mengikuti skor faktor. Jika Anda cocok dengan model satu faktor, yang biasanya akan terjadi, adalah bahwa analisis faktor akan menurunkan variabel yang kurang bermanfaat (atau setidaknya, variabel-variabel yang benar-benar berada pada skor faktor kedua). Akibatnya, ia melihat mereka sebagai milik dimensi yang berbeda dan mengabaikannya.
Jadi saya percaya bahwa skor faktor dapat memilah data untuk memberikan sesuatu yang lebih uni-dimensional daripada yang Anda mulai. Tapi saya tidak punya referensi untuk ini, dan saya masih mencoba mencari tahu dalam pekerjaan saya sendiri jika saya suka pendekatan ini. Bagi saya, bahaya besar adalah overfitting ketika Anda membajak skor ke model lain dengan data yang sama. Skor sudah menjadi jawaban untuk pertanyaan optimasi, jadi di mana itu meninggalkan sisa analisis? Aku benci berpikir.
Tetapi pada akhirnya, apakah jumlah atau total variabel benar-benar masuk akal jika sesuatu seperti model satu faktor tidak berlaku?
Banyak pertanyaan ini tidak akan muncul jika orang merancang skala yang lebih baik untuk memulai.
sumber
one-factor model
. Saya hanya ingin tahu mengapa. Apakah Anda mengatakan bahwa dalam model 2-faktor, skor faktor tidakestimate the latent factor
lagi? Kenapa begitu? Dan juga, bagaimana Anda mendefinisikan "model satu faktor" dalam konteks kuesioner yang sedang dikembangkan (konteks kemungkinan Q): adalah bahwa kuesioner tersebut merupakan faktor tunggal / skala atau bahwa setiap item yang dimasukkan dihitung dengan ketat hanya dimiliki oleh satu faktor /skala? Tolong, maukah Anda membuatnya lebih jelas?Penjumlahan atau rata-rata item yang dimuat oleh faktor umum adalah cara tradisional untuk memperhitungkan skor konstrust (konstruk yang mewakili faktor tha). Ini adalah versi paling sederhana dari "metode kasar" skor faktor komputasi ; Poin utama metode ini adalah menggunakan pemuatan faktor sebagai bobot skor. Sementara metode yang disempurnakan untuk menghitung skor menggunakan koefisien skor yang diperkirakan secara khusus (dihitung dari beban) sebagai bobot.
Jawaban ini tidak secara universal "menyarankan tentang kapan harus menggunakan skor faktor [disempurnakan] dibandingkan jumlah skor item biasa", yang merupakan domain luas, tetapi berfokus pada menunjukkan beberapa implikasi nyata yang konkret terjadi dengan memilih satu cara untuk memperhitungkan konstruksi di atas yang lain cara.
Pertimbangkan situasi sederhana dengan beberapa faktor dan dua item dimuat olehnya. Menurut Catatan Kaki 1 di sini menjelaskan bagaimana skor faktor dihitung, koefisien skor faktor dan untuk menghitung skor faktor berasal dariF b1 b2 F
c. Jika mereka berkorelasi kuat, item yang dimuat lebih lemah adalah duplikat junior dari yang lainnya. Apa alasan untuk menghitung indikator / gejala yang lebih lemah dalam keberadaan pengganti yang lebih kuat? Tidak banyak alasan. Dan skor faktor menyesuaikan untuk itu (sementara penjumlahan sederhana tidak). Perhatikan bahwa dalam kuesioner multifaktor, "item dengan muatan lebih lemah" seringkali merupakan item faktor lain, dimuat lebih tinggi di sana; sementara dalam faktor sekarang, item ini ditahan, seperti yang kita lihat sekarang, dalam perhitungan skor faktor, - dan itu berfungsi dengan benar.
b. Tetapi jika barang-barang, meskipun dimuat seperti sebelumnya, tidak berkorelasi kuat, maka itu adalah indikator / gejala yang berbeda bagi kami. Dan bisa dihitung "dua kali", yaitu baru dijumlahkan. Dalam hal ini, skor faktor mencoba untuk menghormati item yang lebih lemah sejauh pemuatannya masih memungkinkan, karena itu merupakan perwujudan faktor yang berbeda.
Sebuah. Dua item juga dapat dihitung dua kali, yaitu hanya dijumlahkan, setiap kali mereka memiliki jumlah yang sama, cukup tinggi, berdasarkan faktor, apa pun korelasi antara item-item ini. (Skor faktor menambah bobot pada kedua item ketika berkorelasi tidak terlalu ketat, namun bobotnya sama.) Tampaknya tidak masuk akal bahwa kita biasanya menoleransi atau menerima item yang cukup duplikat jika semuanya dimuat dengan kuat. Jika Anda tidak suka ini (kadang-kadang Anda mungkin ingin) Anda pernah bebas untuk menghilangkan duplikat dari faktor secara manual.
Jadi, dalam perhitungan skor faktor (disempurnakan) (dengan metode regresi setidaknya) ada intrik "bergaul / mendorong" di antara variabel-variabel yang membentuk konstruk, dalam pengaruhnya terhadap skor . Indikator yang sama kuatnya saling menoleransi, sama kuatnya dengan indikator yang tidak berkorelasi kuat. "Tutup mulut" muncul dari indikator yang lebih lemah berkorelasi kuat dengan indikator yang lebih kuat. Penambahan / rata-rata sederhana tidak memiliki intrik "mendorong duplikat yang lemah".
Silakan lihat juga jawaban ini yang memperingatkan bahwa faktor secara teoritis lebih merupakan "esensi di dalam" daripada kumpulan atau tumpukan fenomena indikatif "nya". Oleh karena itu secara membuta menyimpulkan item - tidak mengambil muatan atau korelasi mereka dalam pikiran - berpotensi bermasalah. Di sisi lain, faktor, seperti yang dicetak, bisa berupa semacam jumlah barang-barangnya, dan semuanya adalah tentang konsepsi yang lebih baik dari bobot dalam jumlah.
Mari kita juga melihat kekurangan metode kasar atau penjumlahan secara lebih umum dan abstrak .
sumber
Use "validated" scales
tidak dengan sendirinya memerlukan jumlah yang sederhana: jika validasi baik (sampel besar yang representatif, korelasi baik, jumlah faktor yang tepat, kecocokan bagus, dll.) skor faktor yang dihitung (koefisiennya) dapat dianggap normatif. bobot untuk digunakan dalam populasi baru. Dalam hal ini , saya tidak dapat melihat keuntungan dalam jumlah sederhana.