Saya mengembangkan paket ez untuk R sebagai sarana untuk membantu transisi orang dari paket statistik seperti SPSS ke R. Ini (mudah-mudahan) dicapai dengan menyederhanakan spesifikasi berbagai rasa ANOVA, dan memberikan keluaran seperti SPSS (termasuk ukuran efek dan asumsi tes), di antara fitur-fitur lainnya. The ezANOVA()
Fungsi sebagian besar berfungsi sebagai pembungkus untuk car::Anova()
, tetapi versi saat ini ezANOVA()
alat hanya tipe-II jumlah kuadrat, sedangkan car::Anova()
izin spesifikasi dari kedua jenis-II atau -III jumlah kuadrat. Seperti yang seharusnya saya perkirakan, beberapa pengguna meminta saya memberikan argumenezANOVA()
yang memungkinkan permintaan pengguna tipe-II atau tipe-III. Saya telah segan untuk melakukannya dan menguraikan alasan saya di bawah ini, tetapi saya akan menghargai masukan masyarakat pada alasan saya atau lainnya yang mendukung masalah ini.
Alasan untuk tidak menyertakan argumen "SS_type" di ezANOVA()
:
- Perbedaan antara kuadrat tipe I, II, dan III hanya muncul ketika data tidak seimbang, dalam hal ini saya akan mengatakan bahwa lebih banyak manfaat diperoleh dari memperbaiki ketidakseimbangan dengan pengumpulan data lebih lanjut daripada mengotak-atik perhitungan ANOVA.
- Perbedaan antara tipe II dan III berlaku untuk efek tingkat rendah yang memenuhi syarat oleh efek tingkat tinggi, dalam hal ini saya menganggap efek tingkat rendah secara ilmiah tidak menarik. (Tetapi lihat di bawah untuk kemungkinan komplikasi dari argumen)
- Untuk keadaan yang jarang terjadi ketika (1) dan (2) tidak berlaku (ketika pengumpulan data lebih lanjut tidak mungkin dan peneliti memiliki minat ilmiah yang valid dalam efek utama yang memenuhi syarat yang saat ini tidak dapat saya bayangkan), orang relatif dapat dengan mudah memodifikasi yang
ezANOVA()
sumber atau mempekerjakancar::Anova()
dirinya untuk mencapai jenis tes III. Dengan cara ini, saya melihat upaya / pemahaman ekstra yang diperlukan untuk mendapatkan tes tipe III sebagai sarana yang saya dapat memastikan bahwa hanya mereka yang benar-benar tahu apa yang mereka lakukan untuk menempuh rute itu.
Sekarang, pemohon tipe-III terbaru menunjukkan bahwa argumen (2) dirusak oleh pertimbangan keadaan di mana efek orde tinggi yang "tidak signifikan" dapat membiaskan perhitungan jumlah kuadrat untuk efek orde rendah. Dalam kasus seperti itu dapat dibayangkan bahwa seorang peneliti akan melihat efek tingkat tinggi, dan melihat bahwa itu "tidak signifikan", beralih ke upaya interpretasi efek tingkat rendah yang, tanpa diketahui oleh peneliti, telah dikompromikan. Reaksi awal saya adalah bahwa ini bukan masalah dengan jumlah kuadrat, tetapi dengan nilai-p dan tradisi pengujian hipotesis nol. Saya menduga bahwa ukuran bukti yang lebih eksplisit, seperti rasio kemungkinan, mungkin lebih mungkin untuk menghasilkan gambaran yang kurang ambigu dari model yang didukung konsisten dengan data. Namun, saya berlindung
sumber
Jawaban:
Hanya untuk memperkuat - saya adalah pemohon terbaru, saya percaya.
Dalam komentar spesifik tentang poin Mike:
Jelas benar bahwa perbedaan I / II / III hanya berlaku dengan prediktor berkorelasi (di mana desain yang tidak seimbang adalah contoh paling umum, tentu saja dalam ANOVA faktorial) - tetapi bagi saya ini tampaknya merupakan argumen yang menolak analisis situasi yang tidak seimbang. (dan karenanya setiap debat Tipe I / II / III). Ini mungkin tidak sempurna, tetapi itulah yang terjadi (dan dalam banyak konteks, biaya pengumpulan data lebih besar daripada masalah statistik, meskipun peringatan).
Ini benar-benar adil dan mewakili daging sebagian besar argumen "II lawan III, mendukung II" yang saya temui. Ringkasan terbaik yang saya temui adalah Langsrud (2003) "ANOVA untuk data yang tidak seimbang: Gunakan Tipe II sebagai ganti jumlah kuadrat Tipe III", Statistik dan Komputasi 13: 163-167 (Saya memiliki PDF jika dokumen asli sulit ditemukan ). Dia berpendapat (mengambil kasus dua faktor sebagai contoh dasar) bahwa jika ada interaksi, ada interaksi, jadi pertimbangan efek utama biasanya tidak berarti (titik yang jelas adil) - dan jika tidak ada interaksi, analisis Tipe II dari efek utama lebih kuat daripada Tipe III (tidak diragukan lagi), jadi Anda harus selalu menggunakan Tipe II. Saya telah melihat argumen lain (misalnya Venables,
Dan saya setuju dengan ini: jika Anda memiliki interaksi tetapi memiliki beberapa pertanyaan tentang efek utama juga, maka Anda mungkin ke wilayah do-it-yourself.
Jelas ada orang-orang yang hanya ingin Tipe III karena SPSS melakukannya, atau referensi lain untuk otoritas yang lebih tinggi secara statistik. Saya tidak sepenuhnya menentang pandangan ini, jika menyangkut pilihan banyak orang yang bertahan dengan SPSS (yang saya hadapi beberapa hal, yaitu waktu, uang, dan kondisi kadaluwarsa lisensi) dan Tipe III SS, atau banyak orang yang beralih ke R dan Tipe III SS. Namun, argumen ini jelas lemah secara statistik.
Namun, argumen yang saya temukan lebih substansial dalam mendukung Tipe III adalah yang dibuat secara independen oleh Myers & Well (2003, "Desain Penelitian dan Analisis Statistik", hal. 323, 626-629) dan Maxwell & Delaney (2004, " Merancang Eksperimen dan Menganalisis Data: Perspektif Perbandingan Model ", hlm. 324-328, 332-335). Itu adalah sebagai berikut:
Jadi interpretasi saya (dan saya bukan ahli!) Adalah bahwa ada banyak Otoritas Statistik Tinggi di kedua sisi argumen; bahwa argumen yang biasa diajukan bukan tentang situasi biasa yang akan menimbulkan masalah (situasi itu menjadi yang biasa menafsirkan efek utama dengan interaksi yang tidak signifikan); dan bahwa ada alasan-alasan yang wajar untuk khawatir tentang pendekatan Tipe II dalam situasi itu (dan itu mengarah pada kekuatan versus potensi over-liberalisme).
Bagi saya, itu sudah cukup untuk mengharapkan opsi Tipe III di ezANOVA, dan juga Tipe II, karena (untuk uang saya) itu adalah antarmuka yang luar biasa untuk sistem ANOVA R. R adalah beberapa cara dari menjadi mudah digunakan untuk pemula, dalam pandangan saya, dan paket "ez", dengan ezANOVA dan fungsi merencanakan efek yang agak indah, berjalan jauh menuju membuat R dapat diakses oleh khalayak penelitian yang lebih umum. Beberapa pemikiran saya sedang dalam proses (dan hack jahat untuk ezANOVA) ada di http://www.psychol.cam.ac.uk/statistics/R/anova.html .
Akan tertarik mendengar pikiran semua orang!
sumber
Peringatan: jawaban murni non-statistik. Saya lebih suka bekerja dengan satu fungsi (atau setidaknya satu paket) ketika melakukan jenis analisis yang sama (misalnya, ANOVA). Hingga sekarang, saya secara konsisten menggunakan
Anova()
karena saya lebih suka sintaksnya untuk menentukan model dengan tindakan berulang - dibandingkan denganaov()
, dan kehilangan sedikit (SS tipe I) dengan langkah-langkah non-berulang.ezANOVA()
bagus untuk manfaat tambahan ukuran efek. Tapi Yang paling tidak saya sukai adalah harus berurusan dengan 3 fungsi yang berbeda untuk melakukan dasarnya jenis analisis yang sama, hanya karena salah satu dari mereka mengimplementasikan fitur X (tapi bukan Y), dan yang lain Y (tetapi bukan X).Untuk ANOVA, saya bisa memilih antara
oneway()
,lm()
,aov()
,Anova()
,ezANOVA()
, dan mungkin orang lain. Ketika mengajar R, sudah merupakan hal yang menyakitkan untuk menjelaskan berbagai pilihan, bagaimana mereka berhubungan satu sama lain (aov()
adalah pembungkus untuklm()
), dan fungsi mana yang melakukan apa:oneway()
hanya untuk desain faktor tunggal tetapi dengan opsivar.equal=FALSE
. Tidak ada opsi seperti itu di dalamaov()
dan lainnya, tetapi fungsi-fungsi itu juga untuk desain multifaktorial.aov()
, lebih baik masukAnova()
aov()
, bukan diAnova()
Anova()
, bukan diaov()
ezANOVA()
, bukan pada orang lainAkan rapi untuk hanya mengajarkan satu fungsi dengan satu sintaks yang konsisten yang melakukan semuanya. Tanpa SS tipe III yang mudah digunakan,
ezANOVA()
tidak dapat berfungsi seperti itu bagi saya karena saya tahu bahwa siswa akan diminta untuk menggunakannya di beberapa titik ("cukup periksa ulang hasil-hasil ini yang diperoleh John Doe dengan SPSS"). Saya merasa lebih baik memiliki pilihan untuk membuat pilihan sendiri tanpa harus mempelajari sintaks lain untuk menentukan model. Sikap "Aku tahu yang terbaik untukmu" mungkin memiliki kelebihan, tetapi bisa menjadi terlalu protektif.sumber
multcomp
paket (yang, sejauh yang saya ingat, memerlukanaov
objek). Kalau tidak, saya setuju sepenuhnya dan biasanya digunakanez
untuk tugas sehari-hari saya, karena itu sangat mudah ...aov
elemen yang akan menjadi hebat. Sejauh ini saya biasanya malas untuk membuataov
elemen saya sendiri dan menggunakan AndaezANOVA
sebagai gantinya dengan t.tests ...ez
paket memiliki beberapa potensi besar: dalam psikologi, itu sudah direkomendasikan cukup sering (lih buku Jerman "R für Einsteiger" oleh Luhmann). Membuatnya lebih fleksibel tentu akan dihargai.Dunia R tidak terlalu suka Tipe 3 SS.
Salah satu referensi yang sering dikutip adalah "Exegeses on Linear Models" oleh Bill Venables (2000) .
Saya harap saya tidak salah menilai dia, tetapi saya pikir argumen utamanya adalah bahwa Tipe 3 SS melanggar prinsip marginalitas model linier dan karenanya tidak masuk akal.
sumber
Ini telah menjadi perdebatan yang membuka mata tentang masalah tipe-II / III bagi saya. Terima kasih atas upaya semua orang dalam memberikan diskusi. Saya datang ke pandangan mempromosikan tipe-II secara konsisten di atas tipe-III, tetapi memiliki pemahaman yang lemah pada argumen - saya hanya mengandalkan saran dalam buku regresi (mobil) John fox yang menyarankan tes tipe-III jarang. dapat ditafsirkan (well, saya pikir dia mengatakan itu ...).
Bagaimanapun- ezANOVA benar-benar berguna untuk mengizinkan akses ke fungsionalitas R yang sebaliknya tidak mungkin dilakukan untuk mahasiswa sarjana yang saya ajar dalam psikologi. Saya menyediakan modul R online, yang menampilkan ezANOVA untuk mendemonstrasikan desain campuran ANOVA (walaupun tampaknya versi pra 3 mungkin sulit untuk ini ... doh!)
Cobalah di sini:
http://www.wessa.net/rwasp_Mixed%20Model%20ANOVA.wasp
setelah modul dimuat (~ 10s) temukan tombol hitung (setengah jalan di bawah halaman) dan itu akan menjalankan ezANOVA serta tabel dan plot yang terkait.
Ian
sumber