Sudahkah saya menghitung rasio kemungkinan ini dengan benar?

18

Saya penulis paket ez untuk R, dan saya sedang mengerjakan pembaruan untuk menyertakan perhitungan otomatis rasio kemungkinan (LR) dalam output ANOVA. Idenya adalah untuk memberikan LR untuk setiap efek yang analog dengan pengujian efek yang dicapai ANOVA. Misalnya, LR untuk efek utama mewakili perbandingan model nol dengan model yang mencakup efek utama, LR untuk interaksi mewakili perbandingan model yang mencakup kedua komponen utama efek versus model yang mencakup efek utama dan interaksi mereka, dll.

Sekarang, pemahaman saya tentang perhitungan LR berasal dari Glover & Dixon ( PDF ), yang mencakup perhitungan dasar serta koreksi untuk kompleksitas, dan lampiran untuk Bortolussi & Dixon ( lampiran PDF ), yang mencakup perhitungan yang melibatkan variabel tindakan berulang. Untuk menguji pemahaman saya, saya mengembangkan spreadsheet ini , yang mengambil dfs & SSs dari contoh ANOVA (dihasilkan dari desain 2 * 2 * 3 * 4 menggunakan data palsu) dan langkah-langkah melalui perhitungan LR untuk setiap efek.

Saya akan sangat menghargai itu jika seseorang dengan sedikit lebih percaya diri dengan perhitungan seperti itu dapat melihat dan memastikan saya melakukan semuanya dengan benar. Bagi mereka yang lebih suka kode abstrak, berikut adalah kode R yang mengimplementasikan pembaruan ke ezANOVA () (lihat baris 15-95).

Mike Lawrence
sumber

Jawaban:

3

Meskipun alasan tentang menghitung LR dari nilai SS cukup adil, metode kuadrat-sama adalah setara tetapi tidak sama dengan estimasi kemungkinan. (Perbedaannya dapat diilustrasikan misalnya dalam perhitungan se, yang dibagi dengan (n-1) dalam pendekatan kuadrat-terkecil dan dibagi dengan n dalam kemungkinan-maksimum. Estimasi kemungkinan maksimum adalah konsisten, tetapi sedikit bias ).

Ini memiliki beberapa implikasi: Anda dapat menghitung LR karena kemungkinannya sebanding dengan , tetapi itu tidak memberi Anda kemungkinan model anova Anda sendiri. Itu hanya memberi tahu Anda sesuatu tentang rasionya. Karena AIC didefinisikan secara klasik dalam hal kemungkinan, saya tidak yakin apakah Anda dapat menggunakan AIC seperti yang Anda inginkan.1s

Saya telah melihat spreadsheet, tetapi nilai-nilai untuk "LR yang tidak dikoreksi dalam" (Saya juga tidak sepenuhnya mengikuti apa yang sebenarnya Anda coba hitung di sana) tampaknya sangat tidak mungkin bagi saya.

Di samping catatan, kekuatan pengujian LR adalah bahwa Anda bisa saja membandingkan model yang Anda inginkan, Anda tidak harus melakukan itu untuk semuanya (yang menurunkan kesalahan multitesting). Jika Anda melakukan ini untuk setiap istilah, LR Anda benar-benar setara dengan tes F, dan dalam kasus kuadrat terkecil, sejauh yang saya tahu bahkan secara numerik hampir sama.

Jarak Anda mungkin beragam, tetapi saya tidak pernah yakin menggabungkan konsep dua kerangka kerja yang berbeda (yaitu kuadrat terkecil versus kemungkinan maksimum). Secara pribadi, saya akan melaporkan statistik F dan mengimplementasikan LR dalam fungsi yang memungkinkan untuk membandingkan model (mis. Fungsi anova untuk model lme yang melakukan hal itu).

2 sen saya.

PS: Saya memang melihat kode Anda, tetapi tidak bisa benar-benar mengetahui semua variabel. Jika Anda membuat anotasi kode Anda menggunakan komentar, itu akan membuat hidup sedikit lebih mudah lagi. Lembar EXCEL juga bukan yang paling mudah untuk diketahui. Saya akan periksa lagi nanti untuk melihat apakah saya dapat membuat sesuatu darinya.

Joris Meys
sumber