lme dan lmer perbandingan

30

Saya bertanya-tanya apakah ada yang bisa memberi tahu saya tentang perbedaan saat ini antara kedua fungsi ini. Saya menemukan pertanyaan berikut: Bagaimana memilih perpustakaan nlme atau lme4 R untuk model efek campuran? , tapi itu berasal dari beberapa tahun yang lalu. Itu seumur hidup di lingkaran perangkat lunak.

Pertanyaan spesifik saya adalah:

  • Apakah ada (masih) ada struktur korelasi lmeyang lmertidak menangani?
  • Apakah mungkin / direkomendasikan untuk digunakan lmeruntuk data panel?

Permintaan maaf jika ini agak mendasar.

Sedikit lebih detail: data panel adalah tempat kami melakukan beberapa pengukuran pada individu yang sama, pada titik waktu yang berbeda. Saya biasanya bekerja dalam konteks bisnis, di mana Anda mungkin memiliki data untuk pelanggan tetap / jangka panjang selama beberapa tahun. Kami ingin memungkinkan variasi dari waktu ke waktu, tetapi dengan jelas menyesuaikan variabel dummy untuk setiap bulan atau tahun tidak efisien. Namun, saya tidak jelas apakah lmeralat yang tepat untuk data semacam ini, atau apakah saya memerlukan struktur autokorelasi yang lmedimiliki.

Hong Ooi
sumber
1
Jawaban itu masih terkini. lmermasih tidak menangani berbagai struktur korelasi dan varian yang lmetidak, dan seperti yang saya pahami situasinya, mungkin tidak akan pernah.
Aaron - Reinstate Monica
@ Harun Terima kasih atas jawabannya. Untuk bagian kedua, apakah ini mempengaruhi lmerkemampuan untuk menangani dataset panel? Atau bisakah saya melarikan diri tanpa membuat asumsi korelasi spesifik?
Hong Ooi
3
@Aaron, saya tidak tahu tentang "tidak akan pernah" pegangan corr struktur / var - Saya tertarik dalam menambahkan fitur ini dan tidak berpikir itu akan menjadi yang sulit - tapi aku pasti akan mengatakan "tidak memegang Anda nafas". Saya tidak cukup akrab dengan data panel untuk mengetahui apa yang diperlukan untuk lmermenanganinya ... Hong, bisakah Anda menambahkan penjelasan singkat untuk pertanyaan yang menggambarkan properti statistik yang diperlukan secara lebih rinci, atau memberikan petunjuk?
Ben Bolker
@BenBolker Menambahkan beberapa detail.
Hong Ooi
4
Saya akan mengatakan lmerakan cukup baik dengan efek acak tahun dan efek acak pelanggan (katakanlah Anda hanya memiliki satu pengukuran per pelanggan per tahun); jika Anda dilengkapi dengan tren waktu keseluruhan (efek tetap) Anda juga harus mempertimbangkan interaksi waktu-oleh-pelanggan secara acak (yaitu lereng acak). Idealnya, Anda juga ingin mengizinkan autokorelasi temporal dalam rangkaian waktu masing-masing pelanggan, yang saat ini tidak mungkin dilakukan dengan lmer, tetapi Anda dapat memeriksa fungsi autokorelasi temporal untuk melihat apakah itu penting ...
Ben Bolker

Jawaban:

15

PEMBARUAN JUNI 2016:

Silakan lihat entri blog Ben yang menggambarkan pemikirannya saat ini untuk mencapai hal ini di lme4: Braindump 01 Juni 2016

Jika Anda lebih suka metode Bayesian, brmspaket itu brmmendukung beberapa struktur korelasi: halaman CRAN brms . (Catat khususnya: "Pada brms versi 0.6.0, struktur AR mengacu pada efek autoregresif residu agar sesuai dengan penamaan dan implementasi dalam paket lain seperti nlme. Sebelumnya, istilah AR dalam brm merujuk pada efek autoregresif dari respons. Yang terakhir sekarang bernama efek ARR dan dapat dimodelkan menggunakan argumen r dalam fungsi cor_arma dan cor_arr. ")


JAWABAN ASLI JULI 2013:

(Dikonversi dari komentar.)

Saya akan mengatakan lmerakan cukup baik dengan efek acak tahun dan efek acak pelanggan (katakanlah Anda hanya memiliki satu pengukuran per pelanggan per tahun);

lmer(y~1 + (1|year) + (1|customer), ...)

akan cocok dengan model (intercept-only)

YijNormal(a+ϵyear,i+ϵcustomer,j,σ02)
mana dan adalah varian Normal rata-rata nol dengan varian spesifik mereka sendiri.ϵyearϵcustomer

Ini adalah model yang cukup membosankan, Anda mungkin ingin menambahkan tren waktu keseluruhan (efek tetap) dan juga mempertimbangkan interaksi waktu-oleh-pelanggan acak (yaitu lereng acak). kupikir

lmer(y~year + (1|year) + (year|customer), ...)

harus sesuai dengan model

YijNormal((a+ϵcustomer,j)+(b+ϵyear×customer,j)year+ϵyear,i,σ02)

(menggunakan yearcara ini merupakan pengecualian terhadap aturan umum yang tidak termasuk variabel input baik sebagai efek dipasang dan acak dalam model yang sama; asalkan itu variabel numerik, yeardiperlakukan sebagai kontinu dalam efek tetap dan year:customer(acak) interaksi dan sebagai kategori dalam efek acak ...)

Tentu saja Anda mungkin ingin menambahkan kovariat level tahun, level pelanggan, dan level observasi yang akan menyerap beberapa varian yang relevan (mis. Tambahkan indeks harga konsumen rata-rata untuk menjelaskan mengapa tahun itu buruk atau bagus ...)

Idealnya, Anda juga ingin mengizinkan autokorelasi temporal dalam seri waktu masing-masing pelanggan, yang saat ini tidak memungkinkan lmer, tetapi Anda dapat memeriksa fungsi autokorelasi temporal untuk melihat apakah itu penting ...

Peringatan : Saya tidak tahu banyak tentang pendekatan standar untuk menangani data panel; ini didasarkan hanya pada pengetahuan saya tentang model campuran. Komentator (atau editor) harus merasa bebas untuk berpadu jika ini tampaknya melanggar praktik standar / terbaik dalam ekonometrik.

Ben Bolker
sumber
Kecuali ini notasi ganjil - biasanya berarti distribusi marginal adalah normal dengan mean dan varians - Saya pikir persamaan Anda tidak tepat. Apa yang Anda tulis adalah distribusi bersyarat, mengingat efek acak. Distribusi marginal dalam model pertama adalah Pada model kedua memodelkan rata-rata marginal adalah dan variansnya adalah ekspresi yang lebih rumit yang melibatkan kovarians antara tahun kemiringan / intersep acak ditambah hal-hal lainnya. XN(μ,σ2)Xμσ2Yij
N(a,σ02+σyear2+σcust2)
a+byear
Makro
Ya, terima kasih Ben. Dalam praktiknya akan ada efek tetap juga, misalnya usia, jenis kelamin dan semua tersangka yang biasa. @ Macro: Ben benar, saya percaya.
Hong Ooi
@ Macro: Saya pikir notasi itu aneh / tidak biasa, tetapi benar (yaitu setara dengan apa yang Anda sarankan). Saya telah menyatakan istilah efek acak sebagai bagian dari . Mungkin akan lebih jelas / lebih akrab jika saya menulisnya dalam notasi bertingkat ( ). Y Normal ( X β + Z u , σ 2 ) ; u MVNormal ( 0 , Σ ) ; Σ = f ( θ )μYNormal(Xβ+Zu,σ2);uMVNormal(0,Σ);Σ=f(θ)
Ben Bolker
1
@ BenBolker: apakah Anda memperhatikan bahwa saya telah menetapkan hadiah untuk pertanyaan ini, karena saya sedang mencari pembaruan potensial ?
S. Kolassa - Reinstate Monica
2
Saya baru saja memposting beberapa hal yang saya kerjakan baru-baru ini di rawgit.com/bbolker/mixedmodels-misc/master/notes/… ; Saya akan mencoba menyatukan untuk memasukkan bit yang relevan dalam jawaban saya (atau, orang lain dipersilakan untuk memposting jawaban mereka sendiri berdasarkan informasi itu, atau mengedit pertanyaan saya!)
Ben Bolker
3

Untuk menjawab pertanyaan Anda secara langsung, dan NB ini adalah tahun setelah posting asli!

  • Yap masih ada struktur korelasi yang menangani nlme yang lme4 tidak akan menangani. Namun, selama nlme memungkinkan pengguna untuk mendefinisikan corstrs umum dan lme4 tidak, ini akan menjadi kasusnya. Secara mengejutkan ini hanya memiliki sedikit dampak praktis. Struktur korelasi "tiga besar" dari: struktur korelasi Independen, Dapat Tukar, dan AR-1 mudah ditangani oleh kedua paket.

  • Itu tentu saja mungkin . Anda juga dapat memasukkan data panel dengan lmfungsi ini! Rekomendasi saya tentang yang akan digunakan tergantung pada masalah. lme4adalah tool kit yang jauh lebih kecil, dan representasi formula adalah cara yang rapi dan ringkas untuk menggambarkan beberapa model efek campuran yang sangat umum. nlmeadalah kotak alat yang sangat besar, termasuk tukang las TIG untuk membuat alat apa pun yang Anda butuhkan.

Anda mengatakan ingin mengizinkan "variasi sepanjang waktu". Pada dasarnya, struktur korelasi yang dapat ditukar mencapai ini, memungkinkan untuk intersepsi acak di setiap kluster, sehingga varians intracluster adalah jumlah variasi level klaster serta variasi (apa yang Anda sebut) variasi dari waktu ke waktu. Dan ini sama sekali tidak menghalangi Anda untuk menggunakan efek tetap untuk mendapatkan prediksi yang lebih tepat dari waktu ke waktu.

AdamO
sumber
1
Hmm. Bagaimana cara menggunakan korelasi AR-1 di lme4?
Amuba kata Reinstate Monica