Apa saja jenis kode yang tersedia untuk variabel kategorikal (dalam R) dan kapan Anda akan menggunakannya?

14

Jika Anda cocok dengan model linier atau model campuran ada berbagai jenis pengkodean yang tersedia untuk mengubah varibale kategori atau nominal menjadi sejumlah variabel yang diperkirakan paramaters, seperti dummy conding (standar R) dan pengkodean efek.

Saya mendengar bahwa efek pengkodean (kadang-kadang disebut penyimpangan atau pengkodean kontras) lebih disukai ketika Anda berinteraksi, tetapi apa perbedaan yang mungkin terjadi dan kapan Anda akan menggunakan jenis kontras yang mana?

Konteksnya adalah pemodelan campuran dalam penggunaan R lme4, tapi saya pikir tanggapan yang lebih luas baik-baik saja. Maaf, jika saya melewatkan pertanyaan serupa.

SUNTING: Dua tautan bermanfaat adalah: efek pengkodean & penjelasan dummy dijelaskan.

Henrik
sumber
jika Anda memiliki Statistik Terapan Modern dengan S-Plus, ini memiliki bagian yang bagus di Bab Enam tentang pertanyaan ini
richiemorrisroe
4
Saya tidak berpikir Anda akan menemukan jawaban lengkap untuk pertanyaan Anda, tetapi ada banyak informasi bagus tentang berbagai jenis pengkodean di sini .
gung - Reinstate Monica
@ung Situs ini terlihat sangat menarik. Namun sepertinya tidak mencakup pengkodean kontras (atau apakah ada nama lain untuk itu).
Henrik
Saya tidak yakin; Saya ingin tahu apakah ada miskomunikasi. Judul halaman itu adalah "pengkodean kontras".
gung - Reinstate Monica
1
Saya tidak begitu mengerti pertanyaan apa yang tersisa. Jika Anda menginginkan daftar berbagai jenis pengkodean, Anda memilikinya. Apa dorongan utama pertanyaan Anda sekarang?
gung - Reinstate Monica

Jawaban:

4

Orang lain dapat mencerahkan saya jika saya salah, tetapi begini ...

Apa efek untuk level dibandingkan dengan rata-rata level sebelumnya? yaitu Anda tertarik untuk menemukan ambang efek

  • Gunakan kontras Helmert. Saya menganggap ini sebagai perbandingan kumulatif. Saya telah menggunakan ini ketika tertarik untuk menentukan batas dosis dosis respons pajanan obat. Membandingkan dengan beberapa level sekaligus berarti bahwa lebih sedikit informasi yang dibuang. Saya menganggap ini sebagai perbandingan kumulatif.

Apa pengaruh tingkat relatif terhadap tingkat dasar? yaitu Anda tertarik pada satu kelompok perbandingan dasar.

  • Gunakan pengkodean variabel dummy (kontras pengobatan). Saya menganggap ini sebagai perbandingan dasar. Saya telah menggunakan ini ketika biasanya ada satu kelompok / level yang ditetapkan sebagai penting oleh penelitian lain, dan penelitian saya menunjukkan bahwa asosiasi juga ada ketika ambang ini terlampaui.

Apa efek dari dua level variabel yang berdekatan?

  • Gunakan perbedaan maju / mundur. Saya menganggap ini sebagai perbandingan berturut-turut interval pendek. Saya telah menggunakan ini ketika membandingkan efek untuk berbagai tingkat posisi sosial ekonomi, ketika masing-masing kelompok secara komposisi berbeda dalam hak mereka sendiri dan tidak lebih menarik daripada yang lain.
Gavin
sumber