Saat ini saya mencoba menerapkan model linier ( family = gaussian
) ke indikator keanekaragaman hayati yang tidak dapat mengambil nilai lebih rendah dari nol, inflasi nol dan berkelanjutan. Nilai berkisar dari 0 hingga sedikit di atas 0,25. Sebagai akibatnya, ada pola yang cukup jelas dalam residu model yang belum berhasil saya singkirkan:
Adakah yang punya ide untuk menyelesaikannya?
Jawaban:
Ada berbagai solusi untuk kasus distribusi kontinu nol-meningkat (semi-):
Atau, jika struktur data Anda cukup sederhana, Anda bisa menggunakan model linier dan menggunakan tes permutasi atau pendekatan kuat lainnya untuk memastikan bahwa kesimpulan Anda tidak dikacaukan oleh distribusi data yang menarik.
Ada paket R / solusi yang tersedia untuk sebagian besar kasus ini.
Ada pertanyaan lain di SE tentang data kontinu nol-inflated (semi) (misalnya di sini , di sini , dan di sini ), tetapi mereka tampaknya tidak menawarkan jawaban umum yang jelas ...
Lihat juga Min & Agresti, 2002, Pemodelan Data Nonnegatif dengan Clumping at Zero: A Survey untuk ikhtisar.
sumber