Sepertinya saya tidak dapat menemukan jawaban yang pasti untuk pertanyaan saya.
Data saya terdiri dari beberapa plot dengan rata-rata yang diukur bervariasi dari 0,27 hingga 0,57. Dalam kasus saya, semua nilai data positif, tetapi pengukuran itu sendiri didasarkan pada rasio nilai reflektansi yang dapat berkisar dari -1 hingga +1. Plot mewakili nilai NDVI , indikator turunan dari "produktivitas" vegetasi.
Tujuan saya adalah untuk membandingkan variabilitas nilai pada setiap plot, tetapi karena setiap plot memiliki rata-rata yang berbeda, saya memilih untuk menggunakan CV untuk mengukur dispersi relatif dari nilai-nilai NDVI per plot.
Dari apa yang saya pahami, mengambil CV dari plot ini tidak halal karena setiap plot dapat memiliki nilai positif dan negatif. Mengapa tidak pantas menggunakan CV dalam hal seperti itu? Apa yang akan menjadi beberapa alternatif yang layak (yaitu, uji dispersi relatif yang serupa, transformasi data, dll.)?
sumber
Jawaban:
Pikirkan tentang apa itu CV: Rasio deviasi standar terhadap artinya. Tetapi jika variabel dapat memiliki nilai positif dan negatif, nilai rata-rata bisa mendekati 0; dengan demikian, CV tidak lagi melakukan apa yang seharusnya dilakukan: Yaitu, berikan rasa seberapa besar sd, dibandingkan dengan mean.
EDIT: Dalam komentar, saya mengatakan bahwa jika Anda secara wajar dapat menambahkan konstanta ke variabel, CV tidak baik. Berikut ini sebuah contoh:
x2 hanyalah x + 10. Saya pikir secara intuitif jelas bahwa keduanya sama-sama variabel; tetapi CV berbeda.
Contoh kehidupan nyata dari ini adalah jika x adalah suhu dalam derajat C dan x2 adalah suhu dalam derajat K (walaupun ada yang bisa berpendapat bahwa K adalah skala yang tepat, karena ia memiliki 0 yang ditentukan).
sumber
Saya menganggap ini sebagai model variasi yang berbeda. Ada model statistik di mana CV adalah konstan. Di mana mereka bekerja, seseorang dapat melaporkan CV. Ada model di mana deviasi standar adalah fungsi kekuatan rata-rata. Ada model di mana standar deviasi konstan. Sebagai aturan, model CV konstan adalah tebakan awal yang lebih baik daripada model SD konstan, untuk variabel skala rasio. Anda dapat berspekulasi tentang mengapa itu benar, mungkin didasarkan pada prevalensi interaksi multiplikatif daripada aditif.
Pemodelan Constant-CV sering dikaitkan dengan transformasi logaritmik. (Pengecualian penting adalah respons non-negatif yang kadang-kadang nol.) Ada beberapa cara untuk melihatnya. Pertama, jika CV konstan maka log adalah transformasi penstabilan varians konvensional. Atau, jika model kesalahan Anda lognormal dengan konstanta SD dalam skala log, maka CV adalah transformasi sederhana dari SD itu. CV hampir sama dengan skala log SD ketika keduanya kecil.
Dua cara menerapkan metode statistik 101 seperti deviasi standar adalah dengan cara data Anda mendapatkannya atau (terutama jika itu adalah skala rasio) ke log mereka. Anda membuat tebakan pertama yang terbaik yang dapat Anda ketahui bahwa alam dapat menjadi lebih rumit dan bahwa studi lebih lanjut mungkin dilakukan. Mempertimbangkan apa yang orang-orang sebelumnya temukan produktif dengan jenis data Anda.
Inilah kasus di mana hal-hal ini penting. Konsentrasi kimia kadang-kadang dirangkum dengan CV atau dimodelkan dalam skala log. Namun, pH adalah konsentrasi log.
sumber