Saya melihat apakah kelimpahan berhubungan dengan ukuran. Ukuran (tentu saja) kontinu, namun, kelimpahan dicatat pada skala sedemikian rupa
A = 0-10
B = 11-25
C = 26-50
D = 51-100
E = 101-250
F = 251-500
G = 501-1000
H = 1001-2500
I = 2501-5000
J = 5001-10,000
etc...
A hingga Q ... 17 level. Saya sedang memikirkan satu pendekatan yang mungkin untuk menetapkan setiap huruf nomor: baik minimum, maksimum, atau median (yaitu A = 5, B = 18, C = 38, D = 75.5 ...).
Apa potensi jebakan - dan karenanya, akan lebih baik untuk memperlakukan data ini sebagai kategori?
Saya telah membaca pertanyaan ini yang memberikan beberapa pemikiran - tetapi salah satu kunci dari kumpulan data ini adalah bahwa kategorinya tidak genap - jadi memperlakukannya sebagai kategorikal akan menganggap perbedaan antara A dan B sama dengan perbedaan antara B dan C ... (yang dapat diperbaiki dengan menggunakan logaritma - terima kasih Anonymouse)
Pada akhirnya, saya ingin melihat apakah ukuran dapat digunakan sebagai prediktor kelimpahan setelah mempertimbangkan faktor lingkungan lainnya. Prediksi ini juga akan berada dalam kisaran: Ukuran yang diberikan X dan faktor A, B, dan C kami memperkirakan bahwa Kelimpahan Y akan jatuh antara Min dan Max (yang saya kira dapat menjangkau satu atau lebih titik skala: Lebih dari Min D dan kurang dari Max F ... meskipun lebih tepat lebih baik).
sumber
ologit
. Dalam R, Anda dapat melakukan ini denganpolr
diMASS
paket.rms::lrm
dan paket ordinal (clm
) juga merupakan opsi yang bagus.Pertimbangkan untuk menggunakan logaritma ukuran.
sumber