Dalam ekologi, kita sering menggunakan persamaan pertumbuhan logistik:
atau
di mana adalah daya dukung (kepadatan maksimum tercapai), adalah kepadatan awal, adalah tingkat pertumbuhan, adalah waktu sejak awal.N 0 r t
Nilai memiliki batas atas lunak dan batas bawah , dengan batas bawah yang kuat pada . ( K ) ( N 0 ) 0
Lebih jauh lagi, dalam konteks spesifik saya, pengukuran dilakukan dengan menggunakan kerapatan optik atau fluoresensi, yang keduanya memiliki maksimum teoretis, dan dengan demikian merupakan batas atas yang kuat.
Kesalahan di sekitar mungkin paling baik dijelaskan oleh distribusi terbatas.
Pada nilai kecil , distribusi mungkin memiliki kemiringan positif yang kuat, sedangkan pada nilai mendekati K, distribusi mungkin memiliki kemiringan negatif yang kuat. Distribusi dengan demikian mungkin memiliki parameter bentuk yang dapat dihubungkan ke .N t N t
Varians juga dapat meningkat dengan .
Berikut adalah contoh grafisnya
dengan
K<-0.8
r<-1
N0<-0.01
t<-1:10
max<-1
yang dapat diproduksi sesuai dengan
library(devtools)
source_url("https://raw.github.com/edielivon/Useful-R-functions/master/Growth%20curves/example%20plot.R")
Apa yang akan menjadi distribusi kesalahan teoretis di sekitar (dengan mempertimbangkan model dan informasi empiris yang diberikan)?
Bagaimana parameter distribusi ini berhubungan dengan nilai atau waktu (jika menggunakan parameter, mode tidak dapat secara langsung dikaitkan dengan mis. normal)?N t
Apakah distribusi ini memiliki fungsi kerapatan yang diimplementasikan dalam ?
Petunjuk yang dieksplorasi sejauh ini:
- Dengan asumsi normalitas di sekitar (mengarah ke lebih dari perkiraan ) K
- Logit distribusi normal sekitar , tetapi kesulitan dalam menyesuaikan parameter bentuk alpha dan beta
- Distribusi normal di sekitar logika
sumber
Jawaban:
Seperti yang ditunjukkan Michael Chernick, distribusi beta berskala sangat sesuai untuk hal ini. Namun, untuk semua tujuan praktis, dan berharap Anda TIDAK PERNAHdapatkan model dengan benar, Anda akan lebih baik hanya memodelkan mean melalui regresi nonlinier sesuai dengan persamaan pertumbuhan logistik Anda dan membungkusnya dengan kesalahan standar yang kuat untuk heteroskedastisitas. Menempatkan ini dalam konteks kemungkinan maksimum akan menciptakan perasaan keliru yang sangat akurat. Jika teori ekologi menghasilkan distribusi, Anda harus sesuai dengan distribusi itu. Jika teori Anda hanya menghasilkan prediksi untuk mean, Anda harus tetap berpegang pada interpretasi ini dan jangan mencoba untuk menghasilkan sesuatu yang lebih dari itu, seperti distribusi penuh. (Sistem kurva Pearson sangat disukai 100 tahun yang lalu, tetapi proses acak tidak mengikuti persamaan diferensial untuk menghasilkan kurva kepadatan, yang merupakan motivasinya dengan kurva kepadatan ini - lebih tepatnya,Nt sendiri - Saya berpikir tentang distribusi Poisson sebagai contoh - dan saya tidak sepenuhnya yakin bahwa efek ini akan ditangkap oleh distribusi beta berskala; sebaliknya, akan dikompres ketika Anda menarik rata-rata menuju batas atas teoretisnya, yang mungkin harus Anda lakukan. Jika perangkat pengukuran Anda memiliki batas atas pengukuran, itu tidak berarti bahwa proses Anda sebenarnyaharus memiliki batas atas; Saya lebih suka mengatakan bahwa kesalahan pengukuran yang diperkenalkan oleh perangkat Anda menjadi kritis ketika proses mencapai batas atas yang diukur secara akurat. Jika Anda mengacaukan pengukuran dengan proses yang mendasarinya, Anda harus mengenalinya secara eksplisit, tetapi saya akan membayangkan Anda memiliki minat yang lebih besar pada proses tersebut daripada dalam menjelaskan cara kerja perangkat Anda. (Prosesnya akan ada 10 tahun dari sekarang; perangkat pengukuran baru mungkin tersedia, sehingga pekerjaan Anda akan menjadi usang.)
sumber
@whuber benar bahwa tidak ada hubungan yang diperlukan dari bagian struktural model ini dengan distribusi istilah kesalahan. Jadi tidak ada jawaban untuk pertanyaan Anda untuk distribusi kesalahan teoretis.
Ini tidak berarti bahwa itu bukan pertanyaan yang bagus - hanya saja jawabannya harus sebagian besar bersifat empiris.
Anda tampaknya berasumsi bahwa keacakan itu aditif. Saya tidak melihat alasan (selain kenyamanan komputasi) untuk hal ini. Apakah ada alternatif bahwa ada elemen acak di tempat lain dalam model? Sebagai contoh, lihat berikut ini, di mana keacakan diperkenalkan sebagai Biasanya terdistribusi dengan rata-rata 1, varians satu-satunya hal untuk memperkirakan. Saya tidak punya alasan untuk berpikir ini adalah hal yang benar untuk dilakukan selain dari itu menghasilkan hasil yang masuk akal yang tampaknya cocok dengan apa yang ingin Anda lihat. Apakah akan praktis untuk menggunakan sesuatu seperti ini sebagai dasar untuk memperkirakan model yang saya tidak tahu.
sumber