Saya memiliki aplikasi berbasis servlet di mana saya mengukur waktu yang dibutuhkan untuk menyelesaikan setiap permintaan ke servlet itu. Saya sudah menghitung statistik sederhana seperti rata-rata dan maksimum; Saya ingin menghasilkan beberapa analisis yang lebih canggih, dan untuk itu saya percaya saya perlu memodelkan waktu respons ini dengan benar.
Tentunya, saya katakan, waktu respons mengikuti beberapa distribusi terkenal, dan ada alasan bagus untuk percaya bahwa distribusi adalah model yang tepat. Namun, saya tidak tahu distribusi apa yang seharusnya.
Log-normal dan Gamma muncul di pikiran, dan Anda dapat membuat salah satu dari jenis data waktu respons nyata yang sesuai. Adakah yang memiliki pandangan tentang distribusi apa yang harus diikuti oleh waktu tanggapan?
sumber
Penelitian saya menunjukkan model terbaik ditentukan oleh beberapa hal: 1) Apakah Anda peduli dengan tubuh, ekor, atau keduanya? Jika bukan "keduanya", pemodelan dataset yang difilter dapat lebih bermanfaat. 2) Apakah Anda ingin yang sangat sederhana atau sangat akurat? yaitu berapa banyak parameter?
Jika jawaban untuk 1 adalah "keduanya" dan 2 adalah "sederhana", Pareto tampaknya bekerja paling baik. Jika tidak, jika 1 "tubuh" dan 2 "sederhana" - pilih model erlang yang difilter. Jika 1 adalah "keduanya" dan 2 adalah "akurat", Anda mungkin menginginkan model campuran gaussian pada data Anda di domain log - secara efektif cocok lognormal.
Saya telah meneliti hal ini akhir-akhir ini, dan saya tidak menemukan topik yang cukup baik untuk dibahas di internet publik, jadi saya hanya menulis posting blog yang merinci penelitian saya tentang topik ini.
sumber