Apa yang diwakili oleh latensi P99? Saya terus mendengar tentang ini dalam diskusi tentang kinerja aplikasi tetapi tidak dapat menemukan sumber daya online yang akan membicarakan hal ini.
web-services
networking
web-applications
p99
maverik
sumber
sumber
Should
tidakwill
.Bayangkan Anda mengumpulkan data kinerja layanan Anda dan tabel di bawah ini adalah kumpulan hasil (nilai latensi bersifat fiktif untuk menggambarkan gagasan tersebut).
Latensi P99 layanan Anda adalah 7 detik. Hanya 1% dari permintaan membutuhkan waktu lebih lama dari itu. Jadi, jika Anda dapat menurunkan latensi P99 dari layanan Anda, Anda meningkatkan kinerjanya.
sumber
Mari kita ambil contoh dari sini
Jadi kita dapat mengatakan, 99 persen dari permintaan web, latensi yang ditemukan adalah 1,3ms (md / mikrodetik tergantung pada ukuran latensi sistem Anda yang dikonfigurasi) atau lebih rendah. Seperti yang dikatakan @tranmq jika kami menurunkan latensi P99 dari layanan, kami dapat meningkatkan kinerjanya.
Dan juga perlu diperhatikan p95, karena mungkin beberapa permintaan membuat p99 menjadi lebih mahal daripada p95 misalnya) permintaan awal yang membangun cache, pemanasan objek kelas, utas init ...
Akhirnya; kami dapat memiliki sekitar 1% noise dalam pengukuran kami (seperti kemacetan jaringan, pemadaman, degradasi layanan), jadi latensi p99 adalah perwakilan yang baik untuk kasus terburuk. Dan, hampir selalu, tujuan kami adalah mengurangi latensi p99.
sumber