Masalah saya adalah bahwa saya tidak tahu energi dari kebisingan latar belakang, jadi saya tidak bisa hanya membatasi energi. Pemrosesan dilakukan secara real time, dan saya memiliki sekitar 500 msec untuk memutuskan. Idealnya, saya ingin konsonan yang tenang dianggap tidak diam.
audio
speech-recognition
Michael Litvin
sumber
sumber
Jawaban:
Ada banyak parameter yang dapat Anda lihat:
Saya pikir kombinasi ketiganya harus memberikan skema deteksi yang cukup kuat.
sumber