Apa ekivalen audio dari gambar seperti "Lena", "Mandrill", dan "Cameraman"?

Jawaban:

17

Contoh terdekat yang dapat saya pikirkan adalah awal dari "Tom's Diner" Suzanne Vega yang telah digunakan untuk pengembangan mpeg-1 layer 3, dan masih kadang-kadang digunakan untuk demo codec audio.

pichenettes
sumber
3
yah, Tom's Diner adalah potongan suara yang cukup bersih (bebas reverb) dan monofonik yang berguna untuk menguji program deteksi nada. satu lagi adalah klip Boyz II Men dari sampul Beatles mereka "Yesterday" (tepat di akhir). bagus untuk pelacakan nada vokal monofonik. lebih keras dari Tom's Diner. Saya ingat Digital Performer menggunakannya.
robert bristow-johnson
16

Pemrosesan audio adalah bidang yang luas, tetapi khusus dalam pemrosesan suara, basis data terbuka sampel yang dikenal sebagai Harvard Sentences banyak digunakan. Kalimat Harvard adalah kumpulan kalimat yang seimbang secara fonetis dalam Bahasa Inggris Amerika. Banyak basis data yang setara juga ada untuk bahasa lain.

File aktual dengan pidato Kalimat Harvard dapat ditemukan di sini .

Phonon
sumber
5

Saya juga berpikir bahwa database NIST sangat populer ketika datang ke tugas pengenalan ucapan. Bahkan itu adalah standar untuk perbandingan algoritma dan teknik baru selama tantangan tahunan.

Selain itu load handelpotongan MATLAB yang berisi GFHandel - Hallelujah cukup umum digunakan.

jojek
sumber
2

Jangan meremehkan kekuatan gelombang sinus 1 kHz pada 0 dBFS. Dalam mono. Banyak hal yang salah dengan jalur sinyal dapat ditemukan dengan itu.

Saya telah membangun dan mengkalibrasi sistem audio yang cukup sehingga saya dapat bersiul 1 kHz dengan sangat tepat. Dari memori sederhana.

Selain itu, IGY oleh Donald Fagen sangat populer sebagai lagu uji yang dilarang oleh sejumlah festival.

pria dengan besi solder
sumber