Mengapa audio telepon sampel pada 8 kHz?

8

Kapan kami memutuskan untuk mengambil sampel telepon di $8$ kHz? Apakah ini selalu terjadi? mengapa kita melakukan itu? Apakah karena laju bit yang lebih tinggi tidak dapat ditransfer dengan cepat? Dan apakah alasan-alasan ini masih masuk hitungan? Dan jika tidak, mengapa belum ada standar baru? Benarkah itu $8$ kHz adalah tingkat pengambilan sampel serendah mungkin untuk mentransfer ucapan yang dapat dimengerti?

Saya mencoba mencari sumber untuk ini, tetapi sepertinya tidak banyak informasi tentang itu.

audio sampling Lewistrick
sumber

2

Tidak selalu demikian, karena saluran telepon dulu benar-benar analog.

Simon B

2

bahkan, mereka mungkin masih sepenuhnya analog untuk panggilan lokal dalam pertukaran yang sama. tapi saya tidak tahu. tetapi bahkan ketika mereka analog, ada batasan bandwidth dan "kualitas suara" adalah kriteria yang cukup.

robert bristow-johnson

Hanya supaya kita tidak bingung ... dan Baud rate penyegaran dan bit rate tidak sama .. Baud adalah "Bits at Unit Density". Baud adalah tingkat pensinyalan, Bit adalah laju informasi. jadi jika tingkat BAUD Anda adalah 1200 baud dan Anda melewati 4 bit per siklus clock Anda menjalankan 4800 bit per detik .. Kami memiliki modem DSP yang mampu melewati 150Kb / s ke saluran telepon analog tetapi teknik modulasi sangat canggih dan digunakan di mana saja dari 256 hingga 512 nada audio untuk memindahkan data ke dalam pipa .. serta menyamakan garis dan menghapus penundaan .. Saya ingat melihat beberapa modem yang w

Keith

Ah menemukannya ... Robotika AS membuat Modem 2400 BAUD yang disebut Sportster HST v92. itu 2.400 Baud tetapi melewati 21.600 bit per detik. Jadi ada 2.400 modem BAUD di pasar pada pertengahan 90-an

Keith

4

Jika ada yang peduli untuk menggali, saya pikir mereka akan menemukan bahwa sebelum Bell Telephone mulai membuat saluran suara yang multiplexing, mereka melakukan banyak penelitian pada frekuensi konten suara manusia. Mereka awalnya menggunakan kelompok uji untuk mengembangkan unit audio bel dan distribusi daya suara serta sensitivitas telinga manusia terhadap berbagai frekuensi. Mereka mengembangkan karakteristik pass band yang memuncak di sekitar 2,1 KHz dan bergulir di bawah 300 dan lebih dari 3000 HZ. Itu memberikan suara manusia yang bagus ketika dilakukan dengan benar. Semua itu analog.
Radio AM memperluasnya hingga 5 KHz untuk memasukkan musik yang dapat diterima oleh kebanyakan orang ketika kami masih muda dan memiliki telinga yang baik. Transformer flyback televisi dirancang untuk berjalan pada ~ 17,5 KHz karena ada angka ajaib untuk reproduksi gambardan kebanyakan orang tidak bisa mendengar rengekannya . Radio sideband tunggal dikomersialkan pada tahun 1960-an dan membutuhkan frekuensi cutoff yang sangat tajam. Saya menggunakan radio dengan filter pada 2.1 dan 3.1 KHz. 2.1 memiliki beberapa karakteristik Donald Duck. 3,1 terdengar baik-baik saja, sekali lagi dengan telinga muda. Bandpass audio ditingkatkan menjadi 20 KHZ atau lebih baik dengan FM karena frekuensi pembawa yang lebih tinggi dapat menangani bandwidth yang lebih tinggi untuk reproduksi musik yang lebih baik . Susun beberapa xylophone atau lonceng atau instrumen bernada tinggi lainnya dan mereka bisa mendapatkan energi harmonik yang cukup ke frekuensi yang lebih tinggi. OTOH, sebagaimana keadaannya, kebanyakan orang tidak bisa mendengarnya.

Intinya adalah bahwa siapa pun yang mengklaim mereka membutuhkan bandwidth 20 KHz untuk suara tidak memperhatikan. 3 KHz akan melakukannya, 5 akan memberi Anda margin. Jika tidak terdengar benar maka masalah selain bandwidth adalah masalahnya.

Ketika pensinyalan digital sedang dikembangkan, orang-orang yang tahu menemukan bahwa tidak peduli betapa anehnya bentuk gelombang itu, dapat dipecah menjadi satu set gelombang sinus. Perpaduan harmonis dari gelombang-gelombang itu menghasilkan pola suara atau musik yang spikey. Terakhir, Nyquist melakukan penelitian tentang laju pengambilan sampel digital yang diperlukan untuk mereproduksi gelombang sinus pada frekuensi tertentu. Ternyata dibutuhkan 2 sampel untuk membuat gelombang sinus sehingga frekuensi tertinggi yang akan direproduksi adalah setengah dari laju sampel. Anda ingin audio 5 KHz kemudian sampel pada 10 KHz. Baik untuk suara. Anda ingin musik dengan kesetiaan yang lebih tinggi daripada yang dapat didengar oleh kebanyakan orang, lalu sampel pada 40 KHz atau lebih untuk mendapatkan 20+ KHz.

Satu lagi berita gembira adalah sampling vs bitrate. Jika Anda mencicipi pada frekuensi tertentu, maka kalikan dengan panjang kata, Anda akan mendapatkan bitrate minimum yang diperlukan untuk menghasilkan sinyal yang diinginkan. Kurangi bitrate dan ukuran kata sampel akan dipotong untuk memenuhi laju bit baru pada laju sampel yang diberikan. Itu semua pengkodean "lossless". Ini semua dari memori dan berusaha mencari data saat ini. Itu ada di sana jika seseorang mencari kutipan. Saya tidak akan repot karena saya sudah terlalu tua untuk peduli. Saya baru saja lelah mengarungi banyak masalah mistis yang jelas ketika saya tertarik melakukan beberapa tangkapan audio.

nothermark
sumber

5

Itu dianggap memberikan trade-off yang baik antara kualitas dan bandwidth. Sebenarnya satu sinyal suara menempati 8 kHz, bukan 8 kbps, bandwidth. Setiap sampel dikuantisasi menjadi 8 bit, menghasilkan tingkat 64 kbps yang digunakan secara universal.

Bacaan lebih lanjut:

Emre
sumber

3

Ketika sinyal suara disampel pada 8 khz, bandwidthnya diasumsikan kurang dari 4khz bukan 8khz. Juga bitrate PCM 64 kbps mentah yang dihasilkan dapat diturunkan dengan teknik DPCM dan ADPCM hingga 32 kbps atau 16 kbps setiap kali efisiensi diperlukan.

Fat32

Itu benar. Tidak hanya itu, dijamin untuk menempati kurang dari 4 kHz melalui penyaringan low-pass. Kalau tidak, alias terjadi.

Emre

maka saya kira Anda harus meninjau jawaban Anda dengan mengatakan "Sebenarnya satu sinyal suara menempati 8 kHz, bukan 8 kbps, bandwidth". Sinyal suara dapat menempati spektrum penuh 20-20 khz, tetapi hanya 4khz pertama yang diambil dalam transmisi.

Fat32

Saya pikir Anda bermaksud mengatakan bahwa telinga manusia dapat membedakan frekuensi dalam kisaran itu? Itu masalah yang berbeda.

Emre

2

Alasan lain adalah bahwa, sebelum transmisi sinyal digital, audio telepon digunakan untuk analog dimodulasi menjadi saluran pita sempit sehingga beberapa panggilan telepon dapat dikirim ke bawah satu tautan analog (RF dan microwave tower relay, dll.) untuk menjadi yang pertama disaring dengan low-pass untuk mempersempit bandwidth yang diperlukan untuk setiap saluran sehingga untuk mengemas jumlah terbesar saluran ke bawah satu pipa analog (tetapi meskipun demikian, pada hari yang buruk, orang dapat mendengar beberapa panggilan telepon yang berdekatan sebagai latar belakang kebisingan). Karena orang terbiasa dengan panggilan jarak jauh yang tidak memiliki frekuensi lebih tinggi dari 3,5 kHz atau lebih, bandwidth ini menjadi dapat diterima secara komersial bahkan untuk panggilan lokal.

Namun, bahkan bandwidth yang lebih sempit digunakan untuk komunikasi eksplorasi ruang angkasa awal, sehingga 3,5 kHz mungkin bukan minimum untuk ucapan yang dapat dimengerti.

hotpaw2
sumber

1

Untuk menjernihkan banyak kesalahpahaman.

Pertama, tidak pernah ada modem 56k “baud”. Baud adalah tentang perubahan negara, dan maksimal pada 1200 baud. Apa pun di luar itu diperlukan pengodean yang lebih canggih.

Kedua, pendengaran manusia tidak hanya memahami nada dasar, tetapi juga banyak urutan konten harmonis jauh di atas dan di luar nada fundamental. Ketika konten harmonis itu dihapus, audio terdengar kurang alami dan menyenangkan. Audio resolusi yang lebih tinggi (dari 8KHz) lebih mudah dimengerti dan lebih enak didengar.

Ketiga, Nyquist bekerja dalam domain waktu tetap. Jika Anda memulai pengambilan sampel pada saat yang tepat dari puncak atau palung, maka Anda hanya perlu 2x laju sampel ke frekuensi. Namun, di dunia nyata titik sampel Anda dapat terjadi pada offset acak apa pun pada waktu ke puncak atau palung, oleh karena itu memerlukan tingkat pengambilan sampel yang lebih tinggi. Misalnya, jika Anda mengambil sampel gelombang sinus dan momen sampel Anda terjadi tepat pada 90 derajat diimbangi dari awal gelombang, data Anda akan menyarankan garis lurus daripada gelombang. Untuk nada dasar ini sangat penting. Untuk konten yang harmonis, itu lebih baik untuk dimiliki, dengan hasil yang semakin berkurang di dekat bagian atas rentang yang terdengar. Nyquist yang diterapkan pada pemrosesan audio adalah salah satu teorema yang paling tidak dipahami.

Kaya
sumber

Apakah Anda memiliki referensi untuk klaim tidak ada modem di atas 1200 baud? Saya percaya klaim itu salah. Juga, untuk apa nilainya, paragraf tentang pengambilan sampel salah. Ketika mengambil sampel gelombang sinus, setiap laju sampling lebih besar dari dua kali frekuensi sinus sudah cukup, terlepas dari fase.

MBaz

0

Seperti yang orang lain katakan 4kHz adalah standar, karena secara alami di mana suara manusia adalah sumber1 sumber2 . Saya memang menemukan artikel yang menyebutkan frekuensi fundamental ini jauh lebih rendah dari artikel 85Hz-300Hz . Apakah ini berhasil atau tidak dalam praktik, saya tidak bisa mengatakan dengan pasti. tapi patut dicoba

andrew
sumber

0

Sistem telepon analog memiliki filter dinding bata di 3,9 KHz. Ini melewati semua info yang diperlukan untuk ucapan yang dapat dipahami dan pengemasan bandwidth yang diizinkan. Banyak orang telah dicuci otak dalam pemikiran mereka tentang bandwidth yang diperlukan. Bandwidth 20-20.000 Hz bagus untuk musik, tetapi sama sekali tidak perlu mereproduksi pembicaraan manusia.

Adakah yang akan bertanya pada Nyquist bagaimana kami mengirim 56 sinyal faks melalui saluran analog dengan filter dinding bata 3,9 KHz. Apakah ada yang ingat mesin faks?

Nada tertinggi pada piano adalah 4186 Hz. Rentang frekuensi suara manusia kurang dari sekitar 1000 Hz. C tengah pada piano sekitar 262 Hz, hanya untuk menempatkan beberapa perspektif pada hal-hal.

pengguna1634448
sumber

Mengapa audio telepon sampel pada 8 kHz?

Jawaban: