Kapan kami memutuskan untuk mengambil sampel telepon di kHz? Apakah ini selalu terjadi? mengapa kita melakukan itu? Apakah karena laju bit yang lebih tinggi tidak dapat ditransfer dengan cepat? Dan apakah alasan-alasan ini masih masuk hitungan? Dan jika tidak, mengapa belum ada standar baru? Benarkah itu kHz adalah tingkat pengambilan sampel serendah mungkin untuk mentransfer ucapan yang dapat dimengerti?
Saya mencoba mencari sumber untuk ini, tetapi sepertinya tidak banyak informasi tentang itu.
Jawaban:
Jika ada yang peduli untuk menggali, saya pikir mereka akan menemukan bahwa sebelum Bell Telephone mulai membuat saluran suara yang multiplexing, mereka melakukan banyak penelitian pada frekuensi konten suara manusia. Mereka awalnya menggunakan kelompok uji untuk mengembangkan unit audio bel dan distribusi daya suara serta sensitivitas telinga manusia terhadap berbagai frekuensi. Mereka mengembangkan karakteristik pass band yang memuncak di sekitar 2,1 KHz dan bergulir di bawah 300 dan lebih dari 3000 HZ. Itu memberikan suara manusia yang bagus ketika dilakukan dengan benar. Semua itu analog.
Radio AM memperluasnya hingga 5 KHz untuk memasukkan musik yang dapat diterima oleh kebanyakan orang ketika kami masih muda dan memiliki telinga yang baik. Transformer flyback televisi dirancang untuk berjalan pada ~ 17,5 KHz karena ada angka ajaib untuk reproduksi gambardan kebanyakan orang tidak bisa mendengar rengekannya . Radio sideband tunggal dikomersialkan pada tahun 1960-an dan membutuhkan frekuensi cutoff yang sangat tajam. Saya menggunakan radio dengan filter pada 2.1 dan 3.1 KHz. 2.1 memiliki beberapa karakteristik Donald Duck. 3,1 terdengar baik-baik saja, sekali lagi dengan telinga muda. Bandpass audio ditingkatkan menjadi 20 KHZ atau lebih baik dengan FM karena frekuensi pembawa yang lebih tinggi dapat menangani bandwidth yang lebih tinggi untuk reproduksi musik yang lebih baik . Susun beberapa xylophone atau lonceng atau instrumen bernada tinggi lainnya dan mereka bisa mendapatkan energi harmonik yang cukup ke frekuensi yang lebih tinggi. OTOH, sebagaimana keadaannya, kebanyakan orang tidak bisa mendengarnya.
Intinya adalah bahwa siapa pun yang mengklaim mereka membutuhkan bandwidth 20 KHz untuk suara tidak memperhatikan. 3 KHz akan melakukannya, 5 akan memberi Anda margin. Jika tidak terdengar benar maka masalah selain bandwidth adalah masalahnya.
Ketika pensinyalan digital sedang dikembangkan, orang-orang yang tahu menemukan bahwa tidak peduli betapa anehnya bentuk gelombang itu, dapat dipecah menjadi satu set gelombang sinus. Perpaduan harmonis dari gelombang-gelombang itu menghasilkan pola suara atau musik yang spikey. Terakhir, Nyquist melakukan penelitian tentang laju pengambilan sampel digital yang diperlukan untuk mereproduksi gelombang sinus pada frekuensi tertentu. Ternyata dibutuhkan 2 sampel untuk membuat gelombang sinus sehingga frekuensi tertinggi yang akan direproduksi adalah setengah dari laju sampel. Anda ingin audio 5 KHz kemudian sampel pada 10 KHz. Baik untuk suara. Anda ingin musik dengan kesetiaan yang lebih tinggi daripada yang dapat didengar oleh kebanyakan orang, lalu sampel pada 40 KHz atau lebih untuk mendapatkan 20+ KHz.
Satu lagi berita gembira adalah sampling vs bitrate. Jika Anda mencicipi pada frekuensi tertentu, maka kalikan dengan panjang kata, Anda akan mendapatkan bitrate minimum yang diperlukan untuk menghasilkan sinyal yang diinginkan. Kurangi bitrate dan ukuran kata sampel akan dipotong untuk memenuhi laju bit baru pada laju sampel yang diberikan. Itu semua pengkodean "lossless". Ini semua dari memori dan berusaha mencari data saat ini. Itu ada di sana jika seseorang mencari kutipan. Saya tidak akan repot karena saya sudah terlalu tua untuk peduli. Saya baru saja lelah mengarungi banyak masalah mistis yang jelas ketika saya tertarik melakukan beberapa tangkapan audio.
sumber
Itu dianggap memberikan trade-off yang baik antara kualitas dan bandwidth. Sebenarnya satu sinyal suara menempati 8 kHz, bukan 8 kbps, bandwidth. Setiap sampel dikuantisasi menjadi 8 bit, menghasilkan tingkat 64 kbps yang digunakan secara universal.
Bacaan lebih lanjut:
sumber
Alasan lain adalah bahwa, sebelum transmisi sinyal digital, audio telepon digunakan untuk analog dimodulasi menjadi saluran pita sempit sehingga beberapa panggilan telepon dapat dikirim ke bawah satu tautan analog (RF dan microwave tower relay, dll.) untuk menjadi yang pertama disaring dengan low-pass untuk mempersempit bandwidth yang diperlukan untuk setiap saluran sehingga untuk mengemas jumlah terbesar saluran ke bawah satu pipa analog (tetapi meskipun demikian, pada hari yang buruk, orang dapat mendengar beberapa panggilan telepon yang berdekatan sebagai latar belakang kebisingan). Karena orang terbiasa dengan panggilan jarak jauh yang tidak memiliki frekuensi lebih tinggi dari 3,5 kHz atau lebih, bandwidth ini menjadi dapat diterima secara komersial bahkan untuk panggilan lokal.
Namun, bahkan bandwidth yang lebih sempit digunakan untuk komunikasi eksplorasi ruang angkasa awal, sehingga 3,5 kHz mungkin bukan minimum untuk ucapan yang dapat dimengerti.
sumber
Untuk menjernihkan banyak kesalahpahaman.
Pertama, tidak pernah ada modem 56k “baud”. Baud adalah tentang perubahan negara, dan maksimal pada 1200 baud. Apa pun di luar itu diperlukan pengodean yang lebih canggih.
Kedua, pendengaran manusia tidak hanya memahami nada dasar, tetapi juga banyak urutan konten harmonis jauh di atas dan di luar nada fundamental. Ketika konten harmonis itu dihapus, audio terdengar kurang alami dan menyenangkan. Audio resolusi yang lebih tinggi (dari 8KHz) lebih mudah dimengerti dan lebih enak didengar.
Ketiga, Nyquist bekerja dalam domain waktu tetap. Jika Anda memulai pengambilan sampel pada saat yang tepat dari puncak atau palung, maka Anda hanya perlu 2x laju sampel ke frekuensi. Namun, di dunia nyata titik sampel Anda dapat terjadi pada offset acak apa pun pada waktu ke puncak atau palung, oleh karena itu memerlukan tingkat pengambilan sampel yang lebih tinggi. Misalnya, jika Anda mengambil sampel gelombang sinus dan momen sampel Anda terjadi tepat pada 90 derajat diimbangi dari awal gelombang, data Anda akan menyarankan garis lurus daripada gelombang. Untuk nada dasar ini sangat penting. Untuk konten yang harmonis, itu lebih baik untuk dimiliki, dengan hasil yang semakin berkurang di dekat bagian atas rentang yang terdengar. Nyquist yang diterapkan pada pemrosesan audio adalah salah satu teorema yang paling tidak dipahami.
sumber
Seperti yang orang lain katakan 4kHz adalah standar, karena secara alami di mana suara manusia adalah sumber1 sumber2 . Saya memang menemukan artikel yang menyebutkan frekuensi fundamental ini jauh lebih rendah dari artikel 85Hz-300Hz . Apakah ini berhasil atau tidak dalam praktik, saya tidak bisa mengatakan dengan pasti. tapi patut dicoba
sumber
Sistem telepon analog memiliki filter dinding bata di 3,9 KHz. Ini melewati semua info yang diperlukan untuk ucapan yang dapat dipahami dan pengemasan bandwidth yang diizinkan. Banyak orang telah dicuci otak dalam pemikiran mereka tentang bandwidth yang diperlukan. Bandwidth 20-20.000 Hz bagus untuk musik, tetapi sama sekali tidak perlu mereproduksi pembicaraan manusia.
Adakah yang akan bertanya pada Nyquist bagaimana kami mengirim 56 sinyal faks melalui saluran analog dengan filter dinding bata 3,9 KHz. Apakah ada yang ingat mesin faks?
Nada tertinggi pada piano adalah 4186 Hz. Rentang frekuensi suara manusia kurang dari sekitar 1000 Hz. C tengah pada piano sekitar 262 Hz, hanya untuk menempatkan beberapa perspektif pada hal-hal.
sumber