Seperti apa kualitas suara saya?

33

Suara dan kualitasnya seperti agama. Cerita tidak pernah berakhir.

Orang-orang akan mengatakan, bahwa MP3 320kbps adalah lossless, sementara para ahli akan mengatakan bahwa MP3 apa pun adalah omong kosong, tetapi pada akhirnya, tidak ada yang akan mendengar perbedaan dalam hasilnya ... kecuali mereka berada di industri musik selama 20 tahun +.

Apa yang akan menjadi format terbaik untuk video game, dan properti apa yang harus cukup (Hertz, bitrate, dll.), Dengan anggapan bahwa MP3 320kbps "berat"?

Mungkin satu atau dua contoh, bagaimana beberapa judul AAA bekerja dengan suaranya.

joltmode
sumber
3
Para ahli yang mendengar perbedaan antara 320kbps MP3 dan rekaman lossless biasanya memiliki pengaturan hi-fi (sangat) mahal yang memungkinkan mereka untuk mendengar perbedaan-perbedaan ini. Bukan sesuatu yang Anda miliki di PC atau perangkat seluler biasa. Juga memainkan permainan adalah sesuatu yang berbeda dari mendengarkan musik. Ada hal-hal lain yang membuat otak Anda sibuk daripada memikirkan kualitas audio sub-par;)
bummzack
2
@bummzack, ya, selama kualitas audionya tidak begitu buruk sehingga mengganggu. Kadang-kadang saya akan menemukan permainan yang memiliki efek suara yang sangat buruk yang memiliki desis latar belakang atau -terkompresi-sangat. Namun, memasukkan hampir semua pertimbangan pada kualitas audio kemungkinan akan menghindari hal ini. Saya sarankan Anda menguji sampel Anda pada sesuatu dengan audio yang lebih tinggi. Pengkodean audio Anda bukan satu-satunya faktor yang mengarah ke audio yang bagus.
user606723
Satu-satunya alasan saya menentang MP3 adalah karena loopnya sangat buruk.
Sidar

Jawaban:

63

Perbarui Juli 2017

Jika Anda menggunakan Unity atau mesin besar lain yang memiliki sistem manajemen aset, jangan meminta Ogg Vorbis dari perancang dan komposer suara Anda. Dapatkan WAV atau AIFF.

Unity dan Unreal dirancang untuk bekerja dengan pantulan berkualitas tinggi dan kemudian menerapkan pengaturan kompresi per-platform. Memiliki aset sumber sebagai Ogg atau Mp3 berarti Anda mengompresi audio dua kali lipat dan memperkenalkan artefak tambahan tanpa manfaat.

Jika Anda melihat bahwa mulai dari ogg atau mp3 mengurangi ukuran build Anda, itu bukan alasan yang bagus. Kemungkinan itu berarti Anda melakukan pra-ekspor dengan pengaturan kompresi berbeda dari yang Anda terapkan di Unity / Unreal. Apakah ada eksekusi? Ya, tetapi Anda tidak akan mencari jawaban ini jika Anda tahu kapan pengecualian itu berlaku.

Jika Anda melakukan pra-kompresi untuk mengurangi ukuran repo Anda, gunakan LFS, gunakan sistem kontrol versi terpusat, atau nyengir dan tahan.


TL; DR

  1. Ya , MP3 320k terdengar hebat. TAPI. . .
  2. Jangan gunakan MP3, gunakan Ogg Vorbis di 44.1kHz, kualitas 6 untuk musik. Untuk efek suara, gunakan saja WAV 16/44.1 kecuali Anda benar-benar merasa perlu memangkas lemak.
  3. Jika Anda harus menggunakan MP3, seperti di Flash, coba gunakan 192k-256k (VBR 1 atau 2), tetapi Anda mungkin harus puas dengan 128k. Jangan lebih rendah dari 128rb (VBR 6).

Jawaban Sejati

Orang-orang akan mengatakan, bahwa MP3 320kbps adalah lossless, sementara para ahli akan mengatakan bahwa MP3 apa pun adalah omong kosong, tetapi pada akhirnya, tidak ada yang akan mendengar perbedaan dalam hasilnya ... kecuali mereka berada di industri musik selama 20 tahun +.

Audio yang disandikan dalam MP3, apa pun kualitas penyandiannya, selalu hilang. Ini adalah codec perseptual, dan karena itu bekerja dengan mengkodekan properti suara dari waktu ke waktu di ~ 1152 potongan sampel dalam bentuk terkompresi, dari mana sampel yang tidak terkompresi dapat diekstrapolasi oleh dekoder. Tujuannya bukan untuk membuat ulang audio asli secara akurat, hanya menyediakan satu yang "cukup baik".

Namun, seperti yang Anda katakan, 320kbps terdengar sangat bagus. Ini umumnya dianggap sama baiknya atau lebih baik dari kualitas CD. Namun, masih tidak mungkin untuk dengan sempurna membuat kembali sampel asli dari WAV terkompresi yang dikodekan sebagai MP3 320kbps.

Umumnya Ogg Vorbis adalah format yang lebih baik daripada MP3. Secara umum disepakati untuk memberi Anda kualitas yang lebih baik untuk file ukuran yang sama, dan tidak seperti MP3 dapat dengan mudah dilingkarkan dengan mulus. Potongan-potongan sampel 1152 yang digunakan MP3 untuk menyandikan audio akan sering meninggalkan keheningan di awal dan akhir suara. Bukan masalah besar untuk efek suara dasar, tetapi masalah besar untuk loop musik.

Flash IDE menyiasatinya selama ekspor .swf, ini menghapus keheningan secara manual. Orang-orang yang menggunakan streaming audio (atau mxmlc murni) mencapai perulangan melalui SampleDataEvent dan secara manual menjatuhkan sampel atau preprocessing file MP3 (lihat blog Andre Michelle dan utilitas mp3loop CompuPhase )

Selain itu, menggunakan dekoder MP3 secara teknis mengharuskan Anda memperoleh lisensi paten untuk digunakan (karena paten MP3 dimiliki oleh Technicolor, Fraunhofer, dan lainnya). Tentunya banyak orang telah merilis game freeware yang menggunakan MP3, tetapi yang terbaik adalah tidak bermain-main dengan itu.

Apa yang akan menjadi format terbaik untuk video game, dan properti apa yang harus cukup (Hertz, bitrate, dll.), Dengan anggapan bahwa MP3 320kbps "berat"?

Mungkin satu atau dua contoh, bagaimana beberapa judul AAA bekerja dengan suaranya.

Itu tergantung: Apa platform target Anda, teknologi apa yang Anda gunakan, bagaimana Anda mendistribusikan game Anda, dan gaya apa yang Anda tuju? Saya akan memecah ini menjadi beberapa kategori berdasarkan platform, teknologi, dan estetika.

Judul PC dan Konsol Kelas Atas

Game AAA akan mendapatkan kualitas produksi terbaik, jadi mereka merekam dan memproduksi aset tanpa kompresi 24bit / 48kHz (juga standar untuk film pascaproduksi). Judul dengan ambisi yang sedikit lebih rendah daripada yang dikatakan Battlefield 3 mungkin merekam dan memproduksi dalam 16 / 44.1, yang merupakan standar resmi untuk audio kualitas CD.

Tentu saja Anda tidak bisa mengirim sekelompok 24/48 WAV terkompresi dengan permainan, itu akan terlalu besar. Jadi pada akhirnya harus ada semacam kompresi yang terjadi. Secara umum aturannya adalah, jika itu adalah efek suara cepat seperti suara senjata (seperti Portal 2 gun fizzle dalam jawaban Sprunth), tidak masalah untuk membiarkannya sebagai WAV, mungkin mengurangi laju sampel tergantung pada frekuensi (lihat Teorema Nyquist , suara yang terdiri dari konten frekuensi rendah dapat dikodekan pada laju pengambilan sampel yang lebih rendah). Untuk musik, tidak ada jalan lain untuk kompresi. Ogg Vorbis dengan kualitas CD adalah caranya (44.1kHz, kualitas 5-6 atau lebih tinggi).

Juga, game AAA akan sering menggunakan alat perantara untuk kompresi, baik alat in-house atau audio middleware seperti FMOD atau Wwise. Cara kerjanya di FMOD dan Wwise adalah bahwa Anda mengimpor sebagian besar hal sebagai WAV 16 / 44.1 atau 24/48 (atau, jika suara semua konten frekuensi rendah, itu dapat diimpor dengan laju pengambilan sampel yang lebih rendah), lalu berikan FMOD faktor kompresi untuk setiap aset, memilih penyandian seperti ADPCM, MP3, atau Ogg Vorbis.

FMOD sebenarnya baru-baru ini menjatuhkan dukungan untuk pengkodean aset di bank suara yang Anda ekspor dari FMOD Designer (file .fsb) sebagai Ogg Vorbis yang mendukung codec baru dari Xiph yang disebut CELT . Ogg Vorbis bisa sedikit sulit pada CPU, jadi CELT sedang dikembangkan untuk memberikan alternatif. Anda dapat memuat file secara langsung, tetapi tidak lagi digunakan untuk encoding dari aplikasi Designer.

Ngomong-ngomong, inilah tautan keren tentang audio Battlefield Bad Company yang juga sedikit menyelimuti. DICE cukup banyak di garis depan teknologi audio dalam game, jadi ini adalah seri yang bagus untuk dipelajari.

Juga, terkait dengan surround adalah masalah mono vs stereo. Kalau-kalau Anda tidak tahu, semua efek suara Anda harus mono, kecuali beberapa dari mereka benar-benar memanfaatkan efek panning. Stereo canggung untuk meringkas ke dalam lingkungan 3d, dan Anda dapat memasukkan suara dalam kode untuk menempatkannya di lingkungan 2d.

Judul Slightly-Less-High-End, Indie Games

Jelas ini bisa sangat bervariasi. Pandangan sekilas menunjukkan bahwa Frozen Synapse menggunakan sepenuhnya file Ogg Vorbis, untuk efek suara dan musik. Dungeons of Dredmor mengikuti skema Ogg Vorbis untuk musik, dan 16/44.1 WAV untuk efek suara.

Pendekatan Dungeons of Dredmor lebih disukai. Bahkan disimpan sebagai WAV yang tidak terkompresi, efek suara pada umumnya cukup singkat sehingga tidak memakan banyak ruang, dan Anda menghemat banyak siklus CPU tanpa harus men-decode mereka. Anda ingin dapat dengan cepat memuat efek suara ke dalam memori dan memainkannya. Jika Anda menyandikan efek suara di Ogg Vorbis, ada potensi untuk sedikit penundaan sebelum pemain mendengar efek suara Anda untuk pertama kalinya.

Game Browser, HTML5, dan Flash (dengan sedikit Mobile)

Audio HTML5 berantakan. Anda harus menyediakan versi ogg dan MP3 untuk suara Anda. Encode dalam kualitas tertinggi yang Anda bisa tanpa pengguna Anda mengamuk di waktu buka yang lama. Untuk MP3, jangan di bawah 128k, itu cukup buruk di 128.

Flash hanya menerima MP3 16bit / 44.1kHz kecuali Anda gila dan menulis dekoder sendiri untuk beberapa format lain (seperti dekoder Ogg Vorbis eksperimental di laboratorium Alkimia). Di masa lalu, Flash memiliki masalah dengan Variable Bit Rate MP3, tapi saya tidak pernah punya masalah. Pengaturan kualitas yang Anda pilih untuk game Flash Anda akan tergantung pada seberapa besar Anda ingin .swf final Anda menjadi.

Pembaruan: Seperti yang disebutkan Tetrad , game seluler harus dipertimbangkan dengan memori dan penyimpanan. Cara Anda menyandikan audio untuk gim seluler sama seperti Flash, Anda ingin mempertahankan kualitas setinggi mungkin, tetapi pada akhirnya Anda harus menyesuaikan dengan memori dan anggaran penyimpanan. Musik pelacak sangat baik jika Anda memiliki anggaran penyimpanan yang terbatas untuk musik. Beri tahu komposer Anda untuk membatasi palet sampelnya dan Anda dapat memuat lebih banyak musik di gim ini.

"8-bit" atau Efek Suara dan Musik Tipe Chiptune

Sebagian besar game hanya akan melakukan apa yang Frozen Synapse dan Dungeons of Dredmor lakukan. Namun, Anda mungkin bisa lolos dengan mengurangi laju sampling dan kedalaman bit. Tidak hanya cocok dengan estetika yang Anda tuju, tetapi juga bisa menghemat ruang.

Juga, musik pelacak umumnya menyimpan sampel dengan laju sampel rendah, biarkan saja.

michael.bartnett
sumber
Efek suara dijelaskan. Periode.
joltmode
1
Apakah Anda memiliki tautan untuk klaim bahwa FMOD menjatuhkan dukungan untuk Ogg Vorbis?
Kylotan
1
Saya harus mengklarifikasi, mereka tidak menjatuhkan semua dukungan untuk Ogg Vorbis. Ini tidak lagi tersedia ketika memilih codec untuk aset di FMOD Designer (jawaban yang diperbarui untuk mencerminkan hal ini). Mereka tidak membuat pengumuman besar tentang itu, saya menemukan ketika saya pergi mencoba dan menyandikan beberapa musik di soundbank sebagai Ogg Vorbis. Posting KVR menyebutkannya: kvraudio.com/news/… Tapi Anda bisa dengan mudah mengunduh FMOD Designer dan melihatnya sendiri.
michael.bartnett
1
@emddudley Jika audio sumber Anda adalah sesuatu yang gila seperti 48bit / 196kHz maka Anda dapat mengompresnya sedemikian rupa sehingga mempertahankan jumlah frekuensi dan informasi amplitudo yang gila dan dengan demikian memiliki kesetiaan yang lebih tinggi daripada audio CD, yang diperbaiki pada 16bit / 44.1kHz.
michael.bartnett
1
@DavidDimalanta WAV umumnya jauh lebih besar dari MP3, tetapi dengan sisi positifnya Anda tidak harus men-decode-nya, cukup masukkan dalam memori. Musik latar umumnya dikompresi karena alasan ini, karena audio yang disimpan menjadi lebih panjang, ukuran bertambah dengan cepat. MP3 memiliki masalah dengan lisensi dan pengulangan mulus seperti yang saya sebutkan di asnwer, jadi sebaiknya hindari jika Anda bisa.
michael.bartnett
14

Bagaimana industri bekerja dengan suara, saya tidak yakin.

Tetapi melihat melalui game saya, sebagian besar dari mereka membungkusnya dalam beberapa file dat atau sebaliknya.

Berikut adalah beberapa bit audio yang bisa saya tarik:

  • Deus Ex: Human Revolution (Menu Utama [lagu]) mp3 44100Hz 320kb / s
  • Portal 2 (4000 Derajat Kelvin [lagu]) mp3 44100Hz 128kb / s
  • Portal 2 (Portal Gun fizzle [soundfx]) wav 44100Hz 16bits / sampel
  • Faksi Risiko ("NORMALLOOP_SEGMENT03" [soundfx]) ogg 48000Hz 128kb / s
  • Panggilan Juarez Bound in Blood ("COJ2_Attack_16" [lagu]) ogg 48000Hz 350kb / s
  • Zombie Driver ("pickup_money" [soundfx], "main_menu" [lagu]) ogg 44100Hz 128kb / s
  • X3 Terran Conflict ("00025" [lagu]) mp3 22050Hz 56kb / s
  • Bejeweled 3 ("Coastal" [ambient]) ogg 44100Hz 96kb / s

Karena saya tidak dapat membongkar file dat, dll (kecuali GCF Portal 2), hasilnya mungkin tidak menunjukkan spektrum di pasar. Saya mencoba memberi Anda contoh game, dan ini yang tidak mengemas audio mereka tampaknya menunjukkan hasil yang sama.

Sprunth
sumber
4000 Degrees Kelvinberasal dari Portal pertama, bukan yang kedua.
val berkata Reinstate Monica
6

Dalam pengalaman saya (kebanyakan judul ponsel), kualitas audio harus serendah mungkin tanpa efek samping negatif sehingga Anda memiliki lebih banyak memori untuk hal-hal lain.

Perlu diingat bahwa hanya karena ada kompresi yang terlibat tidak berarti kualitas Anda terlalu rendah. Audiens Anda tidak akan melakukan perbandingan berdampingan dengan basis yang terdengar seperti Anda, jadi jika mereka kehilangan sesuatu melalui kompresi yang hilang, mereka umumnya tidak akan mengetahuinya.

Misalnya, Anda harus bertanya pada diri sendiri apakah ada alasan untuk menggunakan suara stereo atau musik. Apakah efeknya memberi Anda hampir dua kali lipat overhead? Untuk musik, tergantung bagaimana penulisannya, jawabannya mungkin ya. Beberapa mesin bahkan tidak mendukung sumber stereo untuk efek suara. Hal semacam itu.

Di mana garis itu sangat subyektif, tentu saja. Ada jawaban lain yang masuk ke aturan praktis yang lebih spesifik.

Yang penting adalah memiliki standar, menetapkannya lebih awal, dan berusaha untuk menaatinya. Jika Anda membuat musik untuk game dan harus setengah bitrate-nya agar sesuai dengan memori, maka Anda akan jauh lebih buruk daripada jika Anda menetapkan tingkat kualitas rendah di tempat pertama.

Tetrad
sumber
4

Jika Anda menargetkan platform tertentu - iPhone, Xbox 360, PS3 - Anda harus melihat apakah perangkat keras memiliki decoder audio. Jika demikian, Anda harus menggunakannya. Anda akan menghemat waktu CPU (dan masa pakai baterai!) Dengan melepas audio, dan Anda akan dapat memanfaatkan sepenuhnya API platform tersebut. Lebih penting lagi, bahwa akselerasi perangkat keras akan bergantung pada audio Anda dalam format tertentu - jadi pilihan Anda sudah akan dibuat.

Namun, jika Anda menargetkan PC, maka opsi Anda lebih bervariasi. Saya hanya memilih format dengan ukuran file terkecil yang masih terdengar bagus di telinga Anda, dan jalankan dengan itu.

Blair Holloway
sumber
Bisakah Anda sedikit lebih spesifik tentang konsol yang berbeda?
Quazi Irfan
Gagasan utamanya adalah menargetkan PC, sistem operasi yang berbeda. * NIX (termasuk Mac), Windows. Namun nantinya akan berkembang menjadi iOS, Android. Samping konsol untuk saat ini.
joltmode
4

Itu tergantung pada apa yang akan 'mengaburkan' pengkodean lossy - jika Anda melihat jawaban Sprunth tren umum untuk musik adalah kualitas tinggi untuk menu, dan kualitas rendah untuk musik dalam game. Alasannya mungkin karena:

  • Dalam menu, satu-satunya suara yang diputar adalah musik - dan karenanya 'dalam fokus'; Anda akan melihat bitrate rendah yang lossy.
  • Dalam gim Anda memiliki efek suara (ledakan dll.) Selain musik yang dimainkan pada volume yang lebih rendah; artinya Anda tidak akan melihat kehilangan kualitas.
  • Panggilan pengembang Juarez tampaknya suka berlebihan.

Akhirnya tren lain dari jawabannya adalah bahwa sebagian besar efeknya adalah 44KHz / 16bit; tetapi beberapa game lama memungkinkan Anda untuk berlari pada 22KHz / 16bit ('Kualitas suara') - jika kartu suara Anda tidak dapat menangani laju sampel yang lebih tinggi.

Jonathan Dickinson
sumber