Apa spesifikasi teknis yang harus ditetapkan untuk musik?

11

Saya sedang menulis musik untuk permainan video. Pada titik tertentu, saya perlu bekerja dengan programmer untuk menentukan spesifikasi teknis untuk file audio yang akan saya serahkan kepada mereka. Jenis rincian apa yang perlu kita bicarakan?

Sebagai contoh, beberapa pertanyaan yang saya pikir perlu kita selesaikan adalah:

  • Dalam format apa file audio itu berada?
    • Terkompresi? Kerugian? Terkompresi?
    • Apa keseimbangan antara ukuran file audio dan kecil berkualitas tinggi?
  • Seberapa keras seharusnya musik itu?
    • Apa yang harus menjadi tingkat volume rata-rata setiap trek?
    • Apa yang harus menjadi tingkat volume paling keras?
  • Apa yang seharusnya menjadi distribusi frekuensi?
    • Misalnya, haruskah saya menulis musik yang tidak memiliki banyak bass sehingga foley bernada rendah dapat dengan mudah didengar?

Apakah saya memikirkan pertanyaan penting untuk diajukan? Adakah pertanyaan lain yang harus kita diskusikan?

Kevin
sumber
Ini sepertinya sangat luas ...
5
Saya pikir ini pertanyaan yang bagus, karena akan membentuk sumber yang bermanfaat bagi orang lain.
Insinyur
2
satu hal yang terlintas dalam pikiran adalah prioritas suara. Ini sangat jelas dalam gim seperti Diablo di mana Anda memiliki banyak efek memunculkan semua membombardir speaker Anda secara bersamaan. Untuk menghindarinya menjadi berisik ketika banyak aksi sedang berlangsung, Anda perlu meredam beberapa bunyi yang kurang penting seperti langkah kaki dan ambient untuk membuat yang penting seperti mantera kunci yang harus bereaksi pemain terhadap yang terlihat, dan naikkan Volume mereka sekali perkelahian telah cukup turun. Ini juga tergantung pada kemampuan perangkat keras berapa banyak saluran yang dapat Anda gunakan.
ScrambledRK

Jawaban:

6

Jika saya mengerti dengan benar, Anda memiliki dua pertanyaan berbeda di sini:

  1. Apa pertimbangan teknis (seperti dalam pemrograman) yang harus ditetapkan?

  2. Apa pertimbangan teknis (seperti dalam rekayasa audio) yang harus ditetapkan?

Untuk kedua pertanyaan, taruhan terbaik Anda adalah meminta penanggung jawab. Untuk yang pertama, itu bisa menjadi programmer audio utama, sedangkan untuk yang kedua bisa menjadi direktur audio.

Sekarang, saya kira karena Anda menanyakan hal ini di sini, Anda berada di tim kecil tanpa peran seperti itu, dan programmer Anda mungkin tidak tahu apa yang Anda bicarakan, jadi saya akan menjawab dengan beberapa jenderal pedoman yang dapat bekerja untuk sebagian besar proyek. Tapi bagaimanapun, saya tidak akan merekomendasikan membuat keputusan sendiri. Diskusikan dengan anggota tim Anda yang lain untuk mencapai kesimpulan.

Yang mengatakan, mari kita bicara tentang beberapa pertimbangan teknis (pemrograman).

  • Biasanya, format di mana file audio Anda akan didistribusikan sudah ditentukan oleh platform atau mesin gim yang Anda gunakan. Jika Anda akan melakukan multi-platform, kemungkinan setiap platform akan memiliki direktori sumber daya yang sepenuhnya independen, dan karakteristik file audio mungkin berbeda untuk setiap platform.

    Misalnya, Anda mungkin diharuskan menyerahkan file Ogg Vorbis untuk Android, MP3 atau AAC untuk iOS dan WMA untuk Windows.

    Terkadang, bahkan formatnya tergantung pada tujuan dari setiap file. Sementara iOS bermain bagus dengan file MP3 dan AAC untuk tujuan apa pun, PlayStation Mobile membutuhkan MP3 untuk BGM, tetapi hanya mendukung PCM atau Microsoft ADPCM yang tidak terkompresi.

    Tanyakan kepada programmer Anda format apa yang harus ada dalam file.

  • Sebagian besar waktu, spesifikasi dasar untuk file sudah ditentukan, jadi pastikan Anda bertanya kepada programmer Anda tentang ini. Misalnya, file BGM biasanya didistribusikan dalam stereo, sedangkan file SFX dan suara biasanya didistribusikan dalam mono (sehingga mereka dapat dengan mudah diposisikan di dalam permainan)

  • Untuk bitrate dan parameter lainnya, sekali lagi, mereka biasanya bergantung pada engine atau platform. Jika Anda memiliki kebebasan di sini, pertimbangkan bahwa data suara biasanya merupakan komponen terbesar dari sebuah gim, dan jika gim tersebut akan didistribusikan melalui unduhan digital, programmer Anda (dan pelanggan Anda) akan berterima kasih jika Anda menjadikan file sebagai kecil mungkin.

    Jika Anda akan mendistribusikan di media fisik, maka ukuran distribusi maksimum sudah ditentukan sebelumnya, dan Anda harus melakukan beberapa negosiasi serius dengan anggota tim pembuat konten lainnya.

  • Beberapa game membutuhkan suara Anda (kebanyakan BGM) untuk dapat diulang; gim lain membutuhkan suara Anda untuk memiliki batasan waktu yang ketat (seperti gim irama). Sebagian besar skema kompresi lossy akan menambahkan padding silence pada awal dan akhir trek yang dapat memutus loop dan timing yang ketat. Diskusikan masalah ini dengan programmer Anda.

Ada terlalu banyak cara untuk mengompres audio, jadi yang saya sarankan Anda adalah untuk menghasilkan versi master dari setiap file suara di PCM terkompresi pada 44.1KHz 16 bit Stereo, dan kemudian menggunakan file itu untuk membuat file aktual untuk setiap platform. (Secara optimal, Anda bisa membuat skrip transformasi yang dapat diterapkan ke setiap file sehingga Anda tidak harus mengubah ulang setiap file setiap kali Anda membuat perubahan kecil pada file master).

Sekarang, dalam hal pertimbangan teknis (seperti dalam rekayasa audio), programmer Anda kemungkinan besar tidak akan peduli, sehingga Anda akan memiliki lebih banyak kebebasan di bidang ini. Ada beberapa hal yang dapat Anda lakukan untuk membuat hidup programmer Anda lebih mudah:

  • Semua suara dalam game harus dinormalisasi kenyaringannya. Paling tidak, semua file BGM harus memiliki kenyaringan yang sama di antara mereka, dan semua file SFX harus memiliki kenyaringan yang sama di antara mereka. Jangan membuat pemrogram Anda harus mengubah volume di dalam kode.

  • Kode pemutaran sangat terbatas, dan biasanya hanya dapat melakukan amplifikasi linier. Karena ini, antara kenyaringan tinggi dan rendah, tinggi mungkin lebih disukai, karena mengurangi volume selama pemutaran biasanya menghasilkan hasil yang lebih baik daripada memperkuatnya. Sulit untuk mengatakan apa yang harus menjadi kenyaringan yang tepat, tetapi sebagai patokan, semakin besar amplitudo puncak-ke-puncak keseluruhan, semakin baik Anda menggunakan rentang pengambilan sampel.

    Anda mungkin ingin memuat game lain dan memainkan suaranya pada pengaturan volume maksimum dan membandingkan suara Anda dengan suaranya.

  • Dalam hal pemerataan, saya harus mengatakan ini benar-benar tergantung pada suara apa yang akan dimiliki gim Anda. Selain membahas hal ini dengan sound director, Anda mungkin ingin juga mempertimbangkan perangkat keras pemutaran yang akan Anda gunakan: sementara komputer desktop mungkin memiliki beragam perangkat keras pemutaran, perangkat genggam biasanya memiliki speaker yang sangat kecil, dan Anda mungkin ingin mengimbangi itu. Mesin arcade biasanya memiliki persyaratan yang jauh berbeda juga.

Piyama Panda
sumber
Satu hal yang perlu diperhatikan, untuk SFX saya benci file stereo. Saya perlu menggabungkan mereka ke mono di mesin sehingga saya bisa memasukkannya ke mesin suara 3D dengan benar. Akibatnya semua mungkin SFX asli, misalnya suara foley adalah mono.
rioki
2

Saya membedakan antara dua situasi, apa yang saya simpan selama pengembangan dan kemudian (penyimpanan) dan apa yang saya masukkan ke pengiriman akhir.

Untuk penyimpanan saya menggunakan kualitas setinggi mungkin, yaitu untuk audio beberapa format yang lossless. Selama kompresi itu lossless itu tidak masalah; WAV atau FLAC akan melakukannya. Saya pada dasarnya baik-baik saja dengan rekaman 44,1 kHz / 16 bit dan volume harus "alami" mungkin, jadi pada dasarnya rekaman asli dengan gain minimal jika diperlukan. (Jika Anda benar-benar menginginkannya, Anda bisa menggunakan rekaman 96 kHz atau 192 kHz.) Ukuran tidak terlalu penting, hard disk tidak semahal itu dan Anda selalu bisa melempar lebih banyak pada masalah itu. Alasan utamanya adalah bahwa Anda selalu dapat memampatkan ke dalam format lossy dari lossless, tetapi begitu Anda hanya memiliki file lossy, Anda tidak akan pernah bisa pindah ke kualitas yang lebih tinggi.

Untuk pengiriman itu benar-benar cerita yang berbeda. Di sini Anda perlu membuat beberapa pilihan sulit tentang kualitas vs ruang vs kecepatan. Untuk SFX kecil saya menggunakan file WAV karena mereka memuat yang tercepat. Musik di sisi lain tidak masalah, jadi saya biasanya menggunakan MP3 dengan bitrate variabel. Anda bisa lolos dengan file 64 kbps, tapi itu masalah selera. Suara-suara pada dasarnya harus pada volume alami mereka, meskipun seimbang satu sama lain. Mesin game kemudian akan melakukan penyesuaian apa pun yang diperlukan, terutama jika Anda melakukan sesuatu seperti suara 3D.

rioki
sumber
Anda tahu bahwa PCM yang tidak terkompresi pada 44.1KHz 16 bit stereo berjalan pada sekitar 1300kbps, kan? Audio berkompresi 320kbps akan terdengar mengerikan.
Panda Pajama
Benar itu, saya kebanyakan mengacu pada audio terkompresi. 128kbps FLAC terdengar cukup baik.
rioki
"kbps" sebagai pengaturan encoder tidak masuk akal untuk FLAC atau encoder lossless lainnya. Kualitas ukuran vs (suara) hanya masuk akal pada kompresi lossy. Apakah Anda yakin FLAC itu yang Anda bicarakan?
Panda Pajama
Anda benar, itu adalah pembicaraan programmer. "Kecepatan bit" didasarkan pada rekaman asli. Yang biasanya saya lakukan 44 kHz, yang baik-baik saja. Anda bisa mendapatkan anal dan melakukan rekaman 96kHz atau 192 kHz. Saya akan mengubah apa yang sebenarnya saya maksudkan ...
rioki
1
44KHz, 96KHz dan 192KHz adalah "laju sampling", bukan "bitrate". Itu bukan ide yang baik untuk membuat mereka bingung karena sampling rate * sample size * channel count = bitrate. Itu sebabnya bitrate untuk stereo 16.1KHz 44bit persis 1411200 bit / s. 320kbps suara stereo 16 bit harus disampel pada 10KHz, dan oleh karena itu komentar "saya akan terdengar mengerikan".
Panda Pajama