Saya mencari program independen pembicara (komersial atau gratis) yang memungkinkan saya untuk menyalin file MP3 yang berisi rekaman pidato (terutama podcast) ke teks. Saya ingin mencoba Dragon Naturally Speaking, tetapi sepertinya itu hanya mendukung menyalin rekaman pidato saya sendiri. Jadi apa saja alternatifnya?
16
Jawaban:
Dragon Naturally Speaking akan mengimpor file mp3 dan mencoba menyalinnya. Ini lebih memilih untuk menyetel pengenalan suaranya ke speaker individu, tetapi melakukan pekerjaan yang adil tanpa penyetelan. Mungkin akan bekerja lebih baik jika speaker podcast Anda terdengar seperti Tom Brokaw.
sumber
Salah satu solusi yang mungkin adalah mengunggah video Anda ke Youtube, dan mencoba teks otomatis yang dapat Anda aktifkan ... itu belum terlalu akurat, tetapi Anda dapat mengunduh file teks dan mengeditnya sendiri, jika itu membantu ... seperti untuk masalah hak cipta / pembajakan lagu, Anda dapat membuat video pribadi di profil Anda, jika itu mungkin?
sumber
Saya akan memperingatkan untuk tidak mencoba Dragon Naturally Speaking - Saya menulis beberapa skrip pada iphone saya yang sudah di-jailbreak untuk menyalin / mengonversi semua file voicemail dari ponsel saya ke folder di PC saya dan membuat layanan transkripsi Dragon Naturally Speaking berjalan melawan mereka.
Hasil menjalankan transkripsi terhadap file dengan speaker yang berbeda benar-benar tidak dapat digunakan. Saya sudah mencoba beberapa alternatif open source tetapi pengenalan suara yang independen-speaker tampaknya masih terbatas pada kamus yang sangat kecil.
sumber
Saya menggunakan http://www.voicebase.com dengan podcast dan video dalam bahasa Inggris dan berfungsi dengan sangat baik. Gratis selama 50 jam audio.
Anda dapat mengunduh transkripsi audio di rtf, srt atau pdf.
Anda dapat mengunduh transkripsi mesin sekitar 10-15 menit setelah mengunggah, dan terkadang, lebih awal.
sumber
Sumber Terbuka: CMU Sphinx
Shareware: http://www.e-speaking.com/ (Windows)
Komersial: Dragon NaturallySpeaking (Windows)
Anda juga bisa mencoba metode ini jika Anda mencoba dengan osx yang dapat dilakukan menggunakan audacity dan soundflower
Anda juga bisa menemukan beberapa link yang relevan untuk opensource lain senilai shareware untuk dicoba adalah voxcribecc
Jika Anda seorang programmer .net, Anda dapat menggunakan metode ini untuk membuat kit Anda sendiri
sumber
Podzinger akan menjadi solusi yang hebat, tetapi saya tidak yakin bahwa ramp (nama baru untuk perusahaan yang dulunya adalah EveryZing, yang memproduksi Podzinger) menawarkan layanan gratis lagi ...
http://en.wikipedia.org/wiki/Podzinger
sumber