Pengenalan ucapan - MP3 ke perangkat lunak teks [tertutup]

16

Saya mencari program independen pembicara (komersial atau gratis) yang memungkinkan saya untuk menyalin file MP3 yang berisi rekaman pidato (terutama podcast) ke teks. Saya ingin mencoba Dragon Naturally Speaking, tetapi sepertinya itu hanya mendukung menyalin rekaman pidato saya sendiri. Jadi apa saja alternatifnya?

pako
sumber
Komentar Avi: Saya tidak percaya itu mungkin - pembicara independen
Ivo Flipse
sistem operasi apa?
studiohack
Windows atau Linux.
pako

Jawaban:

7

Dragon Naturally Speaking akan mengimpor file mp3 dan mencoba menyalinnya. Ini lebih memilih untuk menyetel pengenalan suaranya ke speaker individu, tetapi melakukan pekerjaan yang adil tanpa penyetelan. Mungkin akan bekerja lebih baik jika speaker podcast Anda terdengar seperti Tom Brokaw.

moioci
sumber
2
Saya mencoba Dragon Naturally Speaking, tetapi itu berhasil dengan sangat baik untuk podcast dengan speaker yang tidak dikenal. Itu hanya bekerja dengan cukup baik dengan suara saya sendiri setelah pelatihan program.
pako
1
Bisakah itu juga mengimpor file audio lain dan menyalinnya?
Larry Morries
4

Salah satu solusi yang mungkin adalah mengunggah video Anda ke Youtube, dan mencoba teks otomatis yang dapat Anda aktifkan ... itu belum terlalu akurat, tetapi Anda dapat mengunduh file teks dan mengeditnya sendiri, jika itu membantu ... seperti untuk masalah hak cipta / pembajakan lagu, Anda dapat membuat video pribadi di profil Anda, jika itu mungkin?

studiohack
sumber
1
@studioback: Apakah metode ini oleh Youtube hanya berlaku untuk video sendiri, bukan yang diunggah oleh orang lain?
StackExchange for All
1
@ Tim: itu untuk keduanya, sebenarnya.
studiohack
1
@studiohack: Untuk video yang diunggah oleh orang lain, bagaimana cara melakukannya? Maksud saya, tanpa mengunduh dan mengunggah sebagai video saya sendiri?
StackExchange for All
1
Pada sebagian besar video, ada ikon CC di bagian bawah, klik dan kemudian transkripsi otomatis ...
studiohack
2

Saya akan memperingatkan untuk tidak mencoba Dragon Naturally Speaking - Saya menulis beberapa skrip pada iphone saya yang sudah di-jailbreak untuk menyalin / mengonversi semua file voicemail dari ponsel saya ke folder di PC saya dan membuat layanan transkripsi Dragon Naturally Speaking berjalan melawan mereka.

Hasil menjalankan transkripsi terhadap file dengan speaker yang berbeda benar-benar tidak dapat digunakan. Saya sudah mencoba beberapa alternatif open source tetapi pengenalan suara yang independen-speaker tampaknya masih terbatas pada kamus yang sangat kecil.

nvuono
sumber
1

Saya menggunakan http://www.voicebase.com dengan podcast dan video dalam bahasa Inggris dan berfungsi dengan sangat baik. Gratis selama 50 jam audio.

Anda dapat mengunduh transkripsi audio di rtf, srt atau pdf.

Anda dapat mengunduh transkripsi mesin sekitar 10-15 menit setelah mengunggah, dan terkadang, lebih awal.

Juan Antonio Tubío
sumber
1

Sumber Terbuka: CMU Sphinx

Shareware: http://www.e-speaking.com/ (Windows)

Komersial: Dragon NaturallySpeaking (Windows)

Anda juga bisa mencoba metode ini jika Anda mencoba dengan osx yang dapat dilakukan menggunakan audacity dan soundflower

Anda juga bisa menemukan beberapa link yang relevan untuk opensource lain senilai shareware untuk dicoba adalah voxcribecc

Jika Anda seorang programmer .net, Anda dapat menggunakan metode ini untuk membuat kit Anda sendiri

BlueBerry - Vignesh4303
sumber
0

Podzinger akan menjadi solusi yang hebat, tetapi saya tidak yakin bahwa ramp (nama baru untuk perusahaan yang dulunya adalah EveryZing, yang memproduksi Podzinger) menawarkan layanan gratis lagi ...

http://en.wikipedia.org/wiki/Podzinger

Zach
sumber