Konversi ucapan (file audio mp3) ke teks

8

Saya mencari konverter sederhana dari mp3 ke txt. Saya telah mencoba, tanpa hasil: julius, CMU Sphinx, ... Dalam 4 jam terakhir saya tidak menemukan cara bagaimana menggunakannya (atau menginstalnya dengan benar).

Apa yang saya cari adalah sesuatu seperti:

$ converterapp -infile myspeech.mp3 -outfile myspeech.txt

Saya juga baik-baik saja dengan aplikasi GUI karena saya hanya memiliki beberapa file untuk dikonversi dan dapat mengklik sekitar.

Sunting: Dengan bantuan jawaban ini Aplikasi pengenalan ucapan untuk mengonversi MP3 menjadi teks? Saya berhasil membuatnya bekerja tetapi tidak menghasilkan output. Yah, sebenarnya itu menghasilkan beberapa baris kosong (tidak ada kata yang terdeteksi) ...

Samo
sumber
Apa perintah tepat yang Anda jalankan dan output yang Anda lihat?
Nikolay Shmyrev
1
$ pocketsphinx_continuous -infile 1.wav -hmm en-us / cmusphinx-en-us-5.2 -lm en-us / en-70k-0.2.lm -logfn / dev / null &> otput.txt adalah perintah yang tepat sesuai @NikolayShmyrev pertanyaan. Saya telah mengunduh model dari sourceforge.net/projects/cmusphinx/files/… .
Samo

Jawaban:

4

pocketsphinx akan melakukan pidato ke teks dari file audio yang ada. Tergantung pada format awal dari mp3, Anda mungkin perlu dua perintah terpisah.

Konversi file audio Anda yang sudah ada menjadi format input wajib:

    ffmpeg -i file.mp3 -ar 16000 -ac 1 file.wav

Run pocketsphinx

    pocketsphinx_continuous -infile file.wav 2> pocketsphinx.log > myspeech.txt

file myspeech.txt yang dibuat akan memiliki apa yang Anda cari.


Jika Anda baru mengenal ubuntu, Anda harus menginstal program-program di atas menggunakan perintah ini:

    sudo apt install pocketsphinx pocketsphinx-en-us ffmpeg
64pi0r
sumber
0

Mozilla SpeechDeep akan membuka alat bantu bicara-ke-teks. Anda perlu menginstal aplikasi di desktop linux Anda. Atau Anda dapat mencoba Transcribear alat bicara-ke-teks berbasis browser yang tidak memerlukan instalasi, tetapi Anda harus terhubung online untuk mengunggah rekaman ke server.

John
sumber