Bagaimana cara output teks-ke-ucapan menggunakan command-line?

Jawaban:

125

Agar popularitas menurun :

  • katakanlah konversi teks menjadi ucapan yang dapat didengar menggunakan mesin pidato GNUstep.

    sudo apt-get install gnustep-gui-runtime
    say "hello"
    
  • festival Sistem sintesis bicara multi-bahasa Umum.

    sudo apt-get install festival
    echo "hello" | festival --tts
    
  • spd-say mengirimkan permintaan keluaran teks-ke-ucapan ke speech-dispatcher

    sudo apt-get install speech-dispatcher
    spd-say "hello"
    
  • espeak adalah software synthesizer ucapan multi-bahasa.

    sudo apt-get install espeak
    espeak "hello"
    
Sylvain Pineau
sumber
13
spd-saymuncul untuk pra-instal di 14,04 dan kemudian: releases.ubuntu.com/trusty/...
Ciro Santilli新疆改造中心法轮功六四事件
3
Selain itu sudo pip install gTTS, (Google Text to Speech / github.com/pndurette/gTTS ) maka gtts-cli "hello" -o hello.mp3Anda dapat mengirimnyampg123 - juga. gtts-cli "why, hello there" | mpg123 -.
Elijah Lynn
sayangnya, spd-saysepertinya tidak bisa bermain tts secara bersamaan, hanya satu kali
phil294
@ElijahLynn tidak berfungsi
Dims
espeakSaya spd-sayadalah yang terbaik untuk meme (yang lain bahkan tidak bisa mengucapkan kata "meme" dengan benar). Terbaik yang bisa saya katakan spd-saymenggunakan espeaksebagai backend (suara-suara terdengar sama).
QwertyChouskie
18

espeak adalah alat kecil yang bagus.

Saya hanya suka bermain-main dengannya di baris perintah. Anda mungkin menemukan itu bertentangan dengan Pulseaudio jadi saya menggunakan versi panjang lebar yang meniadakan harus mengaturnya dengan benar.

sudo apt-get install espeak
espeak --stdout "this is a test" | paplay

espeak --help akan menunjukkan kepada Anda opsi untuk mengkalibrasi kecepatan membaca, nada, suara, dll.

Saat Anda membuat catatan, simpan sebagai file teks dan kemudian:

echo "these are my notes" > text.txt
espeak --stdout -f text.txt > text.wav
paplay text.wav # you should hear "these are my notes"

Anda kemudian dapat bermain-main dengan ffmeg et al untuk mengompresi ini dari PCM ke sesuatu yang lebih mudah dikelola seperti MP3 atau OGG. Tapi itu cerita yang berbeda.

Oli
sumber
1
sangat bagus, kita juga dapat mencoba Graphic User Interface untuk espeak, espeak-gui.
Sabacon
14

Dari man spd-say:

NAMA
       spd-say - kirim permintaan keluaran text-to-speech ke speech-dispatcher

RINGKASAN
       spd-say [options] "some text"

DESKRIPSI
       spd-say mengirimkan permintaan keluaran teks-ke-ucapan ke proses pengiriman-bicara yang menanganinya dan secara ideal menampilkan hasilnya
       ke sistem audio.

PILIHAN
       -r, --rate
              Setel kecepatan bicara (antara -100 dan +100, default: 0)

       -p, --pitch
              Setel nada bicara (antara -100 dan +100, default: 0)

       -i, --volume
              Atur volume (intensitas) pidato (antara -100 dan +100, default: 0)

Karenanya Anda bisa mendapatkan text-to-speech dengan mengikuti perintah:

spd-say "<type text>"

Ex:

spd-say "Welcome to Ubuntu Linux"

Anda juga dapat mengatur kecepatan bicara, nada, volume dll. Lihat halaman manual.

Pandya
sumber
3
spd-say -t female2 "text"membuatnya tertahankan
scorpiodawg
6

Mbrola tidak berfungsi sejak pukul 11.10.

Alat SVOX (pico) mudah dipasang, mudah digunakan, dan menghadirkan suara berkualitas baik di Ubuntu. Pasang itu:

sudo apt-get install libttspico0 libttspico-utils libttspico-data

Bahkan lebih mudah, Anda dapat menggunakan LibreOffice dalam kombinasi dengan alat-alat SVOX (pico) dengan menginstal ekstensi "Baca Teks" dan Anda mendapatkan "GUI" untuk perangkat lunak TTS yang sangat baik ini:

Atur opsi Baca Ekstensi Teks dengan Alat - Add-on - Baca pilihan .... Gunakan / usr / bin / python sebagai program eksternal. Pilih opsi baris perintah yang menyertakan token (PICO_READ_TEXT_PY).

leoperbo
sumber
4

Python Google Speach:

pip install google_speech

google_speech "Test the hello world"

Svox Dari Android:

apt-get install svox-pico

pico2wave --wave=test.wav "Test the hello world"
play test.wav

Svox Nanotts:

git clone https://github.com/gmn/nanotts.git
cd nanotts
make

./nanotts -v en-US "Test the hello world"

Tautan - Wiki:

Perbandingan synthesizer ucapan

intika
sumber
1
Untuk menginstal dan menggunakan google_speechdi ubuntu 18.04 saya harus menginstal python3-pipdan libsox-fmt-mp3dan menggunakan pip3 install google_speech.
artm
3

Namun gui eSpeak lain: gespeaker. Menggunakan keduanya espeakdan mbrolamesin. Juga, ia memiliki lebih banyak opsi daripada espeak-gui.

luri
sumber
3

Berikut ini bukan solusi FLOSS, tetapi Anda mungkin menganggapnya bermanfaat. (itu adalah solusi anggur ),

Saya pribadi sangat tertarik pada TTS, saya sering menggunakannya ... misalnya. mendengarkan wacana mengoceh yang saya tidak akan pernah repot untuk tetap dengan otherise (karena saya perlu mendapatkan secangkir kopi lagi ... :)

Beberapa hal yang saya temukan di sepanjang jalan .. atau harus saya katakan, hal-hal yang belum saya temukan di sepanjang jalan ... Terus terang: Setiap bagian dari perangkat lunak suara FOSS TTS yang saya coba berada di bawah par dan oleh karena itu tidak cocok untuk mendengarkan apa pun yang semi-berlarut-larut ...

Saat ini saya menggunakan NaturalVoices ATnT. Ini hanya tersedia untuk Windows (mungkin Mac), tetapi berjalan winedi bawah Ubuntu .. (memiliki glytch kecil, di mana saya kadang-kadang perlu mengklik pada panel ketika saya menjauh dari pembaca ... Ini adalah minor masalah bila dibandingkan dengan keuntungan yang diperoleh oleh kualitas bicara dari NatualVoices.

Beberapa hal lain yang saya temukan sebenarnya penting untuk pengalaman mendengarkan yang setengah masuk akal, adalah ...

  1. Program TTS ini tidak cerdas (yah mungkin sepintar babon muda) .. sehingga mereka membutuhkan setiap bantuan yang bisa mereka dapatkan. dan ada satu (dan hanya satu program Pustaka yang saya temukan yang sangat membantu dalam hal ini .. Aplikasi ini disebut ReadPlease (2003 Pro)... Aplikasi ini memungkinkan Anda untuk memodifikasi kata dan grup kata secara khusus untuk diucapkan seperti yang Anda inginkan ... Ini tidak berarti sempurna, tetapi bagi saya, itu membuat perbedaan antara seluruh proses dapat digunakan dan tidak dapat digunakan ...

  2. Pidato dalam Natural Voices "oke", tapi agak membosankan. Ada produk bagus lain juga, tetapi mereka semua untuk Windows, sayangnya) ..
    Ini kadang mengejutkan mengejutkan .. tapi OMG, awalnya itu menyakitkan! .. jadi # 2 adalah * kesabaran ... dan banyak memperbarui daftar "kata-kata khusus" Anda ... Dengan kesabaran, maksud saya Anda (saya) benar-benar menjadi terbiasa dengan pola bicara babon khusus saya:) ... dan oleh Ngomong-ngomong, saat ini saya memiliki sekitar 3000 kata yang sekarang terdengar cukup "Manusia" sehingga saya tidak lagi merasa ngeri ketika mendengarnya.

    3 .. "Ikuti Bola Memantul" ... Sekali lagi karena suaranya tidak pernah sebagus seorang pembicara sungguhan, hal-hal terkadang perlu diklarifikasi ... Program Reader yang saya gunakan memiliki satu fitur yang bahkan saya tahan dengan antarmuka yang terlihat kikuk .... Apakah memiliki opsi "pilih yang saat ini sedang dibaca" .. Banyak pembaca memiliki ini, tetapi ReadPlease tetap menggunakan baris saat ini di tengah layar .. Ini sangat berharga untuk dapat melihat ke depan dan ke belakang untuk dengan cepat membaca kembali apa yang baru saja Anda lewatkan (jadi auto-centering garis curent baik) ...

Nah itu pengalaman saya .. Saya akan membuat kopi sekarang, dan sementara saya melakukannya, saya akan mendengarkan ini, untuk melihat bagaimana "membaca" .... TTS mengejutkan baik untuk mengambil kesalahan ketik (saya membuat banyak kesalahan ketik) ...

Jika sesuatu sebagus ATnT NaturalVoices muncul di repositori Ubuntu, saya akan langsung melakukannya.

Berikut ini tautan ke beberapa contoh Suara Alami : Saya menggunakan "MIke"

Peter.O
sumber
3

Pico2wave SVOX

itulah yang saya gunakan. Dan itu terdengar alami, mudah dimengerti, ia mengenali Unit (m, ° C, kg, ...)

Inilah posting pertama saya ke pico2wave

Teks Terdengar Alami untuk Pidato?

Yang harus Anda lakukan adalah:

Buka Pusat Perangkat Lunak Ubuntu dan cari "pico". Anda akan menemukan 4 atau 5 entri dengan "Small Footprint Ling ...". Pasang mereka.

Kemungkinan penggunaan pico2wave dijelaskan dalam posting pertama saya (ikuti tautan di atas).

Sampai jumpa

pengguna85321
sumber
saya telah menggunakan cara Anda, bisakah Anda memberi tahu saya cara mendapatkan suara wanita manis alami menggunakan cara Anda
user49557
3

Karena festival(suaranya sepertinya lebih alami bagi saya):

sudo apt-get install festival

echo "hello" | festival --tts

Konfigurasi pitch dan kecepatan:

buat ~/.festivalrc:

(Parameter.set 'Audio_Command "play -b 16 -c 1 -e signed-integer -r $SR -t raw $FILE tempo 1.5 pitch -100") (Parameter.set 'Audio_Method 'Audio_Command)

Lihat juga http://www.solomonson.com/content/ubuntu-linux-text-speech

Pembaruan: dicoba di komputer ubuntu lain. Harus menginstal paket mesin pidato bahasa Inggris untuk bekerja dengan festival dengan benar:

sudo apt-get install festvox-kallpc16k

Juga playmerupakan perintah cli yang datang dengan soxpaket:

sudo apt-get install sox

d9k
sumber
2

Meskipun Anda sudah menerima jawaban, saya ingin menyebutkan festival, yang saya suka juga. Posting ini di forum Ubuntu memiliki banyak informasi tentang cara mengatur suara yang sangat bagus untuk itu.

luar biasa
sumber
2

Meet espeak-ng- Penyintesis ucapan multi-bahasa perangkat lunak:

espeak-ng "text to read"
espeak-ng -f "~/file to read"

Ini menggunakan suara bahasa Inggris default, tetapi ada banyak suara lain untuk bahasa lain dan bahkan dialek tersedia dan dapat didaftar dengan espeak-ng --voices(untuk semua) atau misalnya espeak-ng --voices=en(untuk bahasa Inggris). Mereka dapat diatur -vbersama dengan singkatan bahasa atau nama file, misalnya untuk Skotlandia atau Swahili:

espeak-ng -v en-gb-scotland "text to read" # language name
espeak-ng -v bnt/sw "text to read" # file name: “bnt” for Bantu, “sw” for Swahili

Ada banyak opsi lain yang tersedia, misalnya -suntuk kecepatan dan -wuntuk menulis output ke file wave, lihat halaman manual yang ditautkan di bawah ini.

Bacaan lebih lanjut

espeak-ng("Ng" untuk "generasi berikutnya") adalah garpu yang dikembangkan secara aktif dari espeakperangkat lunak synthesizer ucapan asli , lihat bab History di Wikipedia . Keduanya tersedia dari sumber resmi melalui paket espeakatau espeak-ngmasing - masing.

pencuci mulut
sumber
0

Balabolka di bawah Wine berfungsi dengan baik (untuk saya) dengan suara SAPI4 (suara SAPI5 tidak terdeteksi pada sistem Linux saya). Itu dapat membuka file dan mulai membaca.

Berikut ini tautan ke entri AppDB anggur untuk Balabolka: https://appdb.winehq.org/objectManager.php?sClass=application&iId=17859

Hemantkumar Garach
sumber
0

Alat gTTS sangat bagus untuk menghasilkan file audio dari teks. Ia menggunakan API text-to-speech Google Translate, dan menghasilkan file mp3.
Karena itu digunakan pipuntuk instalasi, saya sangat menyarankan Anda menginstal Miniconda, dan kemudian gunakan condauntuk membuat lingkungan tempat Anda dapat menginstal gTTS. Anda dapat mengunduh Miniconda dari sini:

https://docs.conda.io/en/latest/miniconda.html

Repositori GitHub untuk gTTS adalah:

https://github.com/pndurette/gTTS

Dan Anda dapat menemukan dokumentasi gTTS di sini:

https://gtts.readthedocs.io/en/latest/

evaristegd
sumber