Bagaimana cara mendapatkan keluaran ucapan dari teks yang dimasukkan dengan menggunakan command-line?
Juga fasilitas untuk mengubah kecepatan bicara, nada, volume dll menggunakan perintah sederhana .
Bagaimana cara mendapatkan keluaran ucapan dari teks yang dimasukkan dengan menggunakan command-line?
Juga fasilitas untuk mengubah kecepatan bicara, nada, volume dll menggunakan perintah sederhana .
Jawaban:
Agar popularitas menurun :
katakanlah konversi teks menjadi ucapan yang dapat didengar menggunakan mesin pidato GNUstep.
festival Sistem sintesis bicara multi-bahasa Umum.
spd-say mengirimkan permintaan keluaran teks-ke-ucapan ke speech-dispatcher
espeak adalah software synthesizer ucapan multi-bahasa.
sumber
spd-say
muncul untuk pra-instal di 14,04 dan kemudian: releases.ubuntu.com/trusty/...sudo pip install gTTS
, (Google Text to Speech / github.com/pndurette/gTTS ) makagtts-cli "hello" -o hello.mp3
Anda dapat mengirimnyampg123 -
juga.gtts-cli "why, hello there" | mpg123 -
.spd-say
sepertinya tidak bisa bermain tts secara bersamaan, hanya satu kaliespeak
Sayaspd-say
adalah yang terbaik untuk meme (yang lain bahkan tidak bisa mengucapkan kata "meme" dengan benar). Terbaik yang bisa saya katakanspd-say
menggunakanespeak
sebagai backend (suara-suara terdengar sama).espeak
adalah alat kecil yang bagus.Saya hanya suka bermain-main dengannya di baris perintah. Anda mungkin menemukan itu bertentangan dengan Pulseaudio jadi saya menggunakan versi panjang lebar yang meniadakan harus mengaturnya dengan benar.
espeak --help
akan menunjukkan kepada Anda opsi untuk mengkalibrasi kecepatan membaca, nada, suara, dll.Saat Anda membuat catatan, simpan sebagai file teks dan kemudian:
Anda kemudian dapat bermain-main dengan ffmeg et al untuk mengompresi ini dari PCM ke sesuatu yang lebih mudah dikelola seperti MP3 atau OGG. Tapi itu cerita yang berbeda.
sumber
Dari
man spd-say
:Karenanya Anda bisa mendapatkan text-to-speech dengan mengikuti perintah:
Ex:
Anda juga dapat mengatur kecepatan bicara, nada, volume dll. Lihat halaman manual.
sumber
spd-say -t female2 "text"
membuatnya tertahankanMbrola tidak berfungsi sejak pukul 11.10.
Alat SVOX (pico) mudah dipasang, mudah digunakan, dan menghadirkan suara berkualitas baik di Ubuntu. Pasang itu:
Bahkan lebih mudah, Anda dapat menggunakan LibreOffice dalam kombinasi dengan alat-alat SVOX (pico) dengan menginstal ekstensi "Baca Teks" dan Anda mendapatkan "GUI" untuk perangkat lunak TTS yang sangat baik ini:
Atur opsi Baca Ekstensi Teks dengan Alat - Add-on - Baca pilihan .... Gunakan / usr / bin / python sebagai program eksternal. Pilih opsi baris perintah yang menyertakan token (PICO_READ_TEXT_PY).
sumber
Python Google Speach:
Svox Dari Android:
Svox Nanotts:
Tautan - Wiki:
Perbandingan synthesizer ucapan
sumber
google_speech
di ubuntu 18.04 saya harus menginstalpython3-pip
danlibsox-fmt-mp3
dan menggunakanpip3 install google_speech
.Namun gui eSpeak lain:
gespeaker
. Menggunakan keduanyaespeak
danmbrola
mesin. Juga, ia memiliki lebih banyak opsi daripadaespeak-gui
.sumber
Berikut ini bukan solusi FLOSS, tetapi Anda mungkin menganggapnya bermanfaat. (itu adalah solusi anggur ),
Saya pribadi sangat tertarik pada TTS, saya sering menggunakannya ... misalnya. mendengarkan wacana mengoceh yang saya tidak akan pernah repot untuk tetap dengan otherise (karena saya perlu mendapatkan secangkir kopi lagi ... :)
Beberapa hal yang saya temukan di sepanjang jalan .. atau harus saya katakan, hal-hal yang belum saya temukan di sepanjang jalan ... Terus terang: Setiap bagian dari perangkat lunak suara FOSS TTS yang saya coba berada di bawah par dan oleh karena itu tidak cocok untuk mendengarkan apa pun yang semi-berlarut-larut ...
Saat ini saya menggunakan NaturalVoices ATnT. Ini hanya tersedia untuk Windows (mungkin Mac), tetapi berjalan
wine
di bawah Ubuntu .. (memiliki glytch kecil, di mana saya kadang-kadang perlu mengklik pada panel ketika saya menjauh dari pembaca ... Ini adalah minor masalah bila dibandingkan dengan keuntungan yang diperoleh oleh kualitas bicara dari NatualVoices.Beberapa hal lain yang saya temukan sebenarnya penting untuk pengalaman mendengarkan yang setengah masuk akal, adalah ...
Program TTS ini tidak cerdas (yah mungkin sepintar babon muda) .. sehingga mereka membutuhkan setiap bantuan yang bisa mereka dapatkan. dan ada satu (dan hanya satu program Pustaka yang saya temukan yang sangat membantu dalam hal ini .. Aplikasi ini disebut
ReadPlease (2003 Pro)
... Aplikasi ini memungkinkan Anda untuk memodifikasi kata dan grup kata secara khusus untuk diucapkan seperti yang Anda inginkan ... Ini tidak berarti sempurna, tetapi bagi saya, itu membuat perbedaan antara seluruh proses dapat digunakan dan tidak dapat digunakan ...Pidato dalam Natural Voices "oke", tapi agak membosankan. Ada produk bagus lain juga, tetapi mereka semua untuk Windows, sayangnya) ..
Ini kadang mengejutkan mengejutkan .. tapi OMG, awalnya itu menyakitkan! .. jadi # 2 adalah * kesabaran ... dan banyak memperbarui daftar "kata-kata khusus" Anda ... Dengan kesabaran, maksud saya Anda (saya) benar-benar menjadi terbiasa dengan pola bicara babon khusus saya:) ... dan oleh Ngomong-ngomong, saat ini saya memiliki sekitar 3000 kata yang sekarang terdengar cukup "Manusia" sehingga saya tidak lagi merasa ngeri ketika mendengarnya.
3 .. "Ikuti Bola Memantul" ... Sekali lagi karena suaranya tidak pernah sebagus seorang pembicara sungguhan, hal-hal terkadang perlu diklarifikasi ... Program Reader yang saya gunakan memiliki satu fitur yang bahkan saya tahan dengan antarmuka yang terlihat kikuk .... Apakah memiliki opsi "pilih yang saat ini sedang dibaca" .. Banyak pembaca memiliki ini, tetapi ReadPlease tetap menggunakan baris saat ini di tengah layar .. Ini sangat berharga untuk dapat melihat ke depan dan ke belakang untuk dengan cepat membaca kembali apa yang baru saja Anda lewatkan (jadi auto-centering garis curent baik) ...
Nah itu pengalaman saya .. Saya akan membuat kopi sekarang, dan sementara saya melakukannya, saya akan mendengarkan ini, untuk melihat bagaimana "membaca" .... TTS mengejutkan baik untuk mengambil kesalahan ketik (saya membuat banyak kesalahan ketik) ...
Jika sesuatu sebagus ATnT NaturalVoices muncul di repositori Ubuntu, saya akan langsung melakukannya.
Berikut ini tautan ke beberapa contoh Suara Alami : Saya menggunakan "MIke"
sumber
Pico2wave SVOX
itulah yang saya gunakan. Dan itu terdengar alami, mudah dimengerti, ia mengenali Unit (m, ° C, kg, ...)
Inilah posting pertama saya ke pico2wave
Teks Terdengar Alami untuk Pidato?
Yang harus Anda lakukan adalah:
Buka Pusat Perangkat Lunak Ubuntu dan cari "pico". Anda akan menemukan 4 atau 5 entri dengan "Small Footprint Ling ...". Pasang mereka.
Kemungkinan penggunaan pico2wave dijelaskan dalam posting pertama saya (ikuti tautan di atas).
Sampai jumpa
sumber
Karena
festival
(suaranya sepertinya lebih alami bagi saya):sudo apt-get install festival
echo "hello" | festival --tts
Konfigurasi pitch dan kecepatan:
buat
~/.festivalrc
:(Parameter.set 'Audio_Command "play -b 16 -c 1 -e signed-integer -r $SR -t raw $FILE tempo 1.5 pitch -100") (Parameter.set 'Audio_Method 'Audio_Command)
Lihat juga http://www.solomonson.com/content/ubuntu-linux-text-speech
Pembaruan: dicoba di komputer ubuntu lain. Harus menginstal paket mesin pidato bahasa Inggris untuk bekerja dengan festival dengan benar:
sudo apt-get install festvox-kallpc16k
Juga
play
merupakan perintah cli yang datang dengansox
paket:sudo apt-get install sox
sumber
Meskipun Anda sudah menerima jawaban, saya ingin menyebutkan
festival
, yang saya suka juga. Posting ini di forum Ubuntu memiliki banyak informasi tentang cara mengatur suara yang sangat bagus untuk itu.sumber
Meet
espeak-ng
- Penyintesis ucapan multi-bahasa perangkat lunak:Ini menggunakan suara bahasa Inggris default, tetapi ada banyak suara lain untuk bahasa lain dan bahkan dialek tersedia dan dapat didaftar dengan
espeak-ng --voices
(untuk semua) atau misalnyaespeak-ng --voices=en
(untuk bahasa Inggris). Mereka dapat diatur-v
bersama dengan singkatan bahasa atau nama file, misalnya untuk Skotlandia atau Swahili:Ada banyak opsi lain yang tersedia, misalnya
-s
untuk kecepatan dan-w
untuk menulis output ke file wave, lihat halaman manual yang ditautkan di bawah ini.Bacaan lebih lanjut
man espeak-ng
espeak-ng
("Ng" untuk "generasi berikutnya") adalah garpu yang dikembangkan secara aktif dariespeak
perangkat lunak synthesizer ucapan asli , lihat bab History di Wikipedia . Keduanya tersedia dari sumber resmi melalui paketespeak
atauespeak-ng
masing - masing.sumber
Balabolka di bawah Wine berfungsi dengan baik (untuk saya) dengan suara SAPI4 (suara SAPI5 tidak terdeteksi pada sistem Linux saya). Itu dapat membuka file dan mulai membaca.
Berikut ini tautan ke entri AppDB anggur untuk Balabolka: https://appdb.winehq.org/objectManager.php?sClass=application&iId=17859
sumber
Alat gTTS sangat bagus untuk menghasilkan file audio dari teks. Ia menggunakan API text-to-speech Google Translate, dan menghasilkan file mp3.
Karena itu digunakan
pip
untuk instalasi, saya sangat menyarankan Anda menginstal Miniconda, dan kemudian gunakanconda
untuk membuat lingkungan tempat Anda dapat menginstal gTTS. Anda dapat mengunduh Miniconda dari sini:https://docs.conda.io/en/latest/miniconda.html
Repositori GitHub untuk gTTS adalah:
https://github.com/pndurette/gTTS
Dan Anda dapat menemukan dokumentasi gTTS di sini:
https://gtts.readthedocs.io/en/latest/
sumber