Saya mencari beberapa yang mudah untuk menginstal perangkat lunak text to speech untuk Ubuntu yang terdengar alami. Saya telah menginstal Festival
, Gespeaker
dll., Tetapi tidak ada yang terdengar sangat alami. Semua sangat sintetis dan sulit dimengerti.
Adakah rekomendasi di luar sana?
software-recommendation
text-to-speech
I Heart Ubuntu
sumber
sumber
Jawaban:
Pico2wave SVOX
TTS yang sangat minimalis, terdengar lebih baik daripada espeak atau mbrola (menurut saya). Beberapa informasi di sini .
Saya tidak mengerti mengapa pico2wave, dibandingkan dengan espeak atau mbrola, jarang dibahas. Ini kecil, tetapi terdengar sangat bagus (alami). Tanpa modifikasi Anda akan mendengar suara wanita yang terdengar alami.
DAN ... dibandingkan dengan Mbrola, ia mengenali Unit dan berbicara dengan cara yang benar!
Sebagai contoh:
Setelah instalasi saya menggunakannya dalam skrip:
Kemudian jalankan dengan teks yang diinginkan:
atau baca isi seluruh file:
Itu semua untuk memiliki TTS yang ringan dan stabil di Ubuntu.
sumber
pico2wave
dalam paketlibttspico-utils
dalam versi terbaru dari ubuntu. @ CarlosEugenioThompsonPinzóncat <filename> | xargs -I foo -0 pico2wave -w blah.wav foo
pico2wave -w a.wav "$(input.txt)"
=). Setuju bahwa antarmuka CLI ini adalah desain yang buruk: tidak seperti sebagian besar CLI, dan mungkin untuk mencapai panjang OS max CLI arg .echo {1..1000}
Katakanlah!
Saya percaya saya telah menemukan perangkat lunak TTS terbaik secara gratis menggunakan ekstensi Google Chrome yang disebut "SpeakIt". Ini hanya berfungsi di browser Chrome untuk saya di Ubuntu. Itu tidak berfungsi dengan Chromium untuk beberapa alasan. SpeakIt hadir dengan dua suara wanita yang keduanya terdengar sangat realistis dibandingkan dengan semua yang lain di luar sana. Setidaknya ada empat suara pria & wanita terdaftar ekstensi Chrome jika Anda mencari di Toko Web Chrome menggunakan "TTS" sebagai permintaan Anda.
Penggunaan : Untuk digunakan di situs web. Anda menyorot teks yang ingin dibaca dan klik kanan dan "SpeakIt" atau klik ikon SpeakIt yang merapat di bar bagian atas Chrome.
Pengguna Firefox juga memiliki dua opsi. Di dalam addons Firefox, lakukan pencarian untuk TTS dan Anda harus menemukan "Klik Bicara" dan juga "Teks ke Suara". Suara-suara itu tidak sebagus suara Chrome SpeakIt, tetapi jelas dapat digunakan.
Ekstensi SpeakIt menggunakan teknologi iSpeech dan dengan harga $ 20 per tahun, situs ini dapat mengkonversi teks ke file audio MP3. Anda dapat memasukkan teks, URL, umpan RSS, serta dokumen seperti TXT, DOC, dan PDF dan hasilkan ke MP3. Anda dapat membuat podcast, menyematkan audio, dll. Ini adalah tautan , dan contoh audio mereka (tidak tahu berapa lama tautan itu akan bertahan).
sumber
Pico dan espeak menyenangkan dan mudah untuk bekerja, tetapi mereka tidak terlalu baik. Suara Festival default juga tidak sebagus itu. Namun, Festival adalah kerangka bicara berbasis skema, di mana sejumlah peneliti telah membangun suara plug-in yang jauh lebih baik. Anda dapat dengan mudah melampaui kualitas pico2wave pada stok Ubuntu, karena salah satu dari suara-suara itu tersedia sebagai paket siap pakai.
Untuk membuat Festival terdengar alami, inilah yang harus dilakukan:
Anda dapat melakukannya dari baris perintah dengan menggunakan
-b
(atau--batch
) dan menempatkan setiap perintah ke dalam tanda kutip tunggal:Anda bisa mendapatkan suara-suara lain yang cukup bagus dari repositori Nitech, tetapi menginstalnya cukup rewel, dan jalur defaultnya diubah sehingga referensi nama file dalam file skema yang dibundel mungkin perlu diedit secara manual untuk bekerja pada stok Ubuntu.
sumber
Google ™ TTS sederhana
Pembaruan dari halaman proyek (2019-02) : Proyek ini saat ini tidak terawat dan akan tetap demikian untuk masa mendatang
Karena kurangnya alternatif yang lebih baik saya menulis skrip bash yang berinteraksi dengan skrip perl oleh Michal Fapso untuk menyediakan TTS melalui Google Translate. Dari deskripsi proyek:
Fitur utamanya adalah:
Instalasi dan penggunaan didokumentasikan pada halaman proyek .
Saya akan senang jika Anda mencobanya. Laporan bug dan umpan balik lainnya dipersilahkan!
sumber
Saya telah mencari tinggi dan rendah untuk text to speech untuk Ubuntu yang berkualitas tinggi. Tidak ada. Pita suara saya lumpuh jadi saya perlu TTS untuk menambahkan instruksi suara ke video Ubuntu saya . Anda bisa mendapatkan perangkat lunak teks ke ucapan komersial Linux berkualitas tinggi di sini . Ini sangat mahal. Saya akhirnya membeli Natural Reader untuk Windows (tidak berfungsi di Ubuntu di bawah Wine) seharga $ 40. Mungkin nanti saya akan mendapatkan Linux.
sumber
Saya telah melakukan penelitian pada teks terbaik untuk terdengar dan disetel ke suara pidato. Di bawah ini adalah daftar dari apa yang saya pikir 5 produk teratas dalam urutan kualitas suara. Sebagian besar situs web yang terkait dengan produk ini memiliki demo interaktif yang memungkinkan Anda membuat keputusan sendiri.
sumber
Saya menemukan suara-suara Nitech HTS di festival sangat alami dan menghibur dibandingkan suara-suara lain yang saya dengar. Lihat tautan ini tentang cara mengatur Nitech dan suara lainnya dengan festival. Saya belum menemukan gui bagus yang bisa saya gunakan untuk mengonfigurasi suara-suara itu tetapi mengaturnya melalui festival.scm masih berfungsi. Posting itu sudah sangat tua dan Anda mungkin ingin mencari direktori instalasi yang sebenarnya menggunakan perintah "loc festival"
sumber
Gabungkan alat SVOX (pico) dengan LibreOffice:
Alat SVOX (pico) mudah dipasang dan menghadirkan suara berkualitas baik di Ubuntu. Pasang itu:
Anda dapat menggunakan LibreOffice dalam kombinasi dengan alat SVOX (pico) dengan menginstal ekstensi "Baca Teks" dan Anda mendapatkan "GUI" untuk perangkat lunak TTS yang luar biasa ini:
Atur opsi Baca Ekstensi Teks dengan Alat - Add-on - Baca pilihan .... Gunakan / usr / bin / python sebagai program eksternal. Pilih opsi baris perintah yang menyertakan token (PICO_READ_TEXT_PY) , Anda mungkin ingin mencoba beberapa di antaranya.
Sekarang Anda hanya perlu memilih beberapa teks dalam LO Writer, Calc, Impress atau Draw dan klik pada ikon yang ditambahkan sebagai bilah alat (wajah bahagia dengan ballon).
sumber
Inilah yang saya lakukan untuk memiliki pidato alami murni untuk pdf dan file teks lainnya (solusi lain tidak alami atau mereka hanya layanan berbayar). Ini sebenarnya adalah pekerjaan menggunakan chromium atau chrome tetapi bekerja dengan cepat dan mudah.
Ada juga cara untuk membuka file lain seperti .doc dan .txt di chrome dan lakukan hal yang sama. Ada ekstensi lain untuk chrome yang menampilkan file pdf, periksa apakah cocok untuk Anda. Selain itu Anda dapat mengunggah semua jenis teks di Google Drive dan menggunakan SpeakIt! untuk membacanya untuk Anda. Ekstensi lain yang disebut 'Bicara teks' bekerja dengan cara yang sama dan memiliki ucapan alami.
sumber
Ketika mencari mesin tts yang lebih baik untuk digunakan dengan mode naratif firefox 49 baru saya menemukan pico tts (svox) - mesin TTS favorit saya.
Bagaimana cara mengubah lebar sistem mesin sintesis bicara default?
Orang-orang di arch linux membawa saya ke jalan yang benar:
Batalkan komentar pada modul yang Anda suka dan jadikan default dalam pengaturan dispatcher ucapan:
Mulai ulang daemon:
NAMUN, ketika memulai firefox lagi, tidak ada yang terjadi. Menurut tautan di atas (posting forum lengkung # 10 dan # 16) berfungsi dengan festival (tidak mencoba), tetapi pengirim pesan untuk pico tidak mencantumkan suara yang tersedia. Itu tidak akan berjalan.
Setiap ide di luar sana akan sangat dihargai ;-)
sumber
Program text-to-speech favorit saya disebut Magic English, tetapi seperti Natural Reader yang disebutkan oleh Joe Steiger, ini adalah program Windows dan saya tidak yakin apakah itu akan berjalan di bawah Wine.
AT&T Natural Voices tersedia online sebagai demo, tetapi itu lebih merupakan solusi daripada solusi ...
sumber
Google ™ TTS sederhana
Pico, mbrola, cmu, festival, flite, semua SUCK di 2017 (Mereka luar biasa di tahun 90-an). Pidato alami AT&T (yang fantastis) bukan linux compat dan tidak gratis, oleh karena itu kami menggunakan Google
sumber
gTTS
Cons : CLI-only. Harus daring karena harus meminta titik akhir terbuka Google publik.
Pemakaian
Dokumentasi dan lebih banyak contoh
Lainnya
Beberapa sudah disebutkan
Mimik . Instalasi:
eSpeak + Gespeaker (GUI) ( kode sumber Gespeaker )
Cons : Tua dan jelek
sumber
Untuk itu saya membangun Intelligent Speaker - ekstensi untuk Google Chrome. Ia dapat membaca halaman bahkan tanpa seleksi (ketika penahanan teks benar).
sumber