Text To Speech#

E-Books vorlesen lassen per mbrola#

Die Literatur gibt es frei verfügbar im Projekt Gutenberg. Die Stimme von de6/de6 von mbrola konnte ich länger als 10 Sekunden aushalten.

Workflow auf der Linux-Kommandozeile:

$ cat read-it-loud.sh 
#!/usr/bin/sh
cat Clemens_Brentano-Drei_Nuesse-pg4505.txt|espeak -v mb-de6 --stdin|mbrola -e /usr/share/mbrola/de6/de6 - - |aplay -t wav -f S16_LE -r 22050 -c 1 -q

Vergleich von TTS-Systemen#

Intro

Workflow von Shirin Elsinghorst:

espeak -v german -w 'tongue_twister_intro2.wav' 'Computer haben angefangen mit uns zu reden! 
Dahinter stecken sogenannte Text-to-Speech (TTS) Systeme. 
Durch neuronale Netze, Deep Learning und viele Trainingsdaten sind die in den letzten Jahren immer 
besser und besser geworden. 
In manchen Fällen kann man sogar kaum noch zwischen Mensch und Maschine unterscheiden.'

https://blog.codecentric.de/2018/06/vergleich-von-text-to-speech-systemen/

Vorlesen mit Google Text To Speech#

Warnung: das geht momentan nur mit Cloudanbindung:

  • Sprachsynthesevergleich mit Google-TTS oder Cepstral, espeak, festival - dadurch bin ich auf das realistischere Google-TTS bei translate aufmerksam geworden
  • https://cloud.google.com/text-to-speech
  • http://archive.is/OgeSS#selection-9.0-9.1108
    • Deutsch: an der passenden Stelle die deutsche Stimme auswählen: mpg123 -q "[http://translate.google.com/translate_tts?ie=UTF-8&client=tw-ob&q=$NEXTURL&tl=De-de"]
    • Niederländisch: an der passenden Stelle die niederländische Stimme auswählen: mpg123 -q "[http://translate.google.com/translate_tts?ie=UTF-8&client=tw-ob&q=$NEXTURL&tl=nl-NL"]
    • Französisch: an der passenden Stelle in speech-fr die frz. Stimme auswählen: mpg123 -q "[http://translate.google.com/translate_tts?ie=UTF-8&client=tw-ob&q=$NEXTURL&tl=fr-FR"]
    • Polniczsch: an der passenden Stelle die polniczsche Stimme auswählen: mpg123 -q "[http://translate.google.com/translate_tts?ie=UTF-8&client=tw-ob&q=$NEXTURL&tl=pl-PL"]
  • Mehr Stimmen (180 in der kommerziellen Variante): https://cloud.google.com/text-to-speech/docs/voices
  • Das alte Testament mit frz. Akzent klingt mit test-fr-at.pl ganz anders:
use strict; use warnings;

open IN, "altes_testament_luther_revidiert-utf8.txt" or die "Dateilesefehler: @_!\n";
print "Hinweis: Strg+Z bricht ab, kill %1 entfernt den pausierten Job; Strg+C springt (nur) zum nächsten Teilsatz.\n";
while (<IN>){ print $_; system( "./speech-fr '$_'"); }

Vorlesen übersetzter Texte#

Manchmal möchte ich mir Literatur anderer Landessprachen in hiesiger Übersetzung vorlesen lassen.
Dazu kann ich mittlerweile auf eine ziemlich gut trainierte Übersetzungsmöglichkeit per DeepL zugreifen.
Der Aufruf dazu muss dann in die o.g. Workflows eingepasst werden.

---

Zuletzt aktualisiert: 11.06.2020

Add new attachment

Only authorized users are allowed to upload new attachments.
« This page (revision-6) was last changed on 13-Jun-2020 11:24 by Markus Monderkamp