Einleitung

In dieser Demo von Text to Speech wird Ihnen die Leistung des Systems, welches geschriebene Texte erkennt und diese in eine Sprachausgabe umwandelt und wiedergibt, vorgestellt. Diese API wurde speziell für die vietnamesische Sprache entwickelt.

System kann zur Anwendung für Menschen mit Sehbehinderungen von Vorteil sein. Aber auch im Bereich der digitalen Magazine kann sie von Nutzen sein.


Anwendung

Das Text to Speech System erkennt das geschrieben Text, versteht sie und wandelt sie in eine künstlich hergestellte Audioausgabe mit entsprechender Aussprache und Intonation um. Die künstlich hergestellte Audio wird dem Benutzer während des Produzieren der Audio abgespielt, ermöglicht durch die die Anwendung von HTTP-Chunked-Codierung.


Lösung und Technologien

  • Client Side: HTML, CSS und JavaScript
  • WaveNet, Hidden-Markov-Modell, neuronales Netzwerk

Vorteile

  • Natürliche und menschenähnliche Stimmen tragen zu einer verbesserten Kundenerfahrung bei.
  • Ein konsistentes Markenimage kann durch die Verwendung einer einzelnen TTS Stimmen über mehrere Kontaktpunkte hinweg garantiert werden.
  • Mit seiner Fähigkeit, dynamische Inhalte zu vokalisieren, minimiert es die Arbeitsbelastung von Call-Center Agenturen.
  • Durch die zunehmende Automatisierung beschleunigt es den Kundenservice und senkt die Betriebskosten.