thumb

Das Start-up Spokenlayer ist seit ein paar Tagen für Apples iOS erhältlich. Die Anwendung liefert Sprachausgabe für ausgewählte Texte im Internet. Sofort nach der Veröffentlichung eines Textes stellt Spokenlayer eine Hör-Version durch Sprachsynthese-Software her.

Das Besondere an der App ist aber, dass die Maschinen-gelesenen Texte durch von Menschen gesprochene Versionen ersetzt werden, sobald diese verfügbar sind. Dazu beschäftigt Spokenlayer professionelle Sprecher. Auch die Autoren selbst sind eingeladen, ihre Texte zu vertonen. Einige grosse Publikationen kooperieren bereits mit dem Start-up. Finanziert wird das Ganze über auf die Texte zugeschnittener Werbung.

Spokenlayer versucht den Usern eine angenehmes Hörerlebnis zu verschaffen. Das glaubt die Firma nur mit menschlichen Vorlesern bieten zu können. "Die Aussprache von Einzelworten kann auch mit Software zum Teil schon sehr menschlich klingen. Beim Lesen von Texten, bei denen Sprachmelodie und kontextabhängige Betonung wichtig sind, wird die Sprachsynthese es auf absehbare Zeit nicht schaffen, eine menschliche Qualität zu erreichen. Die Forschung arbeitet aber genau an dieser Problematik. Hilfreich wäre ein möglichst grosser Korpus mit eingelesenen Texten", sagt Speech-Experts-Geschäftsführer Thomas Bauer.

Spokenlayer hat bereits 80.000 Dollar an Kapital gesammelt. Bisher konnten Online-Publikationen wie Techcrunch, The Atlantic, Endgadget oder National Journal als Partner an Bord geholt werden. In Zukunft sollen weitere Medien folgen. Auch eine Portierung für andere Betriebssysteme ist derzeit geplant. Der Gründer von Sociallayer, Will Mayo, leidet an Dyslexie und war deshalb Zeit seines Lebens auf Vorleser angewiesen. Der Unternehmer verspricht, dass die maschinengelesenen Texte auch in der schnelllebigen Medienwelt zeitgerecht durch menschliche Versionen ersetzt werden.

Durch die Möglichkeit zum Einsprechen der eigenen Texte plant Spokenlayer vor allem Journalisten anzusprechen. Ein Vorlese-Button ist auf jeder Webseite schnell implementiert, wodurch es in der zunehmend multimedialen Welt des Journalismus in Zukunft zum Standard für die schreibende Zunft werden könnte, ihre Texte auch in hörbarer Form zu präsentieren.

Sollte sich kein menschlicher Vorleser für einen Text finden, bleibt die Software-Stimmen-Version online, mit all ihren Unzulänglichkeiten. "Bei der Sprachausgabe gibt es Hürden, die ohne menschliches Zutun kaum zu bewältigen sind. Die Aussprache von Eigennamen etwa, die selbst für Menschen ab und an schwierig ist - denken Sie etwa an den Namen Krysnowsky", beschreibt Bauer.

Dass Sprachsoftware durch menschliche Alternativen ersetzt werden könnte, glaubt der Experte nicht. "Das Vorlesen von Websites ist nur ein kleiner Teilbereich der Sprachsynthese. Hier ist auch Crowdsourcing ein interessanter Ansatz. Von Menschen eingelesene Texte könnten sogar zur Verbesserung der Sprachsynthese verwendet werden", erklärt Bauer. Für viele Anwendungen wäre ein Einsatz von menschlichen Sprechern auch schlichtweg zu teuer. "Beim Vorlesen ganzer Texte sind auch die Kosten interessant. Software muss nur einmal angeschafft werden, um beliebig viele Texte zu lesen."