thumb

Der US-Internetgigant Google hat seine Cloud Speech API um einige Sprachvarianten und Funktionen aufgerüstet. Die Alphabet-Tochter hatte den Dienst für die automatische Spracherkennung im Frühjahr 2016 vorgestellt und gut ein Jahr später zum vollwertigen Service erhoben. Mit dem API wird es Entwicklern ermöglicht, den Cloud-Dienst in eigene Anwendungen integrieren.

Zu den Anfangs gut 80 Sprachen respektive Varianten kommen nun 30 neue hinzu, darunter Suaheli, Javanisch und Englisch, wie es in den afrikanischen Staaten Ghana, Kenia, Nigeria und Tansania gesprochen wird. Gemäss einem Blogbeitrag decken die neuen Varianten zusammen mehr als eine Milliarde zusätzlicher Menschen ab.

Die Dateien zur Umwandlung in Text dürfen nun mit einer maximalen Länge von drei Stunden mehr als doppelt so lang wie das bisherige Maximum von 80 Minuten sein. Für Sonderfälle gibt es zudem wohl die Option, die Quota für Einzelfälle anzuheben. Zudem bietet die Cloud Speech nun Zeitstempel, über die sich der passende Text beim Abspielen der Audiodatei anzeigen lässt.