Wie sich mit künstlicher Intelligenz und einem Knopf im Ohr Sprachbarrieren überwinden lassen

Timekettle

99 Prozent aller Firmen, die sich mit künstlicher Intelligenz beschäftigen, fokussieren sich auf die Interaktion zwischen Personen und Maschinen. Das Startup Timekettle aus Shenzhen will dagegen die zwischenmenschliche Kommunikation verbessern. Eine Reise in die Schweiz diente als Geburtshelfer für das Produkt.

Matthias Müller, Shenzhen

NZZ – Neue Zürcher Zeitung

Leal Tian ist der Gründer des Unternehmens Timekettle, das laut Amazon das weltweit erste auf künstliche Intelligenz gestützte Übersetzungssystem herstellt.

In einem grossen, hellen Raum sitzen rund 20 Personen zusammen, einige blicken auf den Bildschirm, andere unterhalten sich. Das Büro befindet sich in dem Mini Science Park in der an Hongkong angrenzenden Millionenstadt Shenzhen, wo es vor vier Jahrzehnten nur ein paar Dörfer gab. Leal Tian schaut auf das Team und sagt: «Mit 30 Kolleginnen und Kollegen und einem Durchschnittsalter von 28 Jahren haben wir eine gute Grösse. Ich möchte nicht zu schnell wachsen, denn daran gehen viele Startups zugrunde.»

Tians Unternehmen Timekettle hat im Dezember vergangenen Jahres seinen vierten Geburtstag gefeiert. Und auf der Site des Online-Händlers Amazon wird das von Tian und seiner Mannschaft entwickelte Produkt als «weltweit erstes auf künstliche Intelligenz gestütztes Übersetzungssystem» angepriesen.

«Sie haben es nicht einmal versucht»

Die Nutzung des Hightech-Produkts ist einfach: Bei Unterhaltungen unter vier Augen benötigen die beiden Gesprächspartner jeweils einen Ohrstöpsel und ein Smartphone mit Internetzugang, auf dem die App von Timekettle installiert ist. Nun können sie in ihrer jeweiligen Muttersprache reden, und das Gegenüber hört die Übersetzung mit einer leichten Verzögerung von ein bis drei Sekunden auf seinem Ohrstöpsel. Parallel dazu ist das Gesagte auch auf dem Smartphone zu lesen.

Derzeit bietet Timekettle 43 Sprachen und mehr als 90 Dialekte an. Da das System auf künstlicher Intelligenz basiert, sind «Sie haben es nicht einmal versucht» wegen der grossen Datenmengen die Übersetzungen aus dem Chinesischen und Englischen besonders gut. Auch die Übertragungen aus dem Chinesischen ins Deutsche sind verständlich, selbst die schwierige Setzung der Kommata ist regelkonform.

Das System basiert auf drei Pfeilern. Die von Timekettle entwickelten Ohrstöpsel gewährleisten wegen der Nähe zum Mund, dass die automatische Spracherkennung die Stimme gut wahrnimmt. Zudem hat das Startup an der Geräuschunterdrückung gefeilt, um den störenden externen Lärmpegel zu unterdrücken. Das Gespräch wird anschliessend von der App als zweitem Pfeiler des Systems in die Cloud übertragen, wo – als letztem Pfeiler – drei Vorgänge stattfinden.

Bei der Spracherkennung erfolgt im ersten Schritt eine automatische Interpretation der menschlichen Sprache, wobei es dem System dank Deep-Learning-Methoden möglich ist, die Datenbank an Wörtern in eigener Regie zu erweitern. In einem nächsten Schritt erfolgt die maschinelle Übersetzung, bevor durch Sprachsynthese der Fliesstext in akustische Sprachsignale umgewandelt und damit für die Personen verständlich wird. Zudem ist – der dritte Schritt – die Übersetzung auf dem Smartphone zu lesen.

Die Gründung des Unternehmens im Dezember 2016 hat indirekt auch mit der Schweiz zu tun. Tians aus der zentralchinesischen Provinz Hunan stammende Eltern reisten vor ein paar Jahren erstmals nach Europa. Und obwohl die Tour geführt war, machte sich der Sohn Gedanken, wie sie sich dort verständigen sollten. «Ich habe ihnen fünf, sechs Sprach-Apps auf ihre Smartphones heruntergeladen», sagt der junge Unternehmer im Rückblick.

Bei einer Tour in die Schweizer Alpen litt seine Mutter unter Höhenkrankheit, und ein französischsprachiger Arzt rettete sie. Eine Kommunikation wäre mit den auf den Smartphones installierten Sprach-Apps möglich gewesen. Als die Eltern wieder zu Hause waren, fragte Tian, ob sie diese verwendet hätten. Noch heute schwingt eine Mischung aus Verständnislosigkeit und Entrüstung in seiner Stimme mit, wenn er sagt: «Sie haben es nicht einmal versucht.»

Kommunikation ohne störende Hardware

Tian trieb die Frage um, was bei den Eltern schiefgelaufen war. Der Besuch einer Messe in Shenzhen öffnete ihm schliesslich die Augen. «Damals hatte ich mich selbst mit diversen Übe