
Comment surmonter les barrières linguistiques grâce à l'intelligence artificielle et un bouton dans l'oreille
99 pour cent de toutes les entreprises qui travaillent dans le domaine de l'intelligence artificielle se concentrent sur l'interaction entre les personnes et les machines. La startup Timekettle de Shenzhen souhaite, en revanche, améliorer la communication interpersonnelle. Un voyage en Suisse a servi de catalyseur pour le produit.
Matthias Müller, Shenzhen

Leal Tian est le fondateur de l'entreprise Timekettle, qui, selon Amazon, fabrique le premier système de traduction au monde basé sur l'intelligence artificielle.
Dans une grande pièce lumineuse, environ 20 personnes sont réunies, certaines regardent l'écran, d'autres discutent. Le bureau se trouve dans le Mini Science Park, dans la ville de Shenzhen, voisine de Hong Kong, où il y a quarante ans, il n'y avait que quelques villages. Leal Tian regarde l'équipe et dit : « Avec 30 collègues et un âge moyen de 28 ans, nous avons une bonne taille. Je ne veux pas croître trop vite, car c'est ce qui fait échouer beaucoup de startups. »
L'entreprise de TianTimekettlea fêté son quatrième anniversaire en décembre de l'année dernière. Et sur le site du détaillant en ligne Amazon, le produit développé par Tian et son équipe est présenté comme le « premier système de traduction au monde basé sur l'intelligence artificielle ».
«Vous n'avez même pas essayé»
L'utilisation du produit high-tech est simple : lors de conversations en tête-à-tête, les deux interlocuteurs ont chacun besoin d'un écouteur et d'un smartphone avec accès à Internet, sur lequel l'application Timekettle est installée. Ils peuvent alors parler dans leur langue maternelle respective, et l'autre entend la traduction avec un léger délai d'une à trois secondes dans son écouteur. Parallèlement, ce qui est dit peut également être lu sur le smartphone.
Derzeit bietetTimekettle43 langues et plus de 90 dialectes. Étant donné que le système est basé sur l'intelligence artificielle, les traductions du chinois et de l'anglais sont particulièrement bonnes en raison des grandes quantités de données, même pour des expressions comme « vous n'avez même pas essayé ». Les traductions du chinois vers l'allemand sont également compréhensibles, même la difficile ponctuation des virgules est conforme aux règles.
Le système repose sur trois piliers. Ceux deTimekettleLes bouchons d'oreille développés garantissent, en raison de leur proximité avec la bouche, que la reconnaissance vocale automatique perçoit bien la voix. De plus, la startup a amélioré la suppression du bruit pour atténuer le niveau de bruit externe gênant. La conversation est ensuite transférée par l'application, en tant que deuxième pilier du système, vers le cloud où – en tant que dernier pilier – trois opérations ont lieu.
La reconnaissance vocale commence par une interprétation automatique de la langue humaine, le système étant capable, grâce aux méthodes d'apprentissage profond, d'élargir de manière autonome la base de données de mots. Ensuite, une traduction automatique est effectuée, avant que la synthèse vocale ne transforme le texte fluide en signaux acoustiques, rendant ainsi le contenu compréhensible pour les personnes. De plus, la troisième étape consiste à lire la traduction sur le smartphone.
La création de l'entreprise en décembre 2016 est également liée indirectement à la Suisse. Les parents de Tians, originaires de la province centrale chinoise du Hunan, ont voyagé pour la première fois en Europe il y a quelques années. Et bien que le voyage ait été organisé, le fils s'est demandé comment ils allaient communiquer sur place. « Je leur ai téléchargé cinq ou six applications de langues sur leurs smartphones », raconte le jeune entrepreneur avec du recul.
Lors d'une excursion dans les Alpes suisses, sa mère a souffert du mal des montagnes, et un médecin francophone l'a sauvée. Une communication aurait été possible grâce aux applications de traduction installées sur les smartphones. Lorsque ses parents sont rentrés chez eux, Tian leur a demandé s'ils les avaient utilisées. Encore aujourd'hui, un mélange d'incompréhension et d'indignation se fait entendre dans sa voix quand il dit : « Ils n'ont même pas essayé. »
Communication sans matériel gênant
Tian se demandait ce qui avait mal tourné chez les parents. La visite d'un salon à Shenzhen lui ouvrit finalement les yeux. « À l'époque, je m'étais équipé de diverses applications de traduction pour pouvoir discuter sur place avec les visiteurs qui ne parlaient ni chinois ni anglais. » Cependant, son projet échoua lamentablement. « Je parlais dans mon smartphone et le passais à mon interlocuteur, qui lisait la traduction. »
Tian s'est rendu compte qu'aucune conversation prolongée ne pouvait avoir lieu de manière aussi artificielle. La plupart du temps, les discussions se terminaient déjà après une minute. Le fait de se passer constamment le smartphone était trop fastidieux pour les deux parties.
Le diplômé de la renommée University of Electronic Science and Technology of China à Chengdu, qui, avant de devenir indépendant, avait d'abord travaillé trois ans chez le fournisseur d'équipements de télécommunications Huawei, puis dans une startup appartenant au groupe, est arrivé à deux conclusions après mûre réflexion. Premièrement, la traduction dépend moins de la grammaire que des mots spécifiques. « Lorsque l'on visite un restaurant italien et que l'application de traduction traduit ‹Je pizza commander›, le serveur comprend, même si la phrase n'est pas correctement formulée. Le problème survient cependant lorsqu'on commande une pizza et que ce mot est traduit par ‹Lasagne› », explique Tian.
Et ses propres expériences au salon de Shenzhen ainsi que celles des parents en Europe lui ont ensuite appris que les conversations doivent se dérouler dans une atmosphère naturelle. Comme c'est le cas avecTimekettlefr Avec seulement un bouton dans l'oreille, il est possible de faire des gestes pendant une conversation, et on peut regarder son interlocuteur dans les yeux et percevoir ses émotions. « Les personnes doivent pouvoir communiquer librement entre elles, sans que le matériel ne gêne », explique Tian ses conclusions. Le nom du premier produit était donc WT2, les deux lettres signifiant « wearable translator », c’est-à-dire traducteur portable.
Les États-Unis sont le marché le plus important
Environ la moitié du chiffre d'affaires est réaliséeTimekettleaux États-Unis ; l'Europe et le Japon suivent chacun avec une part de 20 %. La Chine ne joue pas encore un grand rôle pour la startup. « Dans mon pays d'origine, il n'existe presque pas de barrières linguistiques. En Amérique, en revanche, il y a de nombreuses familles multiculturelles », souligne Tian. Des enquêtes auprès des clients aux États-Unis ont révélé qu'un acheteur sur cinq de Timekettle utilise les écouteurs pour pouvoir communiquer avec d'autres membres de la famille.
choisissant la jeune métropole de Shenzhen, également surnommée le « Silicon Valley du matériel », l'entrepreneur a pris une décision logique. « Si nous rencontrons des difficultés dans le développement de nos produits, il y a toujours, à moins d'une heure de route, une entreprise de matériel qui peut nous aider », explique Tian, qui apprécie également la ville pour son climat. Il ne fait jamais vraiment froid dans le sud de la Chine. Et Shenzhen dégage une dynamique fascinante grâce à ses nombreux jeunes entrepreneurs. La ville offre à de nombreux Chinois l'environnement idéal pour réaliser le rêve chinois, que Tian incarne lui-même.