
人工知能と耳の中のボタンで言語の壁をどのように克服できるか
99パーセントの人工知能に取り組む企業は、人と機械の相互作用に焦点を当てています。一方、深圳のスタートアップ企業Timekettleは、人と人とのコミュニケーションの改善を目指しています。スイスへの旅がこの製品の誕生のきっかけとなりました。
マティアス・ミュラー、深セン

Leal Tianは、Amazonによると世界初の人工知能搭載翻訳システムを製造する企業Timekettleの創設者です。
大きくて明るい部屋に約20人が集まって座っており、数人はスクリーンを見つめ、他の人は会話をしています。オフィスは香港に隣接する人口数百万の都市、深圳のミニサイエンスパークにあり、ここは40年前には数軒の村しかありませんでした。リアル・ティアンはチームを見渡し、「30人の同僚と平均年齢28歳で、ちょうど良い規模です。成長を急ぎすぎたくありません。多くのスタートアップがそれで失敗しているからです」と話します。
ティアンズ・ウンターンメンタイムケトル2023年12月に4周年を迎えました。そして、オンライン小売業者Amazonのサイトでは、ティアンと彼のチームが開発した製品が「世界初の人工知能搭載翻訳システム」として紹介されています。
「あなたはそれを試そうともしなかった」
ハイテク製品の使用は簡単です。二人だけの会話の場合、両者はそれぞれイヤホンとインターネット接続が可能なスマートフォンを用意し、そこにTimekettleのアプリをインストールします。これで、それぞれの母国語で話すことができ、相手は1〜3秒のわずかな遅延でイヤホンから翻訳を聞くことができます。同時に、話された内容はスマートフォンの画面にも表示されます。
現在提供していますタイムケトル43の言語と90以上の方言に対応しています。システムは人工知能に基づいているため、「試みもしなかった」という表現も、大量のデータにより中国語と英語からの翻訳が特に優れています。中国語からドイツ語への翻訳も理解しやすく、難しいコンマの使い方も規則に則っています。
Das System basiert auf drei Pfeilern. Die vonタイムケトルentwickelten Ohrstöpselは口元に近いため、自動音声認識が声を正確に捉えることを保証します。さらに、スタートアップは騒音抑制にも取り組み、邪魔な外部の騒音レベルを低減しています。会話はその後、システムの第二の柱であるアプリによってクラウドに送信され、そこで最後の柱として三つの処理が行われます。
音声認識では、最初のステップで人間の言語が自動的に解釈されます。ディープラーニング手法のおかげで、システムは独自に単語データベースを拡張することが可能です。次のステップでは機械翻訳が行われ、その後、音声合成によって流暢なテキストが音響音声信号に変換され、これにより人々に理解されます。さらに、第3のステップとして、スマートフォンで翻訳を読むことができます。
2016年12月の会社設立は、間接的にスイスとも関係があります。中央中国の湖南省出身のティアンの両親は数年前に初めてヨーロッパを訪れました。ツアーガイド付きの旅行でしたが、息子は彼らが現地でどのようにコミュニケーションを取るかを考えました。「彼らのスマートフォンに5、6個の言語アプリをダウンロードしました」と若い起業家は振り返ります。
スイスアルプスへのツアー中、彼の母親は高山病にかかり、フランス語を話す医師が彼女を救った。スマートフォンにインストールされている翻訳アプリを使えばコミュニケーションは可能だったはずだ。両親が家に戻ったとき、ティアンは「使ったのか」と尋ねた。彼が「彼らは試そうともしなかった」と言うとき、今でも理解できない気持ちと憤りが入り混じった声が響く。
ハードウェアの煩わしさなしのコミュニケーション
ティアンは、両親に何がうまくいかなかったのかという疑問に悩まされていました。最終的に、深圳での展示会への訪問が彼の目を開かせました。「当時、現地で中国語や英語を話さない来場者とも会話できるように、さまざまな翻訳アプリを自分で用意していました。」しかし、彼の試みは見事に失敗しました。「スマートフォンに話しかけ、それを会話相手に渡して翻訳を読んでもらったのです。」
ティアンは、このような不自然な方法では長い会話は成立しないことに気づいた。ほとんどの場合、会話は1分も経たないうちに終わってしまった。スマートフォンを絶えず回し合うのは、双方にとって面倒すぎた。
成都にある名門、電子科学技術大学(University of Electronic Science and Technology of China)を卒業し、独立する前にまず3年間、通信機器メーカーのファーウェイ(Huawei)で、その後同グループのスタートアップ企業で働いていた彼は、熟考の末に二つの結論に至った。第一に、翻訳において重要なのは文法よりも特定の単語であるということだ。「イタリアンレストランを訪れて、翻訳アプリが『私はピザを注文する』を『Ich Pizza bestellen』と訳しても、文が正しくなくても店員は理解します。しかし問題なのは、ピザを注文したのにその単語が『ラザニア』と訳されてしまう場合です」とティアンは語る。
そして、彼自身の深圳の展示会での経験とヨーロッパの両親の経験は、第二に、会話は自然な雰囲気の中で行われなければならないことを彼に教えました。まるで...のようにタイムケトル片耳にイヤホンを装着するだけで、会話中にジェスチャーが可能になり、相手の目を見て感情を感じ取ることができます。「人々がハードウェアに邪魔されることなく自由にコミュニケーションできるようにしたい」とティアンはその結論を説明しています。最初の製品名はWT2で、この2文字は「wearable translator(ウェアラブル翻訳機)」を意味しています。
アメリカ合衆国は最も重要な市場です
売上の約半分を生み出していますタイムケトルアメリカ合衆国では、ヨーロッパと日本がそれぞれ20パーセントのシェアで続いています。中国はまだこのスタートアップにとって大きな役割を果たしていません。「私の母国ではほとんど言語の壁が存在しません。一方、アメリカには多文化家庭が数多くあります」とティアンは強調します。アメリカでの顧客調査によると、Timekettleの購入者の5人に1人が、家族の他のメンバーと会話するためにイヤープラグを使用していることがわかりました。
若者の多い新興都市であり、「ハードウェアのシリコンバレー」とも称される深圳を選んだことは、起業家にとって理にかなった決断でした。「製品開発で困難があれば、車で1時間以内に助けてくれるハードウェア企業が必ずあります」とティアンは言います。さらに彼は気候の面でもこの街を気に入っています。中国南部は決して寒くなりません。そして深圳からは、多くの若い起業家たちによる魅力的なダイナミズムが生まれています。この街は、多くの中国人にとって、ティアン自身が体現する中国の夢を実現するための理想的な環境を提供しています。