Ein ehemaliger Huawei-Mitarbeiter gründet ein Unternehmen für AI-Übersetzungs-Ohrhörer, erobert die Weltmeisterschaft und erzielt ein Jahreseinkommen von 200 Millionen Yuan | Insight Global
Redaktionelle Anmerkung: Wenn die Globalisierung immer mehr zur Kernstrategie vieler chinesischer Unternehmen wird, wird die Frage, wie man den globalen Markt erobert, zu einem äußerst professionellen Thema. In der Entwicklung der Globalisierung haben bereits viele chinesische Marken die Spitze erreicht. Aus diesem Grund hat Hard Krypton die Rubrik „Insight Global“ ins Leben gerufen, um von der Entwicklung und Veränderung von Marken aus die neuesten Trends und zeitgemäßen Chancen globaler Marken zu erkunden und chinesischen Markenakteuren und der Branche Anregungen und Gedanken anzubieten.
Dies ist die 41. Ausgabe unserer Rubrik – Im Jahr 2016 richtete ein ehemaliges Team von Huawei-Ingenieuren sich auf den Sprachdienstsektor ein und überwand die Schmerzpunkte bei der transnationalen Kommunikation mit einer ultraschnellen Übersetzungsverzögerung von 5 Sekunden und einer Rauschminderungstechnologie von 90 Dezibel. Im Jahr 2023 errang es die Spitze der Verkaufsstatistiken von Übersetzungsgeräten auf Amazon in den USA, und sein Servicenetwerk erstreckt sich über 170 Länder und Regionen … Wie baut ein chinesisches Hardwareunternehmen mit „natürlicher Dialoglogik + Vertiefung in vertikalen Szenarien“ eine technologische Schutzmauer in der roten See der KI-Übersetzung? Auf dieser Grundlage haben wir mit Wu Weibing, dem CMO von Timekettle, gesprochen.
Text | Lin Qingqing
Redaktion | Yuan Silai
Tian Li, der Gründer von Timekettle, beschloss, ein Unternehmen zu gründen, nachdem bei seiner Mutter ein Unfall passiert war.
Im Jahr 2015 beschlossen Tian Lis Eltern, nach Europa zu reisen. Vor der Abreise lud Tian Lis Mutter zahlreiche Übersetzungs-Apps herunter, und Tian Li bereitete speziell für die alten Eheleute ein Übersetzungsgerät vor.
Im Ausland war das Übersetzungsgerät unerwartet schlecht zu bedienen. Selbst für das einfache Kaufen einer Flasche Wasser musste man lange auf die Reaktion des Geräts warten.
Als die Reise zu einem Berg im französischen Sprachgebiet der Schweiz führte, ereignete sich ein Unfall. Die Sprachbarriere wurde zu einer Frage des Lebens oder des Todes.
Tian Lis Mutter fühlte sich nicht wohl, hatte Kopfschmerzen und war kraftlos. Es war wahrscheinlich Höhenkrankheit. Die beiden eilten in eine lokale Klinik, aber stellten fest, dass sie überhaupt nicht kommunizieren konnten. Vor der Notfallpflegerin sprachen die alten Eheleute hastig in das Übersetzungsgerät, aber aufgrund der zu schnellen Sprechgeschwindigkeit war das Übersetzungsergebnis zerrissen. Als die alten Eheleute keine andere Möglichkeit hatten und mit den Händen wilden Zeichen machten, studierte die Pflegerin das Übersetzungsgerät. Oft wechselte es zwischen Chinesisch und Französisch, und niemand verstand ein Wort.
So lag eine angstvolle Sprachlücke mitten in dieser lebensbedrohlichen Situation.
Es dauerte noch einige Zeit, bis sie das Tempo des Übersetzungsgeräts verstanden hatten. Sie mussten langsam sprechen und jedes Wort einzeln aussprechen, um überhaupt kommunizieren zu können.
Als Tian Li von seinen Eltern von diesem Vorfall hörte, erstarrte ihm das Blut in den Adern: Wenn seine Mutter nicht an Höhenkrankheit litt, sondern an einer schwereren Krankheit, hätte es vielleicht irreparable Folgen gehabt?
Er war mit der Barriere bei der sprachübergreifenden Kommunikation nicht unbekannt. In früheren geschäftlichen Gesprächen hatte man oft Übersetzungs-Apps verwendet. Damals hatte er nicht daran gedacht, die Situation zu ändern. Nach seinem Austritt aus Huawei wechselte er in ein Robotikunternehmen und übernahm die Leitung der Hardwareentwicklung. Er hatte schon an Unternehmertum gedacht, aber keine passenden Chancen gesehen.
Die Erfahrungen seiner Eltern in Europa waren für ihn eine Inspiration. Laut Daten der Weltgesundheitsorganisation können weltweit über eine Milliarde Menschen aufgrund von Sprachbarrieren nicht frei kommunizieren.
Von Handheld-Übersetzungsgeräten bis hin zu Smartphone-Apps konnten die herkömmlichen Lösungen das Problem des „natürlichen Dialogs“ nie lösen. „Wenn man streitet, will niemand ein Übersetzungsgerät hin und her reichen.“ So hat Tian Li einmal gesagt.
Offensichtlich ist dies ein breiter und ungedeckter Markt. Und Tian Li möchte ein Gerät entwickeln, „das die Existenz der Übersetzung vergessen lässt“. Am ehesten passt hierfür ein Ohrhörer.
Im Jahr 2016 fand Tian Li seine Hochschulfreunde und gründete zusammen mit einigen Ingenieuren die Marke Timekettle und begann mit der Entwicklung von tragbaren Übersetzungs-Ohrhörern.
Sie erlebten große Produktfehler und Richtungsänderungen und brachten erst 2020 den ersten wirklich erfolgreichen Ohrhörer M2 auf den Markt. Dieses Produkt verkaufte sich im gleichen Jahr schnell 100.000 Mal. Im Jahr 2023 errang Timekettle die Spitze der Verkaufsstatistiken von Übersetzungsgeräten auf Amazon in den USA. Im Jahr 2024 brachte Timekettle die W4Pro-Serie auf den Markt, und der Gesamtumsatz betrug über 200 Millionen Yuan.
Übersetzungshardware ist ein traditionelles Produkt. Im Ausland hat das japanische Unternehmen Post, das derzeit den zweiten Platz in der globalen Marktanteilshierarchie einnimmt und sich auf das Handheld-Übersetzungsgerät Talkmate spezialisiert hat, aufgrund der langsamen technologischen Entwicklung allmählich aus dem Markt zurückgezogen (es hat seit drei Jahren keine neuen Produkte auf den Markt gebracht). Große Unternehmen wie Google und Apple konzentrieren sich dagegen auf die Integration von KI-Sprachassistenten und Ohrhörerfunktionen (z. B. die Echtzeitübersetzung von Pixel Buds Pro) und haben noch keine massenhafte Hardware entwickelt. In China gibt es hauptsächlich Übersetzungsgeräte von iFlytek.
Timekettle hat sich für das relativ neue Modell der KI-Übersetzungs-Ohrhörer entschieden und eine technologische Mauer errichtet. Auf Amazon ist es neben den billigen Übersetzungs-Ohrhörern aus Huaqiangbei der einzige Markenhändler. Deshalb haben die Produkte auch bei einem Preis, der dem von AirPods entspricht, gute Verkaufszahlen.
Natürlich ist das Geschäft von Timekettle noch lange nicht stabil. Seit ChatGPT die Welle der großen KI-Modelle in Gang gesetzt hat, hat sich die Qualität und Geschwindigkeit der Übersetzung auf ein neues Niveau gehoben. Wenn große Hardwareunternehmen in das Feld einsteigen und integrieren, werden sie direkt in das Territorium der Start-up-Unternehmen eindringen.
Das ultimative Anliegen
Anfangs war in Tian Lis Vorstellung die Entwicklung von Übersetzungshardware ein sehr kleines Ding, das man einfach mit einem Software-Outsourcing-Unternehmen lösen konnte.
Aber je tiefer er vordrang, desto mehr erkannte Tian Li, dass man, um eine echte sprachübergreifende Kommunikation zu erreichen, die Situation bei der Muttersprachenkommunikation so gut wie möglich wiederherstellen musste. Die bestehenden Lösungen konnten die Anforderungen überhaupt nicht erfüllen.
„Die Nutzer wollen keine Übersetzung, sondern einen natürlichen Dialog.“ So sagte Wu Weibing, der CMO von Timekettle, gegenüber Hard Krypton.
Sie mussten schmerzhafte Lehren lernen, um das zu verstehen. Im Jahr 2017 startete Timekettle seinen ersten Übersetzungs-Ohrhörer WT2 Plus auf Kickstarter und sammelte mit dem Konzept der „Echtzeitübersetzung“ über eine Million US-Dollar an Spenden.
Aber als die Tech-Enthusiasten die Ohrhörer testeten, war die Rückmeldung peinlich: Die Gesprächspartner mussten strikt dem Rhythmus „sagen - warten - abspielen“ folgen. Bei einem kleinen Zwischenruf wurde die Übersetzung durcheinander. „Es fühlt sich an, als würde man mit einem Roboter Passwörter austauschen.“ So beschwerte sich ein früherer Nutzer.
Im Jahr 2018 versuchten sie ein Plug-and-Play-Gerät, aber es verkaufte sich aufgrund von Defekten bei der Tonaufnahme nur schlecht. 200.000 Geräte blieben liegen, und es entstand ein Verlust von mehreren Millionen Yuan, der das Unternehmen an den Rand des Abgrunds trieb.
Dieser Misserfolg brachte das Team vollständig auf die Ohrhörerklasse um und zielte auf zwei technische Schmerzpunkte: Echtzeitfähigkeit und Rauschunterdrückung. Das serielle Verarbeitungsmodell herkömmlicher Übersetzungsgeräte (Tonaufnahme - Übersetzung - Wiedergabe) führte zu einer Verzögerung von mindestens 2 Sekunden, und die Bandbreitenbeschränkung des Bluetooth-Protokolls verschärfte die Datenstaus noch weiter. Der Wendepunkt kam mit der „gewaltigen Zerstörung“ des technischen Pfads. Das Timekettle-Team teilte den Ein-Kanal-Bluetooth in vier Kanäle auf (getrennte Verarbeitung von Upload und Download für jedes Ohr), als würde man auf einer Einbahnstraße plötzlich vier Fahrspuren schaffen.
„Es ist wie das Bauen eines Verkehrsknotens in einem Ohrhörer.“ So beschrieb es Wu Weibing. „Bei einem kleinen Fehler würden die Daten der linken und rechten Ohren kollidieren, und das Übersetzungsergebnis würde zu einem Durcheinander werden.“ Es dauerte 18 Monate, bis sie endlich die Funktion des „Sprechen- und-Übersetzen-Parallel“ realisierten und die Dialogeffizienz verdoppelten.
Die Rauschunterdrückung war ein weiteres hartes Schlachtfeld. Bei Tests in Shibuya, Tokio, fiel die Übersetzungsgenauigkeit aufgrund des Umgebungsrauschens auf 70 % ab. Das Timekettle-Team entwickelte einen RNNVAD-Stimmenerkennungsalgorithmus, der durch die Bestimmung der Schallquelle und die Entfernungsmessung 90 % des Hintergrundrauschens filtert. „Wir haben sogar die Ingenieure gebeten, die Ohrhörer in einer Nachtclub zu testen, um sicherzustellen, dass sie auch in einer 90-Dezibel-Umgebung präzise Ton aufnehmen können.“ So sagte Wu Weibing. Diese Technologie erhöhte die Übersetzungsgenauigkeit in der Innenstadt auf 93 % und ermöglichte Szenarien wie das Bestellen in einer Bar oder das Fragen an der Flughafeninformation.
Die technologische Entscheidung war immer die zentrale Herausforderung im Entwicklungsverlauf. Im Jahr 2021 versuchte das Team, die Übersetzungsverzögerung zu reduzieren und vereinfachte vorübergehend den Algorithmusprüfprozess. Dies führte jedoch zu einer Abnahme der Übersetzungsgenauigkeit in geschäftlichen Szenarien. Eine internationale Handelsfirma berichtete, dass der Ohrhörer den „Höchstschutzklausel“ in einem Vertrag fälschlicherweise als „Ohnmachtklausel“ übersetzte, was ein rechtliches Risiko darstellte.
„Eine falsche Übersetzung ist tödlicher als das Warten.“ So betonte Wu Weibing in einer internen Rückschau. Danach begann das Team, Anpassungen vorzunehmen. Für den alltäglichen Dialog werden sechs große Übersetzungs-Engines wie Google und Microsoft verwendet, um die allgemeinen Anforderungen zu erfüllen. In vertikalen Bereichen wie Medizin und Recht wird eine eigene Fachwortbibliothek erstellt. Laut einem unabhängigen Testbericht stieg die Übersetzungsgenauigkeit von Timekettle bei medizinischen Begriffen wie „Herz-Kreislauf-Bypass-Operation“ von 76 % der allgemeinen Engine auf 92 %.
Um die Professionalität und Benutzerfreundlichkeit auszugleichen, haben sie auch die Funktion des „Szenariomodells“ hinzugefügt - Bei geschäftlichen Verhandlungen wird eine formelle schriftliche Sprache verwendet, während im Reise-Szenario automatisch auf eine gesprochene Sprache umgestellt wird. Beispielsweise sagte ein Benutzer, der oft reist: „‘Let’s talk tomorrow’ wird im Geschäftsmodell als ‘Bitte besprechen wir es morgen’ übersetzt, im Reise-Szenario jedoch als ‘Morgen nochmal reden’.“
Nach der Einführung des M2 stieg Timekettle endlich aus dem Tiefpunkt auf. Danach brachten sie den M3 und den W3 auf den Markt, und die Popularität stieg immer weiter. Im Jahr 2023 errang Timekettle die Spitze der Verkaufsstatistiken von Übersetzungsgeräten auf Amazon in den USA.
Aber jetzt hatte der echte Kampf erst begonnen.
Umzingelt von Klonen, Durchbruch im B2B-Segment
Es gibt kein elektronisches Produkt, das Huaqiangbei nicht klonen kann.
Als Timekettle der erste in seiner Nische wurde, reagierten natürlich die Weißmarkenhersteller aus Huaqiangbei in Shenzhen. Sie brachten „AI-Übersetzungs-Ohrhörer für 19,9 US-Dollar“ auf den Markt. Einige von ihnen nutzten TikTok und machten Werbung mit Videos von „süßen Gesprächen zwischen transnationalen Liebespaaren“. Der monatliche Verkaufsvolumen stieg auf 200.000 Stück. Diese Produkte waren eigentlich Standard-Ohrhörer mit einer Open-Source-Übersetzungs-App. Die gemessene Verzögerung betrug 3 Sekunden, und die Rückgaberate lag über 40 %.
Die gesamte Branche geriet in die Dunkelheit.
„Die Klone zerstören die gesamte Kategorieerfahrung.“ So lächelte Wu Weibing bitter. Noch schwieriger war, dass die Preispolitik die ersten Käufer anzog. Sie dachten, dass „AI-Übersetzung so billig sein sollte“, und zwangen Timekettle, das Doppelte an Budget für die Marktbildung aufzuwenden.
Angesichts des Preisdrucks der Klone wählte Timekettle eine zweigleisige Verteidigungsstrategie. Auf dem B2C-Markt brachte das Team die T1-Neuauflage für 1.299 Yuan auf den Markt. Sie behielt die Kernfunktion der „zweiseitigen gleichzeitigen Übersetzung“, reduzierte jedoch die Anzahl der offline verfügbaren Sprachen von 40 auf 13. „Wir haben es wie bei den ‘Jugendversionen’ von Smartphones gemacht. Wir haben die nicht notwendigen Funktionen entfernt, aber die technologischen Standards mussten wir bewahren.“ So erklärte Wu Weibing.
Dieses Produkt erreichte während des Amazon Prime Day die ersten drei Plätze in den Verkaufsstatistiken von Übersetzungsgeräten und konnte einige preisempfindliche Kunden abfangen.
Das B2B-Segment war ein Schlachtfeld, das die Hersteller aus Huaqiangbei nicht erreichen konnten. Timekettle konnte tatsächlich beeindruckende Übersetzungsleistungen vorweisen: Eine ultraniedrige Verzögerung von 5 Sekunden und eine Rauschunterdrückung in einer 90-Dezibel-Umgebung - Die erste ist die Verzögerungsgeschwindigkeit der Offline-Übersetzung (Smartphones sind von der Netzverzögerung abhängig), die zweite ist die gerichtete Rauschunterdrückung, die nur die Stimme des Sprechers erkennt (die Genauigkeit des Smartphonemikrofons in der gleichen Umgebung liegt unter 50 %).
Die technologische Leistung war der Schlüssel für die Unternehmen, um einen Preisaufschlag zu zahlen. Im Jahr 2023 schloss Timekettle Kooperationen mit Marriott und Hilton ab und integrierte die Übersetzungs-Ohrhörer in das Hotelservice-System - Ausländische Gäste können das Gerät mieten, wenn sie einchecken. Die Tagesmiete beträgt nur 1/10 der Kosten eines menschlichen Übersetzers. In der Shenzhen Yingke Rechtsanwaltskanzlei haben die Anwälte sogar den Ohrhörer in die Vertraulichkeitsklausel aufgenommen: „Die Kunden müssen alle Gespräche über unser Gerät führen. Die Verwendung von Drittanbieter-Übersetzungs-Apps ist verboten.“ So erinnerte sich Wu Weibing.
Die B2B-Kunden sind extrem empfindlich gegenüber den Ergebnissen, und die Produkte von Timekettle haben ihre Erwartungen erf