Exklusives Interview mit dem CEO von Timekettle: Angst vor Apples Eintritt ist unbegründet, die AI-Übersetzungs-Ohrhörer sind noch lange nicht am Ende ihrer Entwicklung
Autor/in | Ou Xue
Redakteur/in | Yuan Silai
Wenn die Konzernriesen versuchen, Hardware und Software zu integrieren, reicht es aus, wenn sie nur einen Finger bewegen, um das "Eis" unter den Füßen vieler Startup-Unternehmen zu sprengen.
Im Jahr 2025, als die Genauigkeit der KI-Übersetzung 95 % erreichte, ist das KI-Übersetzungs-Ohrhörer-Segment möglicherweise die Hardware-Kategorie, die am leichtesten von Konzernen verschlungen wird. Sie müssen keine Hardware-Änderungen vornehmen, sondern nur die Software-Funktionen integrieren.
In den letzten ein bis zwei Jahren hat fast jeder Android-Hersteller die Übersetzungsfunktion in seine Ohrhörer integriert. Erst am frühen Morgen des 10. September, als Apple ankündigte, dass die AirPods eine Echtzeit-Übersetzungsfunktion erhalten würden, fühlten die Unternehmer im Bereich der Übersetzungs-Ohrhörer den echten Fröstelwind - Apple hat allein 23 % des weltweiten TWS-Marktes.
Übersetzung ist ein offensichtlicher Bedarf und wird früher oder später zur Standardausstattung aller Ohrhörer großer Unternehmen werden. Dieser Schlag war keine Überraschung.
Tatsächlich, seit etwa 2023, als die KI-Übersetzungs-Software kostenlos wurde, hat der Markt bereits von zahlreichen "White Label"-Produkten überschwemmt worden. Nachdem unabhängige Marken, die nicht in einem Preiskampf mithalten wollten, sich durchgesetzt hatten, mussten sie sich dann den "Riesenkrokodilen" stellen.
Das Unternehmen Timekettle aus Shenzhen ist einer der Hardware-Hersteller, die es geschafft haben, bestehen zu bleiben. Während die Konkurrenz in der Übersetzungsbranche immer heftiger wurde, erreichte Timekettle 2024 einen Umsatz von 200 Millionen Yuan, und der kumulative Umsatz wuchs 2025 weiterhin stark. Es war sechs Jahre lang der Branchenführer und hat mehr als eine Million Kunden in über 170 Ländern weltweit.
Tian Li, der Gründer von Timekettle, kommt aus Huawei. Vielleicht hat es etwas mit seiner früheren Branchenerfahrung zu tun, dass Timekettle immer die Hardware im Vordergrund gestellt hat. Die Übersetzungs-Ohrhörer seines Unternehmens werden mit einem Preis von etwa 1.000 Yuan angeboten und ermöglichen die "Echtzeit-Übersetzung während des Sprechens", um das natürliche Gesprächs-Erlebnis so gut wie möglich wiederherzustellen.
Angesichts der KI-Funktionen von Apple hat Tian Li, der Gründer von Timekettle, seine eigene Strategie. "Die Logik der Konzernriesen besteht darin, die Übersetzungsfunktion auf ihre bestehende Ökosystem zu addieren", sagte Tian Li, der Gründer von Timekettle. "Unsere Logik besteht dagegen darin, das gesamte Sprachenübersetzungs-System neu zu gestalten."
Dies ist nicht die einzige Herausforderung, der Timekettle gegenübersteht. "Wenn man die gesamte Übersetzungsbranche betrachtet, ist die Reife der Branche noch nicht ausreichend", sagte Tian Li. In einer Zeit der Bedarfssegmentierung müssen sie sich in den vielen "Spalten" eine differenzierte Positionierung suchen.
Tian Li ist der Meinung, dass die aktuelle KI-Übersetzung hauptsächlich wörtlich ist und nur etwa 10 % bis 20 % in der Lage ist, den kulturellen Kontext zu verstehen und natürlich zu übersetzen. KI ist ein Höhepunkt der technischen Rationalität. Sie kann die grundlegende Übersetzung erledigen, aber Sprache benötigt Emotionen, um mehr Bedeutung zu erhalten. Ein Übersetzungsprodukt, das dauerhaft genutzt werden soll, darf nicht nur eine Instrumentalität haben.
"Sprachbarrieren sind ein altes und weit verbreitetes Problem. Der Beruf des Übersetzers existiert seit Tausenden von Jahren", sagte Tian Li. "Menschenübersetzer übersetzen oft nicht Wort für Wort, sondern verstehen Ihre Absicht und geben sie genau wieder."
Große Unternehmen haben möglicherweise nicht die Geduld, kontinuierliche und feine Optimierungen vorzunehmen. Dies wird auch eine Chance für Startup-Unternehmen.
Wir haben ein Gespräch mit Tian Li geführt und über die gegenwärtige Marktkonkurrenz und die zukünftige Entwicklung der KI-Ohrhörer gesprochen.
Die Branche befindet sich noch in der Anfangsphase
Yingke: Wie beurteilen Sie die gegenwärtige Wettbewerbssituation im Bereich der KI-Übersetzung?
Tian Li: Wir kümmern uns eigentlich nicht besonders um die Wettbewerbssituation in der Branche. Das ist eine ehrliche Antwort. Der Kern liegt darin, dass ich denke, dass die Reife der gesamten Branche noch nicht ausreichend ist. Es macht nicht viel Sinn, jetzt zu vergleichen, wer am besten ist, es ist eher wie ein "Vergleich der Schlechten".
Der Wettbewerbsdruck in der Branche ist derzeit nicht sehr hoch. Aber als ein Unternehmen, das sich etwas weiter vorne in der Branche befindet, werden wir natürlich öfter kopiert. Zum Beispiel waren wir die Ersten, die die Zwei-Wege-Simultandübersetzung und das Außenlautsprecher-Gesprächsmuster realisierten.
Unser Kern liegt immer darin, Probleme zu lösen, insbesondere die Kommunikationsbarrieren zwischen Menschen. Sprachbarrieren sind ein altes und weit verbreitetes Problem. Der Beruf des Übersetzers existiert seit Tausenden von Jahren. Die Lösung dieses Problems hat einen hohen Wert. Wir wollen nicht blind auf die aktuellen Trends jagen, sondern hoffen, dass eines Tages die Benutzer nicht mehr wissen, ob wir Ohrhörer oder Hardware herstellen, sondern nur wissen, dass wir ihnen helfen können, Sprachbarrieren zu überwinden.
Yingke: Was halten Sie davon, dass große Unternehmen wie Google und Apple auch in den Bereich der Übersetzung einsteigen? Fühlen Sie sich unter Druck?
Tian Li: Nochmals möchte ich betonen, dass wir uns nicht besonders um die Wettbewerbssituation kümmern, weil die Branche tatsächlich noch nicht reif genug ist. Zweitens besteht die Logik der Konzernriesen darin, die "Funktionen hinzuzufügen" (z. B. Apple fügt die Übersetzungsfunktion in die AirPods ein), während unsere Logik darin besteht, "das gesamte Kommunikationssystem neu zu gestalten". Der Ausgangspunkt ist unterschiedlich, und die Effizienz und das Erlebnis der endgültigen Lösung werden auch unterschiedlich sein.
Yingke: Was ist die Kernkompetenz von Timekettle im Vergleich zu den Wettbewerbern?
Tian Li: Ich denke, es liegt auf der Ebene des Denkens. Wir konzentrieren uns auf die Kommunikationsszenarien selbst, nicht auf eine bestimmte Hardware-Form. Wir haben von Anfang an nicht nur auf die Form der Ohrhörer fokussiert, sondern uns gefragt, ob das Interaktionserlebnis der Ohrhörer die Kommunikation zwischen zwei Personen natürlicher gestalten kann. Wenn dies nicht möglich ist, werden wir die Ohrhörer verbessern. Deshalb haben unsere früheren Produkte sogar kein Bluetooth-Headset-Chip verwendet, weil unser Schwerpunkt nicht auf traditionellen Funktionen wie Telefonieren lag. Im Laufe der Zeit wird diese zugrunde liegende Logik eine "Schutzmauer" für die Marke und die Wahrnehmung der Benutzer bilden.
W4 KI-Simultandübersetzungs-Ohrhörer - Knochenstimm-Geräuscherkennungstechnologie (Quelle/Unternehmen)
Yingke: Timekettle hat 70 % seines Umsatzes aus dem Ausland erzielt. Welche unerwarteten Herausforderungen sind Sie beim Anpassen an die Kultur, Sprache und Politik unterschiedlicher Märkte begegnet?
Tian Li: Die größte Herausforderung besteht darin, die Benutzer zu verstehen. In China sind viele Szenarien mit geschäftlichen Verhandlungen verbunden. In den USA dagegen, als Einwanderungsland, sind etwa 20 % der Bevölkerung Einwanderer, von denen etwa 50 %, also mehr als 20 Millionen Menschen, nur eingeschränkte Englischkenntnisse haben. Viele Menschen nutzen unser Produkt in ihrem transnationalen Einwanderungsleben. Dies mag in China neu erscheinen, ist aber im Ausland sehr üblich.
Yingke: Wie ist die gegenwärtige finanzielle Situation Ihres Unternehmens? Ist es rentabel?
Tian Li: Unser Unternehmen hat bereits Gewinn erzielt. Wir streben nicht bewusst eine schnelle Umsatzsteigerung an, sondern legen mehr Wert auf eine gesunde Rentabilität und die Reife unserer Produkte. In der Anfangsphase der Branche würde ein rücksichtsloser Wachstumsstreben eher negative Auswirkungen haben.
Yingke: Viele Übersetzungsgeräte sind derzeit auf Cloud-basierte Large Language Models angewiesen. Es gibt aber auch einen starken Trend hin zu "Edge AI". Planen Sie, in das Feld des "Edge AI" einzusteigen?
Tian Li: Edge AI ist für uns sehr wichtig, weil in vielen Regionen die Netzwerkbedingungen nicht ideal sind. Die Benutzer haben hohe Ansprüche an unser Produkt. Sobald das Netzwerk schlecht ist, können zwei Personen nicht kommunizieren und geraten sofort in Schwierigkeiten. Deshalb müssen wir in das Feld des Edge AI investieren.
Yingke: Planen Sie in Zukunft, neben der "Sprache" auch andere multimodale Interaktionsformen zu nutzen? Zum Beispiel Gesten oder Tonfall?
Tian Li: Das ist eine sehr kühne Idee. Bei der multimodalen Eingabe, wie sie einige Brillenhersteller umsetzen, ist es schwierig, die Absicht über Gesten zu verstehen, da Gesten nicht standardisiert sind.
Aber was den Tonfall angeht, denke ich, dass dieser Teil eher standardisiert werden kann. Zum Beispiel der Tonfall von Wut, Frage, Verwirrung oder Freude kann schrittweise in Richtung Standardisierung entwickelt werden. Dies ist auch ein Bereich, an dem wir intern arbeiten.
Die KI-Übersetzung ist noch weit von der natürlichen Kommunikation entfernt
Yingke: Wie sehen Sie die zukünftige Beziehung zwischen KI-Übersetzung und menschlicher Übersetzung? Wie definiert Timekettle diese Beziehung?
Tian Li: Wir haben die KI-Übersetzung wie die automatische Fahrweise in Stufen von L1 bis L5 eingeteilt. Ich denke, dass das, was derzeit möglich ist, ungefähr auf einem L3-Niveau liegt. Der menschliche Standard, insbesondere der von hochqualifizierten Übersetzern, ist zweifellos L4 oder sogar L5.
Der größte Unterschied zwischen L3 und L4/L5 liegt meiner Meinung nach im Vertrauensgrad. Bei L3 ist die Übersetzung nur brauchbar, während Sie sich bei L4 und L5 wirklich darauf verlassen können, dass es Ihnen hilft, zu kommunizieren und Probleme zu lösen.
Die Weiterentwicklung umfasst zwei Aspekte. Erstens muss die KI wie ein Mensch Empathie haben und in der Lage sein, das, was Sie wirklich ausdrücken möchten, zu verstehen und wiederzugeben, anstatt nur wörtlich zu übersetzen. Menschenübersetzer handeln oft so, dass sie nicht Wort für Wort übersetzen, sondern Ihre Absicht verstehen und genau wiedergeben. Dies ist die entscheidende Grenze zwischen L3 und L4. Zweitens gibt es noch viele Details, die am Interaktionserlebnis des Produkts selbst poliert werden müssen.
Yingke: Wie lange glauben Sie, wird es dauern, bis von L3 zu L4 gewechselt wird?
Tian Li: Ich denke, dass es im besten Fall etwa 2 bis 3 Jahre dauern wird. Denn hier müssen zwei Teile gemeinsam weiterentwickelt werden. Der erste Teil ist ein Bereich, an dem die gesamte Branche arbeitet und ist ein Zweig des großen KI-Systems. Der zweite Teil erfordert, dass die Produktunternehmen es genau ausloten, wie das Benutzererlebnis noch weiter verbessert werden kann.
Yingke: Im Bereich des Benutzererlebnisses gibt es in verschiedenen Sprachen viele kulturelle Metaphern und Slangausdrücke. Wie versucht Timekettle, diese "implizite Bedeutung" zu verstehen und zu bewahren?
Tian Li: Ich denke, dass dies ein Problem der gesamten Branche ist und es schwierig ist, es alleine zu lösen. Derzeit können wir möglicherweise etwas an der Sammlung von Sprachmaterialen tun, wie z. B. mehr Versuche mit chinesisch-englischen und spanischen Sprachpaaren. Aber langfristig werden große Unternehmen wie Google einige grundlegende Arbeiten leisten, und wir können auf deren Schultern stehen und uns auf die Details konzentrieren, in denen wir stärker sind.
Yingke: Wie hoch schätzen Sie den gegenwärtigen Grad der kulturellen Verständnis der KI-Übersetzung?
Tian Li: Ich denke, dass es derzeit nur etwa 10 % bis 20 % ist. Die Leute versuchen immer noch hauptsächlich, wörtlich zu übersetzen. Aber ich glaube, dass es nicht lange dauern wird. In etwa einem halben Jahr werden Sie eine deutliche Verbesserung unserer Produkte sehen.
Zum Beispiel gibt es derzeit zwei Modi für die Übersetzung: der einfache KI-Übersetzungsmodus und der Large Language Model-Übersetzungsmodus. Aus technischer Sicht sind dies unterschiedliche Technologiepfade. Aus der Sicht der Verbraucher interessiert es sie, ob die Übersetzung verständnisvoll ist oder ob es sich um eine starre Übersetzung handelt, die keine Änderungen am Originaltext vornimmt und nichts mißversteht. Sie werden dann einen deutlichen Unterschied zwischen diesen beiden Modi feststellen.
Yingke: Wie bewerten und definieren Sie die Verantwortung bei "Halluzinationen" (fälschliche Übersetzungen) oder Fehlern in der Übersetzung?
Tian Li: Ehrlich gesagt, in den USA werden unsere Produkte auch in medizinischen Einrichtungen eingesetzt. Derzeit ist die Definition der Verantwortung aber noch unklar.
Genau wie bei Unfällen von selbstfahrenden Autos ist die rechtliche Definition noch unklar. Derzeit befindet sich unsere Anwendung hauptsächlich auf dem L3-Niveau und ist hauptsächlich unterstützend. Die KI-Übersetzung hat aber noch nicht die gleiche Schwere wie die selbstfahrenden Autos, denn bei letzteren geht es um Menschenleben.