StartseiteArtikel

Es wird wahnsinnig nachgehagt: Der AI-Haushalts-Tierübersetzer! Er kostet über 800 Yuan und hat bereits 20.000 Vorkäufe.

量子位2026-05-25 19:17
Kann KI wirklich herausfinden, was Hunde und Katzen im Kopf haben?

Über 800 Yuan.

Würden Sie sich für einen KI-Übersetzer entscheiden, der versteht, was Katzen und Hunde sagen? Dieser kann sogar eine „zweiseitige Konversation“ zwischen Menschen und Tieren ermöglichen:

Quelle: YouTube-Konto „PettiChat“

Vielleicht glauben Sie es nicht, aber dieser sogenannte PettiChat-Haustierübersetzer hat bereits 20.000 Vorkäufe erreicht. (doge)

Er kann das Gebell von Hunden und das Miauen von Katzen in vollständige Sätze umwandeln. Und es wird behauptet, dass die Genauigkeit bis zu 95% beträgt...

Eigentlich denke ich, dass Sie wie ich fragen: Ist das hier nicht einfach ein nutzloses Gadget?

Ein Haustierübersetzer für über 800 Yuan, 20.000 Vorkäufe

Ehrlich gesagt ist ein Haustierübersetzer keine völlig neue Erfindung. Ein kurzer Blick auf Taobao zeigt sofort eine Reihe von kleinen Hardware-Geräten wie „Emotionsübersetzer“ oder „Intelligente Haustierübersetzer“.

Ihre Verkaufsargumente sind ähnlich: Sie können die Emotionen von Katzen und Hunden erkennen, die Bedürfnisse der Haustiere bestimmen und den Haltern helfen, was ihre Haustiere im Kopf haben, zu verstehen:

Als ich dieses Produkt zum ersten Mal sah, dachte ich: „Oh, noch ein Spielzeug für Haustierhalter.“ (verachtend.jpg)

Als ich die Demo anschaute, merkte ich, dass ich mich geirrt haben könnte...

Denn dieser PettiChat-Haustierübersetzer ist speziell, weil er nicht nur die Emotionen der Haustiere erkennen will, sondern tatsächlich eine „simultane Übersetzung“ von Katzen und Hunden anstrebt.

Laut der offiziellen Information kann dieses kleine Gerät, das über 800 Yuan kostet, an der Halskette des Haustiers befestigt werden und die Geräusche von Katzen und Hunden in Echtzeit aufnehmen.

Dann wandelt ein KI-Modell in der dazugehörigen App die Geräusche der Haustiere in verständliche Sätze um:

Außerdem wird behauptet, dass die Übersetzungsverzögerung nur 1,2 Sekunden beträgt.

Das bedeutet, dass sobald Ihre Katze „Miau“ macht, wird der Lautsprecher des Geräts sagen: „Ich habe Hunger! Lass mich in Ruhe! Komm und spiele mit mir!“

(Das klingt sogar schneller als einige menschliche KI-Übersetzungstools):

Und jetzt kommt das Überraschende: Ich dachte, dass es nur zur simultanen Übersetzung geeignet ist, aber ich habe festgestellt, dass es auch über Funktionen wie Standortverfolgung und Sicherheitsalarm verfügt?

Beispielsweise kann der Halter in der App eine sichere Zone festlegen. Wenn das Haustier diese Zone verlässt, erhält das Smartphone eine Warnung.

Darüber hinaus kann es in der App die Stimme des Haustiers mithilfe eines Sprachmodells „klonen“.

Aus der offiziellen Demo zu ersehen, kann das Produkt ohne zusätzliche Hardware eine Sprachantwort mit den Stimmeigenschaften des Haustiers generieren.

Jetzt hat die KI-Übersetzung gerade erst in den Haustierbereich vorgedrungen, und schon begleitet die Stimmenklonung mit:

Das klingt schon ziemlich phantastisch...

Wir wissen alle, dass Haustierhalter früher auf Blickkontakt, Erfahrung und Ahnungen angewiesen waren, um ihre Haustiere zu verstehen. Manchmal dachte man sich sogar: „Hat es mich gerade beschimpft?“

Empfindlich fällt mir auf, dass PettiChat quasi eine Umfeld-Untertitelung für Katzen und Hunde darstellt?

Natürlich ist die „Übersetzung“ selbst am stärksten umstritten.

Ein Haustierübersetzer klingt ja schon ziemlich nutzlos... Ob die Übersetzung richtig und genau ist, können weder die Katzen und Hunde noch die Menschen sagen. Es hängt allein von den Angaben des Produkts ab.

Mit diesen Zweifeln habe ich mich an die offizielle Seite gewandt, um die wissenschaftlichen Grundlagen hinter der „nahtlosen Kommunikation zwischen Katzen, Hunden und Menschen“ zu verstehen:

Einfach ausgedrückt, basiert PettiChat auf einem System für „Spracherkennung“ und „Emotionsschlussfolgerung“ auf Basis eines großen Modells.

Schritt 1: Spracheingabe - Mit über Millionen von Haustiersprachproben trainiert das System, die Frequenz, Dauer und Stimmmerkmalen von Katzen- und Hundegeräuschen zu erkennen. Dies löst die Frage: „Was wurde gehört?“

Schritt 2: Erkennung - Durch die „zweiseitige Modellierung von Verhalten und Sprache“ versucht das System, die Geräusche und Bewegungen von Katzen und Hunden in ein Verhaltensmodell der Tiere zu integrieren. Dies löst die Frage: „Was will das Haustier?“ Im Wesentlichen handelt es sich um eine Emotions- und Bedürfnisschätzung des KI-Systems basierend auf den Geräuscheigenschaften.

Schritt 3: Schnelle Verarbeitung - Das System nutzt die Transformer-Architektur, um das große Modell auszuführen, und kombiniert es mit verschiedenen Algorithmen, um eine schnelle Echtzeitübersetzung zu ermöglichen.

Das ist ein KI-Hardwareprodukt für Haustiere, das Übersetzungen, Stimmenklonung und Standortverfolgung ermöglicht. Bereits wurden 20.000 Geräte im Vorkauf verkauft...

Kann die KI wirklich herausfinden, was Katzen und Hunde im Kopf haben?

Hier stellt sich eine neue Frage: Ist es wirklich zuverlässig, die Gedanken der Haustiere nur anhand der Frequenz, Dauer und Stimmmerkmalen ihrer Geräusche zu erkennen?

Tatsächlich ist dieser Ansatz nicht von PettiChat aus der Luft gegriffen.

Schon 2005 hat das Pongrácz-Team der ungarischen Eötvös Loránd Universität eine interessante Studie durchgeführt.

Sie haben Mudi-Hunde, eine ungarische Schäferhundrasse, in verschiedenen Situationen aufgenommen, wie z. B. wenn ein Fremder sich nähert, wenn das Hund allein zu Hause ist, bevor es spazieren geht, wenn es einen Ball will, wenn es mit Menschen spielt oder wenn es in Angriffsstellung gerät.

Das Ergebnis war, dass die Gebelle der Hunde in verschiedenen Situationen tatsächlich signifikante Unterschiede in einigen akustischen Merkmalen aufwiesen:

Parameter wie das Harmonischer-Rausch-Verhältnis, die Grundfrequenz, die Spitzenfrequenz und die Gebellintervalle ändern sich je nach Situation. Interessanterweise können auch Menschen anhand dieser Geräusche Unterschiede erkennen und einige Gebelle den entsprechenden Situationen zuordnen.

Das bedeutet, dass die Geräusche von Katzen und Hunden tatsächlich Emotions- und Absichtssignale enthalten. Wenn Menschen diese Unterschiede erkennen können, kann auch die KI lernen, sie zu unterscheiden. Die Logik von Produkten wie PettiChat hat also sicherlich ihre Grundlage.

Ehrlich gesagt ist die behauptete Genauigkeit von etwa 95% für die Haustierhalter vielleicht nicht so wichtig.

Was wirklich spannend ist, ist, dass Hardwareprodukte wie PettiChat eine neue Art der Interaktion zwischen Menschen und Haustieren ermöglichen.

Selbst wenn Sie wissen, dass es sich um KI-Schätzungen und menschliche Verpackung handelt, fühlt es sich in diesem Moment an, als wären Ihre Haustiere Ihnen ein wenig näher:

Abschließend möchte ich sagen, dass der KI-Haustierbereich extrem konkurrenzintensiv ist.

Es ist so konkurrenzintensiv, dass ich es kaum glauben kann, dass in einer Zeit, in der die Kommunikation zwischen Menschen schon schwierig ist, Haustiere und Menschen in Echtzeit kommunizieren können.

Ich kann mir sogar die kommenden Produktlinien im „KI-Übersetzungsbereich“ vorstellen:

Basic-Version: Übersetzung von Katzen und Hunden.

Pro-Version: Übersetzung von Papageien, Hamstern und Schildkröten.

Natürlich muss es nicht auf Haustierübersetzungen beschränkt bleiben. Beispielsweise:

Max-Version: Übersetzung von „Noch eine Version ändern“ von Ihrem Auftraggeber.

Unternehmensversion: Übersetzung von „Danke, gehen Sie alle nach Hause“ von Ihrem Vorgesetzten.

Ultimative Version: Übersetzung von „Ich finde Sie nett“ von Ihrem Partnersuchepartner.

(Das war nur Spaß)

Referenzlinks:

[1]https://baike.baidu.com/item/Pettichat/67712810

[2]https://pettichat.com/

[3]https://www.sciencedirect.com/science/article/abs/pii/S016815910500420X

Dieser Artikel stammt aus dem WeChat-Account „Liangziwei“. Autor: Mengyao. Veröffentlicht von 36Kr mit Genehmigung.