StartseiteArtikel

Kann man mit einem 800-Yuan-AI-Halsband verstehen, was die Katzen sagen?

爱范儿2026-05-27 08:10
Warum fragst du nicht lieber ChatGPT?

Welcher Tierhalter möchte nicht verstehen, was seine Katze oder sein Hund sagen will, wenn sie/er laut wird, oder dass sie/er die menschliche Sprache versteht?

Eine Firma namens „Mengxiaoyi“ in Hangzhou hat kürzlich ein Produkt vorgestellt. Mit 800 Yuan kann man eine bidirektionale Kommunikation zwischen uns und unseren Haustieren herstellen, und die Genauigkeit erreicht 94,6 %.

Durch einen AI-Halsband, der sowohl Aufnahme- als auch Wiedergabefunktionen hat, in Kombination mit einer Mobil-App, wandelt der AI-Halsband die Geräusche von Katzen und Hunden in Texte um, die in einem Dialogfenster der App angezeigt werden. Benutzer können in diesem Dialogfenster Nachrichten senden, und der Halsband wird dann „Miau“ oder „Wau“ ausgeben, damit die Haustiere die menschlichen Worte „verstehen“.

Das klingt ziemlich unsicher. Es gibt schon viele ähnliche Produkte, die man einfach in WeChat-Small-Programmes finden kann. Einige sagen direkt: „Nur für den Spaß, bitte nicht ernst nehmen.“ Andere nutzen ebenfalls das AI-Konzept und analysieren hauptsächlich die Stimmung der Haustiere anhand von Audio-Aufnahmen.

Der AI-Haustier-Sprachenübersetzer in diesem Bild wird von dem großen Modell Qwen-Omni angetrieben.

Andererseits können wir nicht überprüfen, was Katzen und Hunde sagen. Der Übersetzer könnte einfach allgemeine Sätze benutzen, wie „Ich habe Hunger“, „Ich will raus“, „Ich fühle mich nicht wohl“ oder „Es kommt jemand“.

Und wenn wir unsere Worte in Katzen- oder Hundesprache übersetzen, ist es wahrscheinlich, dass die Überprüfung fehlschlägt, weil die Haustiere nur begrenzt verstehen können.

Aber für diese so „mysteriöse“ Sache gibt es tatsächlich Kriterien zur Messung, und die Genauigkeit erreicht 94,6 %.

Die offizielle Website von PettiChat: pettichat.com

Der von Mengxiaoyi vorgestellte AI-Halsband hat auch auf X viel Aufmerksamkeit erregt. Netizens diskutieren über diese chinesische AI-Startup für Haustierübersetzung. Einige Netizens sagen direkt: „Die 95%-ige Genauigkeit setzt voraus, dass man überprüfen kann, was die Haustiere sagen. Aber das kann man gar nicht. Also ist das einfach Unsinn, haha.“

Trotz der Kontroversen ist PettiChat sehr beliebt. Auf der Crowdfunding-Plattform Kickstarter hat es bereits 863 Unterstützer erreicht, und die gesammelten Gelder betragen 140.000 HK-Dollar.

Während der Crowdfunding-Phase kostet das Produkt 119 US-Dollar, was etwa 800 Yuan entspricht. Nach der Crowdfunding-Phase kostet es derzeit 149 US-Dollar im Ausland.

Im WeChat-Laden ist das Produkt mit einem Vorverkaufspreis von 799 Yuan angeboten, und es sind 190 Personen bereits gekauft. In den Produktbewertungen haben einige Benutzer Fotos hochgeladen und geschrieben: „Es ist interessant, manchmal die Gedanken der Haustiere zu hören.“

Die übersetzten Haustiersprachen sind auch sehr menschlich. Es gibt viele Modalpartikeln wie „Ma~“, „Na“, „Hey“, „Eh“, „Hehe“, „Jaja“, „Huhu“ und auch Ausdrücke wie „Gern geschehen“ und „Vergiss mich nicht“, die sehr emotional sind.

Können Haustiere wirklich so viel verstehen?

Also, wie misst man eigentlich die Genauigkeit von PettiChat? Sind diese ähnlichen Produkte eine Art Intelligensteuer?

Immer wieder in Zweifel gezogene, ständig aktualisierte Haustierübersetzungsgeräte

2002 hat die japanische Spielwarenfirma Takara BowLingual vorgestellt, ein Projekt zur „Stimmungsübersetzung“ von Hunden.

Es funktioniert einfach: Ein Mikrofon nimmt die Hundegebell auf und klassifiziert es in verschiedene Stimmungszustände, wie „glücklich“, „ängstlich“ oder „wütend“. Das Prinzip klingt wie ein Witz, aber es hat tatsächlich gut verkauft und den Ig-Nobel-Preis gewonnen. Die Begründung war: „Es hat eine friedliche Kommunikation zwischen Menschen und Hunden ermöglicht, also erhält es den Friedenspreis.“

Zwanzig Jahre später gibt es immer mehr ähnliche AI-Tools. Die oben erwähnten Small-Programmes und spezielle Anwendungen nutzen maschinelles Lernen, um Katzengezwitscher zu analysieren und jedem Laut ein Label zu geben.

An der CES-Messe zu Beginn des Jahres hat Traini auch einen AI-Halsband vorgestellt, der für eine einseitige Kommunikation von Menschen zu Hunden konzipiert ist. Wir sprechen, und er wandelt unsere Worte in akustische Signale um, die Hunde verstehen können.

Die Lust, mit Haustieren zu kommunizieren, scheint nie erloschen zu sein. Mit der Entwicklung der Technologie glauben wir sogar mehr, dass es möglich ist, mit Katzen zu kommunizieren.

Diesmal hat PettiChat etwas Neues getan: Es hat eine Testdatenreihe veröffentlicht.

Aussehensmäßig wiegt PettiChat 27 Gramm und kann an einem Halsband befestigt werden, ohne dass es die Haustiere belastet.

In diesem kleinen Gerät gibt es einen Edge-Computing-Chip, der direkt die Audio-Daten verarbeitet. Die Latenzzeit beträgt nur 40 Millisekunden. Es braucht keine dauerhafte Internetverbindung und nutzt nur kurzzeitig Cloud-Ressourcen, wenn es die Geräusche analysiert. Außerdem hat es andere Funktionen wie IP65-Wasserdichtheit, 1000 Übersetzungen pro Ladung und 100 Stunden GPS-Verfolgung.

Nach der Crowdfunding-Plattform basiert das verwendete akustische Modell auf über 1,5 Millionen Haustier-Geräuschproben und Peer-Review-Studien zur Tierverhaltensforschung. Das Ergebnis ist, dass die Genauigkeit der Stimmungserkennung anhand von Geräuschen 91 - 92 % erreicht. Mit der Hinzunahme von Gestenerkennung steigt die Genauigkeit im Labor auf 94,6 %.

Über 5 Millionen Haustier-Stimmprint-Daten

Auf der Crowdfunding-Seite gibt es zwei etwas unklare Werbebilder, die zeigen, auf welchen Grundlagen diese Daten getestet wurden. Wenn man sie genauer ansieht, findet man zwei wissenschaftliche Artikel.

Einer ist DogSpeak, ein Datensatz zur Klassifizierung von Hunde-Geräuschen, der auf der renommierten Multimedia-Konferenz MM 2025 vorgestellt wurde.

Der Autor dieses Artikels hat einen großen Datensatz von Hunde-Geräuschen namens DogSpeak vorgeschlagen. Ziel war es, zu untersuchen, ob man anhand von Hunde-Geräuschen das Geschlecht, die Rasse und sogar die Identität eines Hundes bestimmen kann.

Die Daten stammen aus Hundevideos auf sozialen Medien wie YouTube und TikTok. Der Autor hat zunächst Videos von fünf Rassen - Husky, Chihuahua, Deutscher Schäferhund, Pitbull und Shiba Inu - gesucht und dann anhand von Kanalinformationen, Titeln und Kommentaren das Geschlecht, die Rasse und die Identität der Hunde festgestellt.

Am Ende hat man 156 Hunde, fünf Rassen, 77.202 Hunde-Geräuschsequenzen und 33,162 Stunden reines Hundegebell. Diese Daten sind nicht mit Informationen über die Aktivitäten der Hunde oder die Situationen markiert.

Die Experimente in diesem Artikel zielten darauf ab, anhand von Geräuschsequenzen das Geschlecht, die Rasse und die Identität der Hunde zu bestimmen. Die Ergebnisse zeigen, dass diese Aufgaben nicht so einfach sind wie erwartet. Es ist schwierig, Hunde-Geräusche in einer realen und komplexen Umgebung nur anhand von „reinen akustischen Merkmalen“ zu identifizieren.

Man kann auch die Gesichtsausdrücke berücksichtigen.

Der Autor schlägt am Ende des Artikels vor, dass zukünftige Forschungen außerhalb des Komforts der traditionellen Audio-Technologie gehen sollten und nach höheren strukturellen, rhythmischen und sogar potentiellen „linguistischen“ Merkmalen von Hunden suchen sollten.

Der andere Artikel ist ebenfalls von MM, ein Datensatz und eine Klassifizierungsmethode für städtische Geräusche aus dem Jahr 2014. Dies ist ein klassischer Artikel über Datensätze in der Stadt-Geräuschklassifizierung. Sein Kernbeitrag ist der UrbanSound8K-Datensatz und die Klassifizierungsmethode für städtische Geräusche.

Der Autor hat städtische Geräusche in Kategorien wie menschliche Stimme, Natur