StartseiteArtikel

Warum hat man den Mut, pro Jahr weitere 1.000 Yuan für eine 1.000 - Yuan - Aufnahmekarte zu verlangen?

爱范儿2026-04-15 10:33
Letztendlich lohnt es sich, für ein sicheres Ergebnis zu bezahlen.

In den letzten Jahren ist die Idee von „AI-Hardware“ sehr beliebt geworden. Doch scheint man immer wieder in die Geschichte des „Einkaufs auf Abruf“ verstricken zu werden:

Bei der Produktaustellung wird ein grandioses Konzept präsentiert, und die daraus entstehende Vorstellungskraft überzeugt die Menschen zunächst. Erst wenn das Produkt tatsächlich in die Hände der Nutzer gelangt, stellt man fest, dass seine Fähigkeiten nicht den versprochenen Geschichten entsprechen.

Daher sinkt die Nutzungsfrequenz des Produkts rapide, und niemand ist bereit, für die nachgelagerten Dienstleistungen weiter zu bezahlen. Am Ende hat das Produkt nur noch wenige hundert tägliche aktive Nutzer und endet in einem trüben Schein.

Aber Plaud bricht diesen Teufelskreis – es verdient nicht nur das Geld für meine Tonaufnahmegeräte, sondern plant auch, jedes Jahr weitere 1.000 Yuan von mir zu verdienen.

Was noch wichtiger ist: Ich bin tatsächlich bereit, zu zahlen. In einer Zeit, in der das Konzept der AI-Hardware noch stark in Zweifel gezogen wird, hat Plaud ein ganzes Geschäftsmodell erfolgreich umgesetzt.

Das Hardware ist der Zugang, die App ist der Kern

Das kostenlose „Einführungsangebot“ von Plaud umfasst 300 Minuten Transkriptionszeit.

Aber für einen Nutzer, der professionelle Tonaufnahmewünsche hat und daher ein Tonaufnahmegerät kaufen muss, ist 300 Minuten nur eine Probeversion.

Die Professional-Version kostet 339 Yuan pro Jahr und bietet monatlich 1.200 Minuten Transkriptionszeit. Die „Exzellenz“-Mitgliedschaft für 1.099 Yuan pro Jahr bietet unbegrenzte Transkriptionszeit.

Hier wird es interessant. Denn der Preis eines Plaud Note Tonaufnahmegeräts liegt auch nur bei etwa 1.049 Yuan.

Das heißt, die Abonnementgebühren für ein Jahr können sogar höher sein als der Preis des Hardwareprodukts selbst.

Was hat also Plaud für eine Magie, dass man bereit ist, zunächst 1.000 Yuan für ein Tonaufnahmegerät auszugeben und dann jedes Jahr weitere 1.000 Yuan für die Nutzung zu zahlen?

Tatsächlich besteht das Kernerlebnis von Plaud nicht in dem Tonaufnahmegerät selbst, sondern in der damit verbundenen App.

Diese App ist sehr pur. Alle Funktionen konzentrieren sich auf die Verarbeitung von „Tonaufnahmen“ und wirken hochwertig und professionell.

Ihre Kernfunktion ist die „Notiz“: Plaud verarbeitet die Tonaufnahmen mit einem Large Language Model. Sie können alles automatisch von Plaud generieren lassen oder auch die Transkriptionssprache, das AI-Modell und die Vorlage auswählen.

Was den „Ergebnisunterschied“ noch vergrößert, ist die Vorlagenfunktion von Plaud, die ich auch als die am meisten lohnende Funktion halte.

Die offiziellen Seiten bieten zunächst eine Vielzahl von fertigen Vorlagen, die verschiedene Szenarien und Fachgebiete wie Meetings, Vorträge, Telefonate, Interviews, Medizin, Finanzen und Recht abdecken. Es gibt auch einige „funktionale“ Vorlagen, die die Absichten der Sprecher, Machtstrukturen in der Aufzeichnung analysieren und sogar die psychische Verfassung und die Ehrlichkeit der Sprecher bewerten können.

Im Wesentlichen sind die Vorlagen von Plaud eine lange Reihe von festen Prompts, die das Large Language Model nutzen, um die Tonaufnahmen gezielt zu organisieren. Was Plaud verkauft, sind diese vordefinierten Prompts.

Da es sich um Prompts handelt, können die Nutzer natürlich auch ihre eigenen Vorlagen erstellen – ähnlich einem Produkt, das von jemandem entwickelt wurde, der wirklich versteht, wie die Arbeit funktioniert. Denn oftmals sind die allgemeinen Vorlagen nicht an die individuellen Bedürfnisse angepasst, und das, was wirklich wertvoll ist, ist die eigene Logik zur Informationsverarbeitung.

Zum Beispiel haben wir jeden Morgen ein Themenbrainstorming, in dem es um Themeninhalte, Kernpunkte, wichtige Informationen und verantwortliche Redakteure geht. Eine normale Transkription kann zwar die Informationen aufzeichnen, aber es ist schwierig, daraus etwas direkt Umsetzbares zu machen.

Also habe ich Plaud eine eigene Vorlage geschrieben, damit es die Informationen nach diesen Kriterien organisiert. Das Ergebnis war sehr klar: Jeder Thema wurde einzeln aufgeschlüsselt, und jede Aufgabe war genau zugeordnet.

Durch die Verwendung verschiedener Vorlagen kann die gleiche Tonaufnahme auf verschiedene Weise analysiert und aufbereitet werden. Durch diese wiederholte Organisation können wir die wertvollsten Informationen aus der Aufzeichnung extrahieren.

Mein Eindruck von Plaud ist, dass es sehr „menschenzentriert“ ist.

Viele Tonaufnahmeprogramme, wie z. B. Feishu Miaoji, konzentrieren sich eigentlich auf die „Meeting-Aufzeichnung“ selbst. Nach jeder Aufzeichnung wird automatisch eine Notiz erstellt, die direkt zur Aufgabenverteilung verwendet werden kann.

Aber Plaud baut auf den Worten auf, die die Menschen hören. Es konzentriert sich auf die Interaktion zwischen Menschen. Zunächst werden 100 % der Informationen aufgezeichnet, und dann werden durch Zusammenfassungen und Vorlagen die wertvollsten 50 % der Inhalte beibehalten und 10 % der besten Inhalte hervorgehoben.

Verschiedene Vorlagen sind verschiedene Ansätze, um die ursprünglichen Informationen zu betrachten. Sie können die Vorlage auswählen, die Ihren Interessen entspricht – dies kann nicht das menschliche Denken ersetzen, aber es kann neue Einblicke geben.

Indem die besten ursprünglichen Informationen beibehalten werden und die menschliche Erinnerung und Erfahrung während des Gesprächs hinzugefügt werden, kann die Kommunikation maximale Verständnis erreichen.

„Strom und Glühlampe“ in der AI-Zeit

Obwohl Plaud ein „AI-Hardwareprodukt“ ist, verdient es nicht von dem Hardware selbst, sondern der Großteil seines Umsatzes kommt von Abonnements.

Dies ist das klassische Rasierer-Businessmodell: Rasiererhersteller verkaufen nicht nur das Messer selbst, sondern auch die ersetzbaren Klingen. Nachdem die Nutzer das Hardwareprodukt gekauft haben, müssen sie weiterhin bezahlen und sind in ein Ökosystem eingebunden.

Heute ähnelt es einem standardmäßigen „AI-Gebührenmodell“. Der Kernunterschied zwischen den verschiedenen Mitgliedschaftsstufen liegt nicht in der Qualität und Geschwindigkeit, sondern in der Zeitdauer, dem Kontingent und der Anzahl der „Token“, für die Sie bereit sind, zu bezahlen.

Natürlich heißt das nicht, dass das Tonaufnahmegerät von Plaud nutzlos ist. Für Nutzer, die viel Tonaufnahmen machen, ist ein spezielles physisches Gerät zur Tonaufnahme ein großer Vorteil für die Nutzungserfahrung.

Verdient Plaud wie OpenAI von „AI-Modellen“? Scheint nicht.

Die hervorragende Erfahrung bei Plaud wird tatsächlich von Large Language Modellen unterstützt, und man kann zwischen verschiedenen Modellen wie DeepSeek, Qianwen und Doubao wählen. Aber der Standardmodus „Automatik“ ist das Herzstück von Plaud: Er spart Ihnen die technischen Details und liefert Ihnen direkt das Ergebnis.

Dies ist auch das markanteste Merkmal der AI-Zeit: Wir bezahlen für das Ergebnis, nicht für das Werkzeug selbst oder den Prozess.

Plaud, das keine Large Language Model entwickelt, verkauft nicht die „AI“ selbst, sondern die „Methode, wie man AI nutzt“.

Im Wesentlichen ist das Large Language Model nur eine Antriebskraft, ähnlich wie Wasser und Strom. Es hat enorme Energie, aber unsere Nutzung davon ist noch sehr begrenzt, und wir sind noch weit davon entfernt, den Bereich der Chatbots zu verlassen.

Vor 200 Jahren wusste niemand, wofür der von Faraday entdeckte Strom gut war. Erst als die Glühlampe, das Telefon und andere Elektrogeräte erfunden wurden, wurde der Strom wirklich nützlich.

Plaud ist die „Glühlampe“ der AI-Zeit.

Die ambitionierten Produkte wie Rabbit R1 und Humane AI Pin sind eher wie AI-Hardware, die in der Welle der generativen AI nach Problemen sucht, die gelöst werden können. Sie sind sozusagen „AI für AI“ und haben keine echten Anwendungsfälle gefunden, in denen AI Probleme lösen kann.

Für Plaud ist die AI eigentlich nicht so wichtig. Von Anfang an wollte das Unternehmen nur die „Tonaufnahme“ perfektionieren, und das Large Language Model ist nur der schnellste Weg zu diesem Ziel.

Ähnlich wie das seit jeher bestehende Problem der Beleuchtung: Bevor es die Glühlampe gab, hatten die Menschen schon die Kerze erfunden. Aber die Glühlampe ist effizienter und leuchtet heller, daher haben wir die Glühlampe gewählt.

Plaud funktioniert auf ähnliche Weise. Wir haben das Large Language Model, das eine bisher nie dagewesene Sprachverarbeitungsfähigkeit hat. Deshalb nutzen wir es, um die Probleme im Bereich der Tonaufnahme zu lösen und die Tonaufnahme so gut wie nie zuvor zu machen.

Natürlich können wir Chatbots wie ChatGPT oder Gemini nutzen, um unsere Tonaufnahmen zu verarbeiten. Aber um ein gutes Ergebnis zu erzielen, benötigen wir gute Prompts, und wenn das Modell nicht gut genug ist, müssen wir es wechseln. Dies ist nicht die intuitivste Art der Nutzung.

Aber Plaud erfordert nicht, dass die Nutzer überlegen, welches Large Language Model sie nutzen sollen oder bessere Prompts geben müssen. Es bietet die Gewissheit, dass mit einem Klick das beste Ergebnis direkt vor die Nutzer gebracht wird.

Unter den vielen ähnlichen Produkten ist Plaud bisher dasjenige mit der größten „Gewissheit“.

Und es ist diese Gewissheit, für die wir bereit sind, zu bezahlen. Kein „Lotterie-System“, sondern direkt zum Ziel.

AI-Hardware sollte die „Komplexität“ verstecken

Viele Menschen wissen nicht, wie man AI nutzt.

Hierbei bedeutet „nicht wissen, wie“ nicht nur, dass sie sich nicht aktiv mit AI-Produkten befassen, sondern auch, dass sie nicht wissen, wie man AI richtig einsetzt. Sie denken, dass man einfach einen kurzen Prompt in ein Dialogfeld eingeben muss, und das AI-Produkt versteht sofort die Absicht und liefert ein direkt einsetzbares Ergebnis.

Das Problem ist, dass es tatsächlich nur sehr wenige Menschen gibt, die sich Zeit nehmen, um sich mit Prompts, Workflows und Modellunterschieden zu beschäftigen, also diejenigen, die „AI nutzen können“. Die meisten Nutzer haben weder die Geduld noch den Bedarf dazu. Sie wollen nur das Ergebnis und möchten sich nicht halbwegs zu einem Prompt-Engineer ausbilden.

Schließlich erwarten wir von der AI, dass wir mit möglichst wenig Aufwand die besten Ergebnisse erzielen können.

Wenn man nicht weiß, wie