StartseiteArtikel

Ein Dialogfenster, ein Frosch und 40.000 Nutzer pro Woche. Was hat Ribbi richtig gemacht?

阿菜cabbage2026-04-23 08:30
Ohne Multi-Agent und ohne "Leinwand". Die Philosophie von Ribbi lautet: Lasse die Agenten so frei wie möglich.

Interview | Deng Yongyi, Zhou Xinyu

Text | Zhou Xinyu

Editor | Yang Xuan

Wenn Sie es zum ersten Mal verwenden, ist es schwierig, Ribbi eine genaue Definition zu geben.

Wenn wir sagen, dass es ein multimodales Inhaltserstellungstool ist, kann Ribbi mehr als das. Statt ein "totes" Tool ist Ribbi eher wie eine "Person", die den gesamten kreativen Prozess automatisch verwalten kann.

Es kann den kreativen Prozess des Benutzers automatisch in Fähigkeiten (Skills) festigen; es kann auch die Datenleistung von Social Media überwachen, zusammenfassen und überprüfen und automatisch nachfolgende Erstellungen optimieren.

Die Startseite der Ribbi - Offizialwebsite.

Für die meisten Ersteller ist dies ein Produkt mit einer extrem "seltsamen" Benutzererfahrung. Anders als Designprodukte wie Figma und Lovart hat Ribbi keine prominenten Leinwände. Alle kreativen und bearbeitenden Interaktionen sind in einer kleinen Dialogbox konzentriert.

Und der Ribbi, mit dem Sie sprechen, ist als ein "Frosch" mit starkem Charakter gesetzt: er mag zu beschweren und schwört gelegentlich.

Unterhaltung mit Ribbi.

Dieses etwas "seltsame" Produkt erhielt innerhalb einer Woche nach dem Start des Closed - Beta - Tests Nutzungsanträge von mehr als 40.000 Benutzern weltweit. Die Benutzergruppe wuchs rapide von 20 Personen am ersten Tag des Starts auf fast 20 vollbesetzte große Gruppen. Auf Xianyu wurde der Beta - Test - Code für Ribbi einmal auf 200 Yuan spekuliert.

"Wir haben Ribbi ursprünglich ins Leben gerufen, um mehr als 100 Seed - Benutzer für einen Closed - Test zu finden, um die PMF (Product - Market Fit) zu verifizieren. Wir hatten sogar noch nicht offiziell mit Marketing und Promotion begonnen", sagte uns Robin, der Gründer und CEO von Ribbi. Die Spaltungsgeschwindigkeit der Benutzer - Mundpropagierung übertraf weit seine Erwartungen.

Bei der Kommunikation mit "Intelligent Emergence" Anfang April war Robins Stimme bereits heiser. Innerhalb von zwei Wochen traf er sich mit mehreren Investmentinstitutionen, und der Privatnachrichten - Kasten der offiziellen LinkedIn - Seite war ebenfalls mit Kooperationseinladungen gefüllt.

Robin hat ein Studium der Industriedesign absolviert und in 4A - Werbeagenturen und bei der Markenplanung gearbeitet. Später leitete er auch das kreative Funktionsdesign mehrerer star - AI - Produkte und die Umsetzung kreativer Agenten in mehreren führenden Großunternehmen.

Vor seinem Unternehmenserfolg hat Robin immer daraufhin geforscht, wie der Prozess der kreativen Umsetzung einfacher gemacht werden kann. Er stellte fest, dass die kreativen Tools auf dem Markt voneinander unabhängig sind und der Kontext der Benutzererstellungen nicht verbunden ist. Dies bedeutet, dass Benutzer, wenn sie Inhalte erstellen möchten, für jeden Schritt die Tools wechseln und ihre kreativen Bedürfnisse erneut mit den Tools in Einklang bringen müssen.

"Viele AI - Designtools auf dem Markt betrachten die Inhaltserstellung immer noch als ein Zusammenfügen einzelner Punkte. Aber in der Tat sollte die Erstellung ein vollständiger Prozess sein, der die kreative Generierung, die Inhaltserstellung, die Veröffentlichung, die Datenüberwachung, die Überprüfung und die Optimierung umfasst", sagte Robin "Intelligent Emergence".

Basierend auf diesem Verständnis traf Robin, als er Ende 2025 beschloss, sein eigenes Unternehmen zu gründen, viele "nicht - konsensfähige" Entscheidungen:

Entwickeln Sie keine Produkte mit einer Multi - Agent - Architektur, denn der Wechsel zwischen verschiedenen Expertenagenten würde einen Verlust des Kontexts verursachen;

Konzentrieren Sie sich nicht auf die Generierung einzelner Inhalte, sondern verbinden Sie alle Schritte in der Erstellung mit einem Agenten, wie z. B. die Erstellung, die Veröffentlichung, die Effektüberwachung, die Überprüfung und die Optimierung;

Entwickeln Sie keine "Leinwand - Typ" - Produkte, sondern verwenden Sie Chat als Benutzeroberfläche, um dem Agenten mehr Freiheit zu geben;

Trainieren Sie selbst ein VLM (Visual - Language - Modell) und entwickeln Sie selbst eine Agent - Architektur namens Contxt Layer, um kreative Erfahrungen und Rückmeldungen festzulegen und die KI autonom zu entwickeln.

Das ultimative Ziel all dieser Entwürfe, sagte uns Robin, ist es, dass Ribbi nicht nur ein "Tool" ist, sondern eine "Person", die den vollständigen kreativen geschlossenen Kreislauf versteht.

Hier sind 20 "radikale Aussagen" von Robin, dem Gründer und CEO von Ribbi, über Agent - Unternehmertum:

🐸 In Großunternehmen ist es am schwierigsten, Geschäft, Modelle und die oberste Ebene in Einklang zu bringen, es sei denn, es besteht eine Branchenkonkordanz.

Beispielsweise, als das Codieren eine Branchenkonkordanz wurde, stürmten sowohl Großunternehmen als auch die "Sechs AI - Tiger" in diese Richtung.

Aber bevor die eindeutige Wertigkeit von Geschmack erkannt wird, sind Großunternehmen ungern bereit, Modelle für Ästhetik und Geschmack aufzubauen. Erst wenn die visuelle kreative Generierung von einer nicht - konsensfähigen zu einer konsensfähigen Lösung wird, können mehr Großunternehmen und Spitzentalente stimuliert werden, sich zu beteiligen.

🐸 Sobald das Team wächst, nimmt der Verlust des Kontexts zu.

Großunternehmen haben starke Fähigkeiten in Bezug auf das Basis - Modell, aber die Modellteams haben eine Abweichung in ihrem Verständnis des Geschäfts. Sobald das Team wächst, geht in der Prozess der Informationsübertragung zwischen den Teams eine große Menge an Kontext verloren.

Dies ist auch der Grund, warum das Ribbi - Team nur 6 Personen hat. Wir haben nur 3 Programmierer, und sie sind jetzt Full - Stack - Designer und Full - Stack - Ingenieure. Sie können alles entwickeln und es gut machen.

Dies ist die Evolution der Code - Produktivität, die von Claude Code gebracht wird. Ich glaube, dass Ribbi eine Evolution der Inhalts - Produktivität bringen wird.

🐸 Viele AI - Produkte machen falsche Werbung.

Während des Promotionsprozesses haben wir viele "Abstraktionen" gemacht, wie z. B. "ARR überstieg 100 Millionen in 72 Stunden" und "einen Million Benutzer über Nacht". Im Wesentlichen war es eine Satire auf die falsche Werbung vieler AI - Produkte.

Es war nur, dass unsere Satire nicht gut genug war, und viele Benutzer glaubten es (hilflos lächelnd).

Unser CEO - Account auf X ist auch gefälscht. Es gibt keine Person wie "Robin Bisset". Viele Inhalte auf dem Account, einschließlich Robins Ausländer - Image, wurden von Ribbi generiert.

△ Ribbis virtueller ausländischer CEO. Quelle: X

🐸 Die AI - Branche wird allmählich wie der Kryptowährungs - Kreis.

Es hat mich lange gedauert, Harness zu verstehen. Der Kreis mag Konzepte zu schaffen, wie z. B. "Sattel" und "Reiten", was es sehr mysteriös macht.

Tatsächlich ist Harness sehr einfach. Es ist nur ein Skript oder ein Workflow, der das Modell auf Kurs hält und es besser seinen Wert entfalten lässt.

Bevor das Konzept von Harness aufgetaucht ist, war es bereits ein Konsens, sich auf Frameworks oder Agenten zu verlassen, um den Kontext der AI - Aufgabenausführung zu optimieren. Jetzt hat die Branche dies abstrahiert und ihm eine Kerndefinition gegeben.

🐸 Leinwand - Typ - Produkte "einschränken" die Möglichkeiten des Modells.

Wir haben Ribbi nicht als ein Leinwand - Typ - Produkt gemacht. Leinwand - Typ - AI - Produkte sehen in der Interaktion sehr cool aus, was Investoren beeindrucken kann, und professionelle Benutzer finden sie auch einfach zu bedienen.

Aber sie haben einen "tödlichen Fehler": sie "einschränken" die Möglichkeiten des Modells im Voraus. Denn die Essenz der Leinwand besteht darin, den Workflow in einzelne Knoten zu zerlegen, und das Modell kann nur diesem Pfad folgen.

Unsere durchgängige Einschätzung ist, dass die Benutzeroberfläche in der AI - Ära auf Containern basieren sollte, nicht auf Funktionen. Das Produkt sollte einen Container für die KI schaffen, der es ihr ermöglicht, frei zu entscheiden, welche Tools aufzurufen, wie sie zu kombinieren und sogar in welcher Reihenfolge Aufgaben auszuführen.

🐸 Vor der Reife der eingebetteten Intelligenz ist Chat die beste Benutzeroberfläche für AI.

In der Internet - Ära sind wir es gewohnt, Informationen über Chat zu übertragen. Beispielsweise können wir auf WeChat Bilder aufnehmen, Videos aufnehmen und Links und Mini - Programme senden.

Meiner Meinung nach ist Chat ein Container, der einfach genug ist und alles flexibel kompatibel macht.

Beispielsweise hat Doubao eine hohe tägliche Aktivität. Einer der Gründe ist, dass seine Mobile - App sehr leichtgewichtig ist. Benutzer müssen keine neue Dialogbox öffnen. Sie können Bilder und Videos einfach durch wildes Chatten in einer Sitzung generieren. Es vereinigt die Interaktionen der Benutzer und das Verhalten der KI in einem sehr einfachen Rahmen.

Was die Benutzer an Ribbi mögen, ist, dass sie Materialien von Plattformen wie X, Instagram und Pinterest jederzeit in Ribbi sammeln und speichern können, und die zugrunde liegende KI wird dann autonom die Ästhetik darin lernen. Dies ist eigentlich der Prozess des Mensch - KI - Chats.

Als AI - Produktmanager hasse ich es wirklich, komplexe Interaktionen zu verwenden, um die KI zu bedienen. Die KI sollte intelligent genug sein, um die Arbeit zu erledigen, ohne dass ich ständig zuschauen muss. Wenn die Interaktions - und Nutzungsbarrieren Ihres Produkts niedrig genug sind, wird es natürlich mehr Menschen anziehen.

🐸 Echte kreative Bedürfnisse sind niemals eindimensional.

Viele Leute werden sich fragen: Warum packen Sie so viele Funktionen (Bild/Video/Musik - Erstellung, Social - Media - Überwachung, Editor) in Ribbi? Wird dies zu einer unklaren Positionierung oder zu einer fehlenden tiefgreifenden Entwicklung jeder Funktion führen?

Wir glauben immer, dass echte kreative Bedürfnisse niemals eindimensional sind. Beispielsweise umfasst die Produktion eines Douyin - Videos Prozesse wie das Finden eines Themas, das Schreiben eines Textes, das Schreiben eines Skripts, das Generieren eines Storyboards, das Dubben, das Bearbeiten, das Designen einer Cover - Seite, die Veröffentlichung, die Datenüberwachung und die Überprüfung.

Dies ist ein vollständiger Prozess. Ohne ein All - in - One - Tool bedeutet dies, dass Benutzer verschiedene Tools wechseln und den kreativen Kontext erneut ausrichten müssen.

Die Menschen sind faul. Kein Benutzer möchte für jeden Schritt der Produktentwicklung ein anderes Modell oder ein anderes Set von Tools verwenden. Beispielsweise müssen Sie, um ein Video zu machen, zuerst ChatGPT verwenden, um den Text zu generieren, dann Gemini, um das Storyboard zu generieren, und schließlich Jianying, um das Video zu montieren. Es ist sehr umständlich.

Der Ausgangspunkt unseres Designs der Ribbi - Funktionen ist nicht, die Funktionen umfassend zu machen, sondern den Kontext des kreativen Prozesses vollständig zu verbinden.

🐸 Der Kern des Ribbi - Agentenbaus liegt in der autonomen Entwicklung.

Der Kern von Internetplattformen ist UGC. Der Kern von Ribbi ist AGC, Agent Generated Content. Vor meinem Unternehmenserfolg habe ich nach einem Szenario gesucht, in dem die "autonome Entwicklung des Agenten" implementiert werden kann, und die Erstellung ist eine gute Antwort.

Zunächst wird der Geschmack autonom entwickeln. Dies ist der Grund, warum wir Pond entworfen und das VLM trainiert haben.

Zweitens werden auch die Fähigkeiten (Skills) autonom entwickeln, wenn die Benutzer sie verwenden. Im Prozess der Verwendung von Fähigkeiten werden Benutzer neue Szenarien, Bedürfnisse und Kontexte generieren, die zu benutzerspezifischen Fähigkeiten kondensiert werden. Diese persönlichen Fähigkeiten werden von dem Skill - Agenten im Context Layer bewertet, dedupliziert und entprivatisiert und dann an die gesamte Plattform beigetragen. Daher werden auch die Fähigkeiten der Plattform zyklisch entwickeln. Je mehr Benutzer die Plattform nutzen, desto mehr Fähigkeiten werden es geben und desto stärker wird die Fähigkeit sein.

Schließlich werden auch die Benutzererstellungen autonom entwickeln. Der Grund, warum wir ein vollständiges kreatives Tool gebaut haben, ist, dass die Benutzererstellungen ein kontinuierlicher Prozess sind, der Prozesse wie das Suchen, das Entdecken von Materialien, die Generierung von Inhalten, das Bearbeiten und Optimieren, die Veröffentlichung in Social Media und die Datenüberwachung umfasst.

Social Media ist das zentrale Trainingsfeld für die Online - Entwicklung von Agenten. Die Veröffentlichung von Werken in Social Media ist eine Form der Interaktion zwischen Agenten und der realen Welt. Nach der Überwachung der Datenleistung kann Ribbi den kreativen Pfad autonom iterieren und optimieren und bessere Ergebnisse liefern. Schließlich kann die Plattform einen autonom entwickelnden kreativen geschlossenen Kreislauf bilden.

🐸 Multi - Agent ist im Wesentlichen eine Unterschätzung der Fähigkeiten des Modells. Produkte sollten den Agenten mehr Freiheit geben.

In der Multi - Agent - Architektur stammen die zugrunde liegenden Fähigkeiten der meisten Expertenagenten von Claude. Da die zugrunde liegenden Modelle gleich sind, warum müssen wir das Modell durch Prompt - Engineering in verschiedene Agenten aufteilen?

Prompt - Engineering ist im Wesentlichen eine Einschränkung der Fähigkeiten des Modells. Gleichzeitig führt der Transfer von Aufgaben in der mehrschichtigen Agent - Architektur zu einem Verlust des Kontexts.

Als wir Ribbi entwickelten, war unsere Kernidee, dem Agenten gen