Matrix Pixel hat eine Seed-Runde von 7 Millionen Yuan finanziert, und der Investor ist Xingbang Interactive Entertainment.
36Kr hat erfahren, dass die Peking Matrix Pixel Technology Co., Ltd. kürzlich eine Samenfinanzierungsrunde in Höhe von 7 Millionen Yuan RMB abgeschlossen hat. Die Investoren sind Xingbang Interactive Entertainment. Die Gelder aus dieser Finanzierungsrunde werden hauptsächlich für die kontinuierliche Vertiefung der Forschung und Entwicklung der Multimodal-Agent-Technologie verwendet, um deren massenhafte Implementierung in Szenarien wie AI-Comic, AI-E-Commerce und Inhaltswerbung zu beschleunigen. Gleichzeitig wird die Forschung, Entwicklung und Marktförderung neuer Produkte - dem gesamten Agent-Agenten-Arbeitsraum und OpenPaper - vorangetrieben.
Die Peking Matrix Pixel Technology Co., Ltd. wurde von CEO Zhang Anyang gegründet. Die Mitglieder des Kernteams kommen aus Unternehmen wie Huawei, Baidu, Novartis, Handy Mobile und BlueFocus und verfügen über Erfahrungen in Algorithmen, Produkten, Kommerzialisierung und Branchenszenarien. Im Gegensatz zu vielen Gründerteams, die von der Modellfähigkeit ausgehen, legt Matrix Pixel stärker auf ein Systemverständnis für reale Geschäfte ab: Es betrachtet das Large Language Model nicht als einen Akku von Einzelkapazitäten, sondern als ein Produktionssystem, das eingeschränkt, organisiert, korrigiert, überwacht und kontinuierlich verbessert werden muss. Das Unternehmen konzentriert sich derzeit auf den B2B-Markt und bietet hauptsächlich Agent-Produkte und -Dienstleistungen für Inhaltserstellung, Prozesskooperation und Geschäftsprozessautomatisierung an E-Commerce-, Comic- und Inhaltswerbeunternehmen.
Außenstehenden scheint der AI-Inhaltsmarkt bereits überfüllt zu sein: Es gibt immer mehr Modelle, und ihre Generierungsfähigkeiten werden immer stärker. Canvas, Workflow, Plug-ins und Wissensbanken sind fast Standard. Doch wenn man in Unternehmen eintritt, liegt das Problem nicht darin, "ob man generieren kann", sondern darin, "ob man langfristig stabile, lieferbare, wiederverwendbare, kontrollierbare und überprüfbare Ergebnisse erzielen kann". Viele Tools imponieren in der Demo-Phase, aber sobald sie in die reale Geschäftspraxis eingesetzt werden, treten Probleme wie Kontextverschiebung, Stilverlust, Aufgabenabbruch, Wissensvergessenheit, instabile Ästhetik und nicht nachvollziehbare Ergebnisse auf. Matrix Pixel ist der Meinung, dass die Kernkompetenz von AI-Gründungsunternehmen in der nächsten Phase nicht mehr die Fähigkeit zur Einzellmodellaufrufung sein wird, sondern die Fähigkeit zum Verständnis komplexer Aufgabensysteme.
Basierend auf dieser Einschätzung definiert Matrix Pixel seine Technologiestrategie wie folgt: Auf der Grundlage von Multimodal-Large Language Modellen, mit Agenten als Ausführungseinheiten, einem engineeringmäßigen Organisationssystem als Gerüst und Branchenwissen und ästhetischen Normen als Einschränkungen wird schließlich ein digitales Mitarbeitersystem für die industrielle Inhaltserstellung aufgebaut. Das Kernprodukt NextCut AI und der neu veröffentlichte gesamte Agent-Agenten-Arbeitsraum sind keine Tools für die Generierung anhand einzelner Prompts, sondern versuchen, die Schritte "Bedürfnisverständnis - Aufgabenaufteilung - Inhaltsgenerierung - automatische Korrektur - mehrfache Rückmeldung - Versionenkonsolidierung - Ergebnisarchivierung" zu einem wiederholbar aufrufbaren geschlossenen Geschäftsprozess zu verbinden.
Laut Unternehmensangaben zeigt sich der technologische Vorteil von Matrix Pixel zunächst in der unterliegenden Harness Engineering-Fähigkeit. Im Gegensatz zu allgemeinen Workflow-Produkten, die auf die Verbindung von Knotenpunkten und die Montage von Schnittstellen setzen, legt Matrix Pixel mehr Wert auf die fein abgestimmte Kontrolle des Agentenverhaltens selbst, einschließlich Strategien zur Aufgabenaufteilung, Pfaden zur Kontextweitergabe, Verwaltung von Kurz- und Langzeitgedächtnis, Priorität der Wissenssuche, Einschränkungen bei der Aktionseinsetzung, Rückfall bei fehlerhaften Ergebnissen, Verwaltung der Versionen und Regeln für die Zusammenarbeit mehrerer Agenten. Dies bedeutet, dass das System nicht einfach mehrere Modelle "verkettet", sondern versucht, eine Kontrollschicht aufzubauen, die einer Produktionsbetriebssystem ähnelt, um die Ausgabe jedes Agenten strukturiert zu überwachen.
Weiterhin versteht Matrix Pixel "Intelligenz" nicht als natürliche Ausstrahlung der Modellparametergröße, sondern betont stärker die nutzbare Intelligenz, die durch Algorithmen und geschäftliche Einschränkungen gemeinsam geformt wird. In Branchen mit hohem Inhaltsvolumen wie E-Commerce, Comic und Werbung ist der wahre Wert nicht ein einmaliger Inspirationseinfall, sondern die Fähigkeit, kontinuierlich Inhalte zu produzieren, die der Plattformlogik, der Platzierungslogik, der Erzähllogik und der ästhetischen Logik entsprechen. Daher hat Matrix Pixel bei der Produktgestaltung einige Fähigkeiten besonders stark verbessert:
Erstens die Fähigkeit zur mehrstufigen Aufgabenplanung, damit Agenten nicht nur Fragen beantworten können, sondern auch um Geschäftsziele herum Schritte aktiv zerlegen, Materialien organisieren und verschiedene Fähigkeitsmodule einplanen können;
Zweitens die Fähigkeit zum Lernen von Wissen und Gewohnheiten, indem das System über die Unternehmenswissensbank, Stilnormen und historische Betriebsprotokolle Zugang erhält, um so die Vorlieben des Teams und die Geschäftsregeln zu verstehen;
Drittens der Mechanismus zur Ergebnisüberprüfung und -reflexion, der nach der Generierung automatisch eine Strukturprüfung, eine Stilkonsistenzprüfung, eine logische Konfliktprüfung und eine Prüfung der Ausführbarkeit vornimmt, um die Anzahl von scheinbar fertigen, aber tatsächlich nicht lieferbaren Ergebnissen zu reduzieren.
In der Multimodal-Inhaltsgenerierung ist diese Methode besonders wichtig. Denn die Schwierigkeiten bei der Generierung von Bildern, Videos, Texten und Audiodateien liegen nie nur in der Generierung selbst, sondern in der Konsistenz zwischen verschiedenen Modalitäten. Fragen wie die Stabilität der Charaktere, die Einheitlichkeit der Kamerasprache, die Kontinuität der Emotionsausdruck, die Übereinstimmung des Bildstils und die gegenseitige Verstärkung von Text und Bild können nicht nur durch einzelne Prompts gelöst werden. Matrix Pixel hofft, dass durch den Mechanismus der Zusammenarbeit mehrerer Agenten die Funktionen verschiedener Rollen wie Drehbuchautor, Grafiker, Toningenieur und Nachbearbeiter zu aufrufbaren Agentenfähigkeiten abstrahiert werden können, so dass die Inhaltserstellung von der "einzelnen Generierung" zur "Zusammenarbeit mehrerer Rollen" übergeht. Dies ist auch eine der Schwerpunkte bei der Investition in die Szenarien von AI-Comic und AI-Werbung.
Abgesehen von der technologischen und algorithmischen Konstruktion zeigt Matrix Pixel auch in der Produktphilosophie ein starkes Sicherheitsbewusstsein. Das Unternehmen ist der Meinung, dass die echten Anforderungen von B2B-Kunden an AI nicht "allmächtig" sind, sondern "klare Grenzen, kontrollierbare Ergebnisse und nachvollziehbare Ausnahmen". Daher strebt Matrix Pixel in der Systemgestaltung nicht eine völlig freie Automatisierung an, sondern betont die "autorisierte Automatisierung": Der Teil, der von Agenten autonom erledigt werden kann, soll so weit wie möglich autonom erledigt werden, aber bei kritischen Knotenpunkten wie Markenstil, Platzierungsstrategie, geschäftlich sensiblen Informationen, kundenspezifischen Materialien und Ergebnisveröffentlichung müssen Überprüfungs-, Bestätigungs-, Nachverfolgungs- und Rückfallmechanismen beibehalten werden. Mit anderen Worten, Matrix Pixel versucht, Agenten wie hochqualifizierte Mitarbeiter zu gestalten, statt wie undurchsichtige Black-Boxen.
Dieses Sicherheitskonzept zeigt sich auch bei der Nutzung von Unternehmenswissen und der Art der Inhaltsgenerierung. Laut Unternehmensangaben unterstützt das Produkt bereits die automatische Korrektur und Herstellung von Canvas über Befehle in Bürosoftware wie Feishu und integriert mehrere geschäftsspezifische Wissensbanken. Für Unternehmen bedeutet dies, dass AI nicht mehr nur eine "öffentliche Modell-Schnittstelle" ist, sondern allmählich über den internen Kontext der Organisation verfügt: Es weiß, was verwendet werden kann und was nicht, welche Ausdrücke der Markenstimme entsprechen und welche Prozesse manuell überprüft werden müssen. Für Unternehmen, die eine große Menge an Wareninhalten, Werbematerialien, Drehbuchszenen, Charaktereinsätzen und Marketingtexten produzieren müssen, ist Sicherheit kein Hindernis für die Kreativität, sondern eher die Voraussetzung für ihre Freisetzung. Erst wenn das System ausreichend zuverlässig ist, wagen Unternehmen es, die Kernprozesse wirklich an AI zu übergeben.
Ästhetisch versucht Matrix Pixel auch, aus der derzeitigen "Durchschnittsgenerierung" in der Branche auszubrechen. Viele aktuelle AI-Inhaltstools können zwar die Produktionsgeschwindigkeit deutlich erhöhen, aber in der Ästhetik fallen sie leicht in Probleme wie Vorlagenorientierung, Plastizität, Homogenität und mangelnde Emotionsdichte: Die Bilder scheinen fein gearbeitet, aber fehlt der Stilurteilskraft; die Texte scheinen flüssig, aber haben keine echte Rhythmus und Tonfall; die Videos scheinen vollständig, aber bilden kaum ein vermittelbares Erinnerungsmerkmal. Matrix Pixel ist der Meinung, dass der Wert des nächsten Generations-Inhalts-Agenten nicht darin besteht, den Benutzern zu helfen, schneller "Musterlösungen" zu produzieren, sondern dem Team zu helfen, stabiler Werke mit Erkennbarkeit, Vollständigkeit und kommerziellem Umsetzungswert zu produzieren.
Deshalb ist Matrix Pixel nicht zufrieden, AI nur als Kostenreduktionstool zu verwenden, sondern betrachtet die "ästhetische Kontrollfähigkeit" als eine der Kernbarrieren. In der internen Definition des Unternehmens ist hochwertiger Inhalt nicht nur technisch hochauflösend, kohärent und generierbar, sondern auch in Bezug auf Erzählrhythmus, visuelle Einheitlichkeit, zurückhaltende Ausdrucksweise, Markenkonsistenz und Anpassung an die Plattformverbreitung. Dies bedeutet, dass die Ästhetik nicht mehr nur ein "subjektives Gefühl" ist, sondern in eine Reihe von Produktionsstandards zerlegt wird, die gelernt, überprüft und iterativ optimiert werden können. Das Unternehmen hofft, dass durch die langfristige Lernfähigkeit der Agenten das System allmählich die Stilgewohnheiten verschiedener Geschäftsteams versteht und so die "ästhetischen Erfahrungen" zu "ausführbaren Organisationsressourcen" aufarbeitet.
Kommerziell hat Matrix Pixel bereits eine gewisse Validierungsbasis gezeigt. Laut Unternehmensangaben hat das Produkt in der internen Testphase fast 200 Benutzer und 9 Unternehmen angelockt, obwohl es noch nicht vollständig an die Öffentlichkeit herausgebracht wurde. Das neue Produkt hat binnen zwei Tagen nach der Veröffentlichung einen kumulierten Aufladungseingang von 16.000 Yuan erzielt. Obwohl dies in absoluter Größe noch die Anfangsdaten eines frühen Teams sind, zeigt die Tatsache, dass man in der Situation, dass der Vertriebskanal noch nicht vollständig ausgebreitet ist, die ersten zahlenden Benutzer gewinnen kann, dass es eine reale Nachfrage nach dem Produkt gibt. Noch wichtiger ist, dass diese Benutzer nicht einfach aus Neugier bezahlen, sondern in der tatsächlichen Arbeit kontinuierliche Anforderungen an Effizienz, Qualität und Prozesskooperation haben.
Die hinter dem Unternehmen stehenden Industrieressourcen bieten auch die reale Grundlage für diese Validierung. Xingbang Interactive Entertainment, der Anteilseigner von Matrix Pixel, ist ein Unternehmen in der B-Runde und verfügt über eine relativ reife industrielle Grundlage und geschäftliche Ressourcen. Es kann Matrix Pixel bei der Kundenakquise, Szenarioüberprüfung, Inhaltserstellung und kommerzieller Zusammenarbeit unterstützen. Für frühe AI-Gründungsteams ist es am schwierigsten, nicht ein funktionsfähiges Produkt zu entwickeln, sondern das System unter kontinuierlichem Geschäftsdruck so stabil, nutzbar und lohnenswert zu machen, dass es sich lohnt, dafür zu bezahlen. Der Import von Industrieressourcen bedeutet, dass Matrix Pixel das Produkt in der realen Geschäftskette trainieren kann, anstatt sich auf die Laborfähigkeitsdemonstration zu beschränken.
Im Wettbewerb gibt es derzeit mehrere führende Spieler auf dem Markt, und die Branchenkonzentration steigt schnell. Die führenden Produkte verfügen normalerweise über eine starke Community-Ökosystem, die Fähigkeit zur Anbindung mehrerer Modelle oder ein reifes Workflow-System und beanspruchen die Hauptaufmerksamkeit des Marktes und die Benutzermentalität. Aber Matrix Pixel definiert sich nicht als "ein weiteres AI-Canvas-Tool" oder "ein weiterer Workflow-Platform", sondern versucht, von einer tieferen Ebene des Aufgabensystems aus voranzukommen: Es möchte die grundlegenden Probleme von Unternehmen bei der komplexen Inhaltserstellung lösen - wie kann AI das Geschäftsziel wirklich verstehen, wie kann das Ergebnis kontinuierlich der Teamästhetik nähern, wie kann die Automatisierung auf Sicherheit und Verantwortung aufbauen, wie kann die Organisationsexperienz im Laufe der Systemnutzung akkumuliert werden, anstatt bei jeder Generierung neu erfunden zu werden.
CEO Zhang Anyang sagte: "Unser Ziel ist nicht, ein Inhaltsgenerierungstool zu entwickeln, sondern ein digitales Mitarbeiterekosystem zu schaffen, das Geschäftsprozesse verstehen, komplexe Aufgaben ausführen und sich selbst iterativ verbessern kann. Ein wirklich wertvoller Agent ist nicht einer, der wie ein Mensch antwortet, sondern einer, der immer mehr wie ein reifes Team arbeitet." Aus seiner Sicht brauchen Unternehmen nicht eine aufwendigere AI-Oberfläche, sondern ein stabileres, kontrollierbareres und ästhetisch urteilsfähigeres Produktionssystem, das es dem Team ermöglicht, Zeit von mechanischen Aufgaben zu befreien und in höhere kreative Urteile, Geschäftstrategien und Ressourcenallokation zu investieren.
Im Zeitalter, in dem die generative AI von der "Modellverehrung" zur "Systemkonkurrenz" übergeht, repräsentiert das von Matrix Pixel betonte Technologieverständnis, Produktverständnis und Sicherheitsverständnis in gewissem Maße die Richtung einer neuen Art von Gründerunternehmen: Sie betrachten die Fähigkeiten des Large Language Models nicht als Ziel, sondern als Basis, um ein Agentensystem aufzubauen, das wirklich in den täglichen Arbeitsabläufen von Unternehmen eingesetzt werden kann. Wer in der Lage ist, Algorithmusfähigkeiten, technische Kontrolle, Sicherheitsgrenzen und ästhetische Qualität gleichzeitig zu realisieren, hat die Chance, die Demo-Phase zu überwinden und zur produktiven Infrastruktur zu werden, auf die Unternehmen wirklich angewiesen sind.