Yan Junjie, Gründer von MiniMax: Künstliche Intelligenz entwickelt sich zu einer noch stärkeren Produktivkraft.
Vor einem Jahr diskutierte die Branche noch über die Parameter und Fähigkeiten von Basis-Großmodellen. In diesem Jahr ist auf der Welt-Künstliche-Intelligenz-Konferenz (WAIC) überall zu sehen, dass es sich um leistungsstarke Agentensysteme, KI-Anwendungslösungen handelt... Die KI-Hersteller verhalten sich nun realistischer und praxisorientierter. Alle Ausstellungsstände bemühen sich darum, ihre kommerziellen Fähigkeiten, die Fähigkeit, Produkte umzusetzen, und Fallbeispiele von Kundenpartnerschaften zu präsentieren.
Auf dem Ausstellungsstand von MiniMax werden hauptsächlich AI-Anwendungsprodukte wie MiniMax Agent, Conch AI, MiniMax Audio und Xingye gezeigt, einschließlich KI-Smart-Home-Geräten, Wearables, intelligenten Fahrzeugcockpits, intelligenten Lautsprechern, intelligenten Kopfhörern und Interaktionsgeräten sowie Anwendungen in Bereichen wie Kultur und Tourismus, E-Commerce, Büroarbeit, Bildung, Gaming, Medizin und Finanzwesen.
Fotografie:
Der Grund dafür liegt darin, dass die Branche der Großmodelle einer strukturellen Veränderung unterzogen wird. Die Inferenzkosten sind innerhalb eines Jahres um eine Größenordnung gesunken. Die Open-Source-Ökosysteme wachsen wie Pilze aus dem Boden und nähern sich der Leistung der Closed-Source-Modelle. Die Kommerzialisierung von Agentenanwendungen beschleunigt sich. Aufstrebende Hersteller, die sich auf vertikale Märkte spezialisiert haben, haben die Chance, sich von den Konzernen zu differenzieren.
Vor diesem Hintergrund hielt Yan Junjie, Gründer und CEO von MiniMax, am 26. Juli auf der Eröffnungsfeier einen Vortrag mit dem Titel "Die KI für jeden".
Die Kernpunkte sind:
1. Mit der ständigen Verbesserung der Modelle wird Künstliche Intelligenz zunehmend zur Produktivkraft der Gesellschaft.
2. Ein KI-Unternehmen ist nicht einfach eine Kopie eines Internetunternehmens. KI ist eine grundlegendere und wesentlichere Produktivkraft.
3. Im Bereich der KI werden mehrere Akteure dauerhaft existieren.
4. Die KI wird immer stärker, und diese Stärkung scheint fast grenzenlos zu sein.
5. Zahlreiche Innovationen können die KI-Forschung zu einer weniger kostspieligen Branche machen.
Im Folgenden finden Sie den Inhalt von Yan Junjies Vortrag (gekürzt):
Die KI entwickelt sich zu einer stärkeren Produktivkraft
In den letzten 15 Jahren, in denen ich mich mit KI-Forschung befasste, dachte ich immer, wenn ich täglich Code schrieb, Papers las und Experimente absolvierte: Was genau ist diese so viel beachtete Künstliche Intelligenz? Welche Beziehung hat die KI zur Gesellschaft?
Mit der ständigen Verbesserung der Modelle wird Künstliche Intelligenz zunehmend zur Produktivkraft der Gesellschaft. Beispielsweise mussten wir bei der KI-Forschung täglich eine große Menge an Daten analysieren. Anfangs mussten wir Software schreiben, um diese Daten zu analysieren. Später stellten wir fest, dass die KI Software generieren kann, um alle Daten zu analysieren. Als Forscher interessiere ich mich auch sehr für die neuesten Entwicklungen im Bereich der KI. Anfangs dachten wir darüber nach, ob wir eine APP entwickeln könnten, um die Fortschritte in verschiedenen Bereichen zu verfolgen. Später stellten wir fest, dass es effizienter ist, einen KI-Agenten zu entwickeln, der dies automatisch übernimmt.
Quelle: Yan Junjie, Interviewpartner
Während sich die KI zu einer stärkeren Produktivkraft entwickelt, kann sie auch immer kreativer werden. Beispielsweise war das Maskottchen der Weltausstellung in Shanghai vor 15 Jahren "Haibao". In den letzten 15 Jahren hat Shanghai in allen Bereichen Fortschritte gemacht. Wenn wir jetzt versuchen, mit der "Haibao"-IP eine Reihe von abgeleiteten Bildern zu generieren, die stärker die Shanghai-Identität widerspiegeln und den aktuellen Trends entsprechen, kann die KI dies besser tun.
Ein weiteres Beispiel ist das kürzlich sehr beliebte Labubu. Früher hat es zwei Monate gedauert und hunderte von tausend Yuan gekostet, um ein kreatives Labubu-Video zu produzieren. Mit immer stärkeren KI-Videomodellen kann ein ähnliches Video in etwa einem Tag generiert werden, und die Kosten betragen nur ein paar hundert Yuan.
Durch hochwertige KI-Modelle werden die meisten Inhalte und kreativen Ideen im Internet immer zugänglicher. Die niedrigen Zugangsschwellen ermöglichen es jedem, seine kreativen Ideen auszuleben.
Außer der Freisetzung von Produktivkraft und Kreativität haben wir festgestellt, dass die Verwendung von KI über die ursprüngliche Auslegung und Erwartungen hinausgeht, und es somit zu allen möglichen unerwarteten Anwendungsfällen kommt: Beispielsweise kann man mit wenig Zusammenarbeit ein altes Schriftzeichen analysieren, einen Flug simulieren oder ein astronomisches Teleskop entwerfen.
Angesichts all dieser Veränderungen entstand in mir die Überzeugung: Ein KI-Unternehmen ist nicht einfach eine Kopie eines Internetunternehmens. KI ist eine grundlegendere und wesentlichere Produktivkraft, die die individuellen und sozialen Fähigkeiten ständig stärkt.
Zwei Schlüsselpunkte sind hierbei: Erstens ist KI eine Fähigkeit, und zweitens ist KI nachhaltig. Menschen haben Schwierigkeiten, biologische Gesetze zu überwinden, wie das ständige Lernen von neuen Dingen und das ständige Werdens klüger. Die KI hingegen kann dies leisten. Wenn wir bessere KI-Modelle entwickeln, bemerken wir auch, dass die KI zusammen mit uns Menschen voranschreitet und zusammen mit uns bessere KI-Modellen entwickelt. In unserem Unternehmen müssen die Mitarbeiter täglich viel Code schreiben und viele forschende Experimente durchführen. Heute schreibt die KI etwa 70 % des Codes und analysiert 90 % der Daten.
Wie wird die KI nun immer spezialisierter? Vor einem Jahr mussten beim Trainieren von Modellen noch viele Grundmarkierungen manuell vorgenommen werden. Die Markierer waren eine unverzichtbare Berufsgruppe. In diesem Jahr kann die spezialisierte KI viele mechanische Markierungsaufgaben erledigen, und die Markierer können sich auf wertvollere, expertenmäßige Aufgaben konzentrieren, um das Modell zu verbessern. Das Markieren ist nicht mehr einfach das Gegeben einer Antwort an die KI, sondern das Lehren der KI, wie Menschen denken, damit die Fähigkeiten der KI universeller werden und sich immer mehr dem Niveau von Spitzenexperten annähern.
Die KI hat es inzwischen auch geschafft, in der Umgebung intensiv zu lernen. In den letzten sechs Monaten konnte die KI, die in eine definierte Umgebung mit eindeutigen Belohnungssignalen gesetzt wurde, allmählich die entsprechenden Probleme lösen.
Aufgrund dieser Beobachtungen sind wir uns sicher: Die KI wird immer stärker, und diese Stärkung scheint fast grenzenlos zu sein.
Die KI wird nicht von einer Organisation monopolisiert
Mit der zunehmenden Bedeutung der KI für die Gesellschaft stellt sich die Frage, ob sie in Zukunft monopolisiert wird. Wird sie letztendlich von einer Organisation oder von mehreren Organisations kontrolliert?
Wir glauben, dass es im Bereich der KI mehrere Akteure geben wird. Es gibt drei Gründe dafür:
Erstens hängen alle Modelle, die wir derzeit verwenden, von der Modellausrichtung (Model Alignment) ab. Offensichtlich haben verschiedene Modelle unterschiedliche Ausrichtungsziele. Beispielsweise ist das Ausrichtungsziel eines Modells ein zuverlässiger Programmierer, dann ist es besonders stark als Agent. Wenn das Ausrichtungsziel eines Modells die Interaktion mit Menschen ist, hat es eine hohe Emotionalintelligenz und kann flüssig kommunizieren. Einige Modelle können auch sehr fantasievoll sein... Unterschiedliche Ausrichtungsziele spiegeln die Werte verschiedener Unternehmen oder Organisationen wider, was schließlich zu unterschiedlichen Modellleistungen führt. Somit haben verschiedene Modelle ihre eigenen Eigenschaften und können langfristig bestehen.
Zweitens verwenden wir in den letzten sechs Monaten nicht mehr nur einzelne Modelle, sondern vielmehr ein Multi-Agentensystem, das mehrere Modelle umfasst. Verschiedene Modelle können auch verschiedene Tools nutzen. Dies führt dazu, dass die Intelligenz der KI immer höher wird und immer komplexere Probleme gelöst werden können. Allerdings wird der Vorteil eines einzelnen Modells im Multi-Agentensystem allmählich schwächer.
Drittens gibt es in den letzten sechs Monaten viele sehr intelligente Systeme, die nicht von großen Unternehmen stammen. Der Grund dafür ist, dass in den letzten Jahren Open-Source-Modelle wie Pilze aus dem Boden gewachsen sind und immer einflussreicher werden. In den letzten Jahren war das beste Modell zwar immer noch Closed-Source, aber es gibt immer mehr gute Open-Source-Modelle, die sich dem besten Closed-Source-Modell immer nähern.
Aufgrund dieser drei Gründe glauben wir, dass die KI von mehreren Unternehmen kontrolliert werden wird. Gleichzeitig glauben wir, dass die KI immer zugänglicher wird und die Nutzungsgebühren immer kontrollierbarer werden.
In den letzten anderthalb Jahren hatten wir mehr Rechenleistung zur Verfügung, aber die Größe der KI-Modelle hat sich nicht wesentlich verändert. Der Grund dafür ist, dass die Rechengeschwindigkeit für alle praktischen Modelle ein wichtiger Faktor ist. Wenn die Rechengeschwindigkeit eines Modells zu langsam ist, sinkt die Benutzerfreundlichkeit. Daher bemühen sich alle Unternehmen, das Gleichgewicht zwischen der Anzahl der Modellparameter und der Intelligenz zu finden.
Früher war das Wachstum der Modelle im Wesentlichen proportional zum Fortschritt der Chips. Die Leistung der Chips verdoppelte sich alle 18 Monate, und die Modelle wuchsen ebenfalls entsprechend. Jetzt haben zwar alle mehr Rechenleistung, aber die Anzahl der Modellparameter hat sich nicht wesentlich erhöht. Wo wird also die zusätzliche Rechenleistung eingesetzt? Ich denke, es gibt folgende Gründe:
Erstens: Beim Training hat das Wachstum in den letzten sechs Monaten deutlich abgenommen. Die Kosten für das Training eines einzelnen Modells haben sich nicht wesentlich erhöht. Die Rechenleistung wird hauptsächlich für Forschung und Exploration eingesetzt. Forschung und Exploration hängen nicht nur von der Rechenleistung ab, sondern auch von einem effizienten experimentellen Design, einem effizienten Forschungs- und Entwicklungsteam und einigen genialen Ideen.
Daraus folgt, dass die Unterschiede beim Training zwischen Unternehmen mit viel Rechenleistung und Unternehmen mit weniger Rechenleistung möglicherweise nicht sehr groß sind. Unternehmen mit weniger Rechenleistung können die Effizienz ihrer experimentellen Exploration verbessern, indem sie ihr experimentelles Design, ihre Denkfähigkeit und ihre Organisationsform kontinuierlich verbessern.
Zweitens: Im Bereich der Inferenz sind die Inferenzkosten des besten Modells in den letzten Jahren um eine Größenordnung gesunken. Wir glauben, dass in den nächsten ein bis zwei Jahren die Inferenzkosten des besten Modells möglicherweise nochmals um eine Größenordnung sinken können, indem wir auf eine große Anzahl von Rechennetzwerken und Optimierungsalgorithmen setzen. Insgesamt gesehen werden die Kosten für das Training eines einzelnen Modells sich nicht wesentlich erhöhen.
Zahlreiche Innovationen können die KI-Forschung zu einer weniger kostspieligen Branche machen, aber die Verwendung von Rechenleistung wird weiterhin steigen. Obwohl die Kosten pro Token sinken, wird die Anzahl der verwendeten Token stark ansteigen. Letztes Jahr hat ein einzelner ChatBot-Dialog nur einige tausend Token verbraucht. Heute kann ein einzelner Agent-Dialog mehrere Millionen Token verbrauchen. Da die KI immer komplexere und praktikablere Probleme löst, wird die Anzahl der Benutzer in Zukunft auch immer größer werden.
Wir glauben, dass jeder KI zugänglich machen können wird. Dies ist unsere Einschätzung der KI-Entwicklung. Wir glauben, dass die allgemeine KI (AGI) sicherlich realisiert werden kann und die Allgemeinheit dienen wird.
Wenn eines Tages die AGI realisiert wird, wird dies sicherlich von KI-Unternehmen und ihren Benutzern zusammen erreicht werden. Die AGI sollte mehreren KI-Unternehmen und einer breiten Benutzerbasis gehören, nicht nur einer einzelnen Organisation oder einem einzelnen Unternehmen.
Dieser Artikel stammt aus dem WeChat-Account "China Entrepreneur Magazine" (ID: iceo-com-cn). Autor: Kong Yuexin, Redakteur: Ma Jiying. 36Kr hat die Veröffentlichung mit Genehmigung erhalten.