DiPu Technology Zhao Jiehui: Wie kann AI im Zeitalter der generativen KI wirklich in die Kernproduktionsprozesse eines Unternehmens integriert werden? | WISE2024 König der Wirtschaft
Die Umwelt verändert sich ständig, die Zeiten ändern sich stets, die "Könige des Geschäfts" folgen dem Zeitgeist, beharren auf Kreativität und streben nach neuen Impulsen. Angesichts des großen Wandels der chinesischen Wirtschaft lädt die WISE2024 Business King Conference dazu ein, den wirklich widerstandsfähigen "König des Geschäfts" zu entdecken und das "Richtige" in der chinesischen Geschäftswelt zu erkunden.
Die Umwelt verändert sich ständig, die Zeiten ändern sich stets, die "Könige des Geschäfts" folgen dem Zeitgeist, beharren auf Kreativität und streben nach neuen Impulsen. Angesichts des großen Wandels der chinesischen Wirtschaft lädt die WISE2024 Business King Conference dazu ein, den wirklich widerstandsfähigen "König des Geschäfts" zu entdecken und das "Richtige" in der chinesischen Geschäftswelt zu erkunden.
Am 28.-29. November findet die zweitägige 36Kr WISE2024 Business King Conference feierlich in Peking statt. Als Star-Event der chinesischen Geschäftswelt ist die WISE-Konferenz in diesem Jahr bereits die zwölfte Ausgabe und zeugt von der Belastbarkeit und dem Potenzial der chinesischen Wirtschaft in sich wandelnden Zeiten.
2024 wird ein Jahr sein, das eher unscharf und von Veränderungen geprägt als stabil erscheint. Im Vergleich zu den letzten zehn Jahren verlangsamt sich das Tempo und die Entwicklung wird rationaler. 2024 ist auch ein Jahr, in dem neue wirtschaftliche Antriebe gesucht werden und neue Branchenveränderungen an jeden Akteur höhere Anforderungen stellen. Die WISE-Konferenz steht in diesem Jahr unter dem Motto Hard But Right Thing (Richtiges tun), und 2024 wird die Frage, was das Richtige ist, zu einem Thema, über das wir mehr sprechen möchten.
Im Jahr 2024 haben chinesische Unternehmen bereits mehrere Phasen durchlaufen, angefangen von der Digitalisierung über Cloud-Technologie bis hin zur aktuellen Revolution der künstlichen Intelligenz. Aber all diese Veränderungen basieren auf der grundlegenden Digitalisierung – die digitale Infrastruktur von Unternehmen entspricht dem "Fundament" dieser Umwälzungen.
Gegründet im Jahr 2018, ist Deepexi ein Dienstleister für datengesteuerte intelligente Infrastruktur, der sich seit Jahren intensiv mit der digitalen Transformation von Unternehmen beschäftigt und sich der Umsetzung von generativer KI und Plattformentwicklung in der Industrie widmet.
Auf der diesjährigen WISE-Konferenz bot der Vorsitzende und CEO Zhao Jiehui eine thematische Präsentation zum Thema "Implementierung von generativer KI und Grundplatten-Entwicklung".
"Durch die Entstehung und Anwendung von generativer KI wächst der Markt für Datenplattformen", erklärte Zhao Jiehui. "Alle Kunden und Anbieter in dieser Branche müssen ihre Produktportfolios neu gestalten."
Angesichts der Welle der generativen KI ist die Frage, wie große Modelle umgesetzt werden können, ein viel diskutiertes Thema für 2024. Zhao Jiehui ist der Meinung, dass Unternehmen neben den allgemeinen und grundlegenden Fähigkeiten großer Modelle diese mit kleineren vertikalen Modellen kombinieren müssen, um einen vollständigen Technologie-Stack zu schaffen, der es ermöglicht, KI in den Kern der Produktionsprozesse zu integrieren.
Quelle: 36Kr
Im Folgenden finden Sie die vollständige Rede von Deepexi-CEO Zhao Jiehui, bearbeitet und redigiert von 36Kr:
Zhao Jiehui: Hallo zusammen!
Im letzten Jahr habe ich auf dieser Bühne einige erste Überlegungen zur Fusion von Unternehmensdienstleistungen und KI geteilt und nach einem Jahr der Entwicklung spüren wir deutlich, dass generative KI den Markt für Unternehmensdienstleistungen grundlegend umgestaltet. Heute werde ich einige unserer Überlegungen aus dieser Perspektive weitergeben.
Ihr wisst wahrscheinlich, dass der Markt für Unternehmensdienstleistungen bis zum letzten Jahr hauptsächlich auf Datenservices gesetzt hat. Nach einer einjährigen Entwicklung zeigt sich, dass Unternehmen dabei sind, den Aufbau ihrer digitalen Plattformen durch tiefgreifende KI-Integration neu zu gestalten.
Hier einige Kernaussagen, die ich teilen möchte.
Erstens, die Entstehung und Anwendung von generativer KI lässt den Markt für Datenplattformen wachsen, da KI den gesamten Datenwert für Unternehmen besser zur Geltung bringen kann;
Zweitens müssen alle Kunden und Anbieter in der Branche ihre Produktportfolios neu gestalten und sicherstellen, dass die Aufrüstung von Datenplattformen und die Implementierung beim Kunden nur darauf abzielen, die KI-Integration zu fördern. Denn Investitionen in Datenplattformen und IT-Infrastrukturen, die nicht mit KI integriert sind, haben nur begrenzten praktischen Nutzen.
Heute Morgen habe ich mit einem Kunden gesprochen, und ich erwähnte: In Zukunft werden alle Datenplattformen, einschließlich des Aufbaus von Data Lakes, auf ein Ziel hinarbeiten: die Implementierung von KI in der Industrie.
In diesem Jahr veröffentlichte IDC den Bericht „Marktanteile für Big Data-Lösungen in der chinesischen Fertigungsindustrie 2023“, und Dienstleister mit tiefer KI-Integration sind führend platziert. Deepexi hat sich ebenfalls deutlich auf die vorderen Ränge verbessert. Seit der Unternehmensgründung im Jahr 2018 hat sich das gesamte Produktportfolio von Deepexi verändert, um die Entwicklung und Implementierung von KI zu unterstützen.
Früher war bekannt, dass wir im Markt für Unternehmensdienstleistungen vier Produkte entwickelt haben: Daten-Middleware, Datenintegrationswerkzeuge, Lakehouse-Engine und so weiter, die schließlich zur Echtzeit-intelligenten Lakehouse-Plattform FastData umstrukturiert wurden.
Im zweiten Halbjahr 2022 begann sich die Kombination von Modellen mit Daten zu manifestieren, und unsere Produkte wurden mit inländischen Rechenleistungsplattformen verschmolzen, um zu einem integrierten Lösungspaket zu werden, das es Unternehmen ermöglicht, KI zu implementieren und eine sehr grundlegende Plattform bereitzustellen.
Quelle: 36Kr
Derzeit wird die Plattform zu der oben gezeigten Architektur aufgerüstet. Um KI in einem Unternehmen in jedem beliebigen Szenario zu implementieren, muss zunächst eine relativ kosteneffiziente Rechenplattform vorhanden sein. Wenn ein Unternehmen jedoch nur einfache Dokumentenabstraktionen durchführen möchte, benötigt es möglicherweise keine außerordentlich komplexe integrierte Datenplattform. Aber sobald KI in die eigentlichen Geschäftsentscheidungs- und Ableitungsprozesse eingebunden werden soll, ist eine sehr vollständige Unternehmensintegrationsdatenplattform sowie eine Modellserviceplattform notwendig.
Die Modellserviceplattform umfasst nicht nur große Sprachmodelle. Denn sobald alle Unternehmensinformationen und Daten bereitgestellt werden, um große Modelle im Unternehmen umzusetzen, müssen zwei große Herausforderungen bewältigt werden.
Erste Herausforderung, ein großes Sprachmodell allein kann diese Anforderungen nicht erfüllen. Ein großes Sprachmodell ermöglicht zwar die Abstraktion von Dokumenten, aber um Geschäftsentscheidungen und -ableitungen im Unternehmen zu unterstützen, muss es mit Daten kombiniert werden, was FastData durch umfangreiche Upgrades erreicht hat.
Zweite Herausforderung, nur ein großes Sprachmodell alleine wird es schwer haben, wenn Unternehmen komplexe Pläne, Dokumente und andere komplizierte Daten bereitstellen, die dadurch schwerlich als Korpus verwendet und mit tiefgreifenden Fachmodellen kombiniert werden können. In diesem Prozess ist es notwendig, Dienste mit vorhandenen vertikalen Modellen oder kleineren Modellen bereitzustellen, um einen vollständigen Modell-Stack für Geschäftsabschlüsse bereitzustellen.
Die Implementierung von Unternehmens-KI von Korpus-Engineering bis hin zu mehreren kleinen und großen Modellen in einem koordinierenden vollständigen technischen Stack ist entscheidend, und genau das versucht unsere FastAGI-Servicemodellplattform zu lösen.
Derzeit konzentrieren wir uns vor allem auf einige wichtige Bereiche, der erste ist die AI-gestützte schnelle Reaktion in der Lieferkette für den Großkonsumsektor, einschließlich führender Einzelhandelsunternehmen wie Belle Fashion, auf der Basis unserer Plattform wurde bereits eine tiefgehende Umsetzung vollzogen.
Zweitens im Produktionsbereich bei der Unterstützung von Entwurfszeichnungen und der Anpassung von Fertigungsparametern haben wir auch viele Implementierungen abgeschlossen.
Außerdem arbeiten wir eng mit medizinischen Einrichtungen in Hongkong zusammen, um die Implementierung von KI im Gesundheitswesen zu erforschen.
Inzwischen haben wir in Kernbereichen großer Unternehmen, von der Lieferkette bis hin zum Produktionsprozess, bereits intensive Kooperationen mit zahlreichen führenden Unternehmen in der Industrie gestartet.
Insgesamt gesagt, das in großem Maßstab einsetzbare Unternehmensmodell erfordert unbedingt eine integrierte Datenplattform. Darüber hinaus müssen Dienstleistungen der Modellplattform auch mehr als nur große Sprachmodelle, sondern eine Kooperation mit vertikalen Modellen ermögliche. Beispielsweise in der Fertigung sollten Modellierungsansätze sowie bestehende Modelle zusammengefügt werden, um einen vollständigen technischen Stack zu bilden.
Soweit es die einsetzbaren großen Modelle in Unternehmen betrifft, habe ich immer die Auffassung vertreten: In einem großen Unternehmensszenario kann ein einzelnes großes Modell tatsächlich Szenariowert schaffen, und aktuell scheinen Modelle mit weniger als 72B Parametern für die meisten Anwendungsfälle ausreichen.
Für die Implementierung und Szenariowertschöpfung großer Modelle für B2B-Kunden ist eine gewisse Mengenordnungsgröße von Modellparametern erforderlich, was jedoch eine Gefahr birgt, das Kosten und letztlicher Nutzen nicht im Verhältnis stehen. Also, ob in der Tiefenanwendung in der Lieferkette oder im Produktionsprozess, in der Praxis erwarten wir in B2B-Szenarien für Unternehmen, dass dieser Maßstab erreicht werden kann, was vor allem Nachhaltigkeit zwischen Wirkung und Kosten sicherstellt.
Wir haben derzeit zwei Basismodelle in Umfang 72B und 32B, im Vergleich zu den Modellen für B2C-Services zeichnen sich diese vor allem durch wesentliche Merkmale aus:
Erstens, es erweitert speziell das Korpus von häufig genutzten Unternehmensdokumenten;
Zweitens, es gibt drei entscheidende Anforderungen bei der Unternehmensanwendung und alle müssen mit 100% Genauigkeit erfüllt werden. Erstens, die Fähigkeit, Zahlen abzufragen und automatisch präzise SQL-Statements zu generieren. Zweitens die Fähigkeit, Funktionen der vorhandenen Systeme präzise aufzurufen. Und schließlich eine sehr präzise Verarbeitung komplexer Pläne und Dokumente. Deepexi hat in diesen Bereichen tiefgehende Arbeiten geleistet.
Ein weiteres wichtiges Thema ist die Sicherheit, denn in Unternehmen sind Informationensicherheit unverzichtbar. In Zusammenarbeit mit der Southern University of Science and Technology haben wir ein Modell-Sicherheitsprüfungs-Tool namens Deepexi-guard veröffentlicht, um Unternehmenssicherheit zu gewährleisten.
Nun zurück zur erwähnten Modellserviceplattform: Betrachten wir die Beziehung zwischen dieser Modellserviceplattform und den Basismodellen. Man kann sehen, dass echte Anwendungen in Unternehmensszenarien das große Sprachmodell als Basisschicht haben, darüber hinaus müssen vertikale Spezialmodelle und das große Sprachmodell tief integriert und koordiniert werden, um im Unternehmen einen echten Anwendungseffekt zu erzielen.
Wenn beispielsweise Fertigungskonfigurationsoptimierungen durchgeführt werden sollen, muss das bestehende mechanische Modell eingebunden, Entwurfspläne hinzugefügt werden, und vertikale Spezialmodelle müssen gut mit der Basisschicht der Modelle koordiniert werden, um den Basistechnikstandard zu bilden.
Bei der Implementierung des Ganzen beim Kunden liefert der Kunde oft eine Vielzahl von Richtliniendokumenten und Backend-Systemdaten. An diesem Punkt ist es wichtig, eine umfangreiche Fähigkeit zur Korpusanpassung sicherzustellen.
Ein führender Ingenieurdienstleister hat uns nach einer Kooperation mehrere GB an Plänen und Richtliniendokumenten übermittelt. Auf Basis des hierane liegenden Materials und datengestützter Tools haben wir durch verschiedene intelligente Vorverarbeitungs- und Verarbeitungsmethoden eine integrierte, unternehmensweite Wissensdatenbank aufgebaut, die durch spezialisierte Aufgaben Feineinstellungen ermöglicht wird und die Genauigkeit relevanter Fragen sicherstellt. Daher ist das Modell-Engineering ebenso wichtig.
Wenn ein Modell für einsatzbereit erklärt wird, wie kann der Einsatz bewertet werden? Wichtig wird die Modellbewertung, und darüber hinaus kommt das Entwicklerplattform, wie bekannt ist.
Außerdem werden wir vor ein großes Problem gestellt: Mit der lokalen Rechenkapazität, wie können Unternehmen schnell umsetzen?
Derzeit bieten wir die Fast5000E an, einen Server für Modelltraining- und Vertriebsdienste, basierend auf in- und ausländischen Mainstream-Chips.
In großen Unternehmen gibt es tatsächlich keine große Nachfrage nach Grundtraining für Modelle, sondern schwerpunktmäßig auf SFT (Supervised Fine-Tuning) ausgerichtet.
Viel Rechenleistung wird für die Ableitungsseite benötigt, und auf Distributionsseite können die Fähigkeiten chinesischer Chips die Anforderungen des Unternehmensunterstützen. Zusätzlich haben wir eine Beschleunigerkarte entwickelt, die auf NVidia-Chips eingesetzt werden kann, um ein Modell mit bestimmten Parameter voranzubringen und abzuleiten. Wir werden auch einige Endseiten-Inferenzprodukte einführen, um Anfragen von Produktionslinien anzugehen.
Hinsichtlich der Implementierung von Modellen, sollten Unternehmen in Rechenzentrumsleistung investieren, Cloud nutzen oder ihre eigene Maschine erstellen?
Ich glaube, beim Aufbau in den ersten ein bis zwei Jahren, wenn ein ausreichend großes Budget vorhanden ist und Unternehmen tatsächlich Geld in Szenario-Integration und -modelllegung investieren können, handelt es sich in der Regel um große Unternehmen. Diese könnten in der Anfangsphase dazu neigen, eigene Maschinen zu erwerben, um die Szenarien möglichst schnell aufzubauen und fortwährend zu verbessern, was die Effizienz steigert.
Sobald die KI-Implementierung in der Branche immer ausgereifter wird und viele Unternehmen damit beginnen, könnte es ratsamer werden, in Rechenleistungen zu investieren.
Dieses ist ein entscheidender Prozess, der abhängig von Kunden- und Stadium anders ist. Das bedeutet also, für Szenarien in einem Kernbereich kann der Einsatz von Training-Push-Einheitsmechanismen den Implementierungsprozess von großen Modellen im Unternehmensszenario beschleunigen.
Grundsätzlich können unsere Softwaresysteme nach Implementierung direkt eingesetzt werden. Die meisten Kunden können nach zwei Wochen erste Ergebnisse sehen.
Wenn erwähnt wird, dass Unternehmen nur Protokolle und Dokumente verwalten müssen, geben grundlegende Modelle kaum Probleme. Möchte ein Unternehmen jedoch viel Echtzeit-Geschäftsprognose- und Entscheidungsunterstützung einsetzen, ist die Verbesserung der Datenplattform unverzichtbar.
Im Kern stehen die bestehenden Systemdaten, die die Geschäftsstatusaufzeichnungen in Echtzeit wiedergeben, aber logisches Denken, Wissen, Richtlinien einschließlich Geschäftskontext, wie Dokumente geführt werden sollen, werden in den Geschäftslogiken gestützt.
Die derzeit erforderliche Datenplattform auf dem Markt muss in der Lage sein, strukturierte und unstrukturierte Daten einheitlich zu verwalten. Nur so kann die Plattform den Echtzeit-Unternehmensstatus sowie geschäftskontextuelle logische Strukturen erneut darstellen und eine umfassende Fusion von Unternehmensdaten erzielen. Das unterstützt dann Modelle bei ihrem Training und ihrer tiefen Ableitung.
Kurze Vorstellung unseres Unternehmens: Seit unserer Gründung im Jahr 2018 wurde Deepexi mit vielen Ehrungen ausgezeichnet und wurde in zahlreiche renommierte AI-Ranglisten aufgenommen. In der Praxis erfolgreicher Unternehmensimplementierungen von KI sind viele bewährte Beispiele vorhanden und wir laden gerne zu Erfahrungsaustausch und Besuchen ein.
Abschließend kurz zusammengefasst, zwei Schlüsselthemen, auf die bei der Implementierung von KI und großen Modellen in Unternehmen und Branchen zu achten ist:
Erstens, die einheitliche Verwaltung der strukturierten und unstrukturierten Datenplattform im Unternehmen als Upgrades als Datenbasis für KI-Integration.
Zweitens, die Notwendigkeit einer umfassenden Modellserviceplattform, die vertikale Fachmodelle in einem vollständigen Modellierungsprozess unter Verwendung eines großen Sprachmodells integriert, um Dienstleistungen wie Ingenieurwissenschaften, Modellsicherheit, Modellbewertung usw. zu erbringen.
Vielen Dank!