22 Erkenntnisse über KI aus dem Jahr 2025
1
Nach der offiziellen Veröffentlichung von GPT-4 kam es weltweit zu einer Sensation. Für mich war das der Moment, in dem ich erstmals realisierte, dass große Modelle bereits die Fähigkeit besitzen, das rationale Denken des Menschen zu übertreffen. Sofort veröffentlichte ich mehrere Testberichte, eröffnete neue Kurse und entwickelte neue Produkte.
Zwei Jahre später forderte Altman jedoch die US-Regierung auf, DeepSeek einzuschränken. Seit dem Machtkampf hat das OpenAI-Team fast keine beeindruckenden Ergebnisse präsentiert. Der Open-Source-Community geht es heute so, dass Open-Source-Großmodelle in mehreren Dimensionen bereits die proprietären Großmodelle übertroffen haben.
Das Tao des Geistes ist subtil, das Herz des Menschen ist gefährlich. Je erfolgreicher man wird, desto mehr sollte man auf die verborgenen Risiken im „Menschheitssystem“ des Management-Teams achten. Die Entwicklung des OpenAI-Teams kann man wirklich mit „Altman bringt Erfolg, Altman bringt Niederlage“ beschreiben.
2
Manchmal bewundere ich wirklich die Ingenieure.
Für Kognitionswissenschaftler ist ein Modell eher eine abstrakte Architektur. Sowohl Simon als auch Hinton haben Modelle vorgeschlagen, die meist einfache Programme sind, die manchmal nicht einmal als echte Programme gelten können. Manchmal ist das Modell, das ein Kognitionswissenschaftler konstruiert, nur ein abstraktes Diagramm.
Die Ingenieure hingegen setzen diese Modelle um und entwickeln eine einzigartige Ökosystem und Kultur.
Im Jahr 2024 sagte ich in meinem Vortrag „Am Anfang von 3000 Jahren Wohlstand“, dass die Zukunft den Modellern gehört.
Das Ergebnis der Arbeit von Wissenschaftlern sind Experimente und Publikationen, während das Ergebnis der Arbeit von Modellern Modelle und Code sind.
In Zukunft werden Organisationen, die nicht in der Lage sind, Modelle und Code zu produzieren, allmählich zurückbleiben und schließlich aussterben.
Genauso werden Personen, die Modelle und Code nicht verstehen, wie die Menschen im 20. Jahrhundert, die keine wissenschaftlichen Experimente und Publikationen verstehen konnten, allmählich zu Randfiguren in der Forschung werden.
3
Bei dieser großen AI-Transformation ist die auffälligste Veränderung, dass Modelle zu Produktionsfaktoren geworden sind.
Im Jahreswechsel 2023 sagte ich in meinem Vortrag „Der Weg und das Mittel für die persönliche Entwicklung“ einen Goldenen Satz: Dialog ist Produktion. Dies unterscheidet die neue Ära von der Informationsära: In der Informationsära wurde betont, dass „das Medium ist die Botschaft“, während in der neuen Ära „der Dialog ist die Produktion“.
Heute möchte ich sagen, dass das Modell der Produktionsfaktor ist. Seine Formatierung, Architektur, Verkapselung, Modifikation, Erzeugung und Anwendung bilden zusammen eine zentrale Fragestellung für die Zukunft.
Das Besondere an der Tatsache, dass „das Modell der Produktionsfaktor ist“, besteht darin, dass unsere Gedanken, Wünsche und Handlungen sowie unsere bisherigen Schöpfungen in ein Modell festgelegt werden können und von mehr Menschen abgerufen und genutzt werden können.
Der von Hinton in einem Interview angeführte Beispiel war sehr gut: Wir verstehen die inneren Vorurteile einer Person nur schwer, aber wir können die Vorurteile eines Modells relativ leicht quantifizieren und daraufhin anpassen.
Das ist das Besondere an dieser großen AI-Transformation.
4
Mit dem Beginn der AI-Ära sind drei Berufe noch schwer zu ersetzen: Lehrer, Berater sowie Ärzte, Physiotherapeuten und Masseure.
Diese drei Berufe sind interessant, weil sie auf den inhärenten Grenzen des Menschen beruhen.
Lehrer: Da das Verhalten von Menschen reflektierend ist, müssen Lehrer eine Atmosphäre schaffen, die die innere Motivation der Lernenden weckt.
Berater: Die innere Welt des Menschen ist äußerst komplex und enthält viele verborgene Inhalte, die schwer auszudrücken oder sogar zu benennen sind. Diese Inhalte werden oft nicht vollständig mit Worten ausgedrückt, sondern eher durch Körpersprache und Gesamteindrücke vermittelt.
Ärzte, Physiotherapeuten und Masseure: Dies beruht auf der Behandlung des menschlichen Körpers. Der menschliche Körper ist ein komplexes System, und die Fehlertoleranz bei der Behandlung ist sehr gering. Daher sind erfahrene Fachleute besonders wichtig.
5
Vor der AI-Ära waren wir vielleicht so:
Wenn wir keine Entwürfe machen konnten, ernannten wir einen Designer; wenn wir nicht programmieren konnten, ernannten wir drei Ingenieure: Frontend, Backend und Algorithmus. Um alle zu verwalten, ernannten wir einen Produktmanager. Um die Produkte zu verkaufen, ernannten wir drei Betriebsmitarbeiter, die sich jeweils um Inhalt, Community und Vertriebskanäle kümmerten, und wir brauchten noch einen Betriebsmanager, um sie zu verwalten.
Heute hat sich die Tendenz jedoch geändert und sieht so aus:
Wenn wir etwas nicht können, probieren wir es mit dem ersten großen AI-Modell; wenn wir etwas anderes nicht können, probieren wir es mit dem zweiten großen AI-Modell. Um die Effizienz zu erhöhen, können wir auch ein drittes großes AI-Modell bitten, ein Proxy-Programm zu schreiben, um ihre Ausführung zu koordinieren. Wenn keine der verfügbaren großen Modelle unseren spezifischen Anforderungen entspricht, können wir selbst ein neues AI-Modell trainieren, wobei auch die Trainingsdaten teilweise von AI generiert werden können.
In den nächsten drei Jahren wird es einen sprunghaften Anstieg an AI-basierten Software und wissenschaftlichen Ergebnissen geben.
Dies wird die Gesellschaft stark verändern und auch einige Chancen bieten.
6
Das Wissen kann in Wissen vor 2023 und Wissen nach 2023 unterteilt werden.
Das Wissen vor 2023 ist unversehrtes Wissen, das noch nicht von der AI beeinträchtigt wurde.
Das Wissen nach 2023 ist fast alles von der AI beeinträchtigt. Heute habe ich eine Nachricht gelesen, die mich zum Lachen und Weinen brachte: Eine Fachzeitschrift für AI hat aus Gründen der Popularität einen Artikel über einen aus Zhejiang University stammenden Investor geschrieben und dabei Zhang Lei fälschlicherweise als Zhejiang University-Absolvent angegeben... Wir alle wissen, dass er von der Renmin University of China abgeschlossen hat. Warum hat der Journalist diesen kindischen Fehler gemacht? Weil die Liste offensichtlich von einer AI generiert wurde.
Bei jedem, mit dem ich zusammenarbeite, prüfe ich, ob er zuverlässig ist, anhand eines Kriteriums: Wurde die erste Version des Manuskripts direkt von einer AI generiert?
Wenn dem so ist, werde ich kaum noch mit ihm in Bezug auf Texte zusammenarbeiten.
Das Aufgeben des Schreibens der ersten Version eines Manuskripts bedeutet tatsächlich das Aufgeben der Fähigkeit, unabhängig zu denken.
Um auf meine frühere Metapher zurückzukommen: Das Schreiben ist schwierig, weil man zuerst „schwanger“ werden muss, dann das Kind zur Welt bringen, es erziehen und schließlich erst fotografieren und mit einem Schönheitsfilter bearbeiten kann. Viele Menschen glauben, dass die AI nicht nur die „Schwangerschaft“ bewältigen kann, sondern auch das Kind bis zum Erwachsenenalter begleiten kann. Diese Vorstellung ist absurd.
Dies bedeutet das Aufgeben der Möglichkeit, seine eigenen Fähigkeiten kontinuierlich zu verbessern.
7
Für Menschen außerhalb des AI-Bereichs ist es am schwierigsten, ihre Denkweise umzustellen, von Gedankenexperimenten und experimenteller Wissenschaft zu symbolischem Denken und Computersimulation.
8
Nach zwei Jahren der AI-Entwicklung waren meine vorherigen Prognosen im Großen und Ganzen richtig: Es wurden enorme Fortschritte in den Bereichen AI Coding und AI Science erzielt, und es wurden mehrere neue Billionen-Märkte geschaffen.
Ehrlich gesagt, obwohl ich einige neue Trends und Technologien vorhergesehen habe, waren einige Ergebnisse doch weit über meinen Erwartungen und haben mich überrascht und beeindruckt.
AI Coding ist eher eine Meta-Methode und Meta-Fertigkeit in der digitalen Welt. Ähnlich wie in der realen Welt müssen wir Sprechen, Hören, Lesen und Schreiben beherrschen, um uns zu kommunizieren.
Genauso müssen wir in der digitalen Welt die Fähigkeit zur CRUD-Operation (Erstellen, Lesen, Aktualisieren, Löschen) von Entitäten beherrschen. In der Ära des Internets und des Mobilinternets war es für einen Programmierer eine Herausforderung, pro Tag maximal 30 Entitäten zu verarbeiten, was die maximale Leistung bei der Manipulation von Objekten in der digitalen Welt darstellte. Und diese Fähigkeit war auf Programmierer beschränkt.
Die Revolution, die AI Coding mit sich bringt, besteht darin, dass jeder gebildete Mensch, ja sogar jeder lese- und schreibfähige Mensch in Zukunft mit AI-Tools Hunderte oder Tausende von Entitäten verarbeiten und die Beziehungen zwischen diesen Entitäten darstellen kann, um schließlich komplexe Software zu erstellen.
Im Bereich AI Science glaube ich, dass einerseits der Fortschritt in AI Coding genutzt wird, und andererseits besteht die Stärke darin, die Lücken im rationalen Denken des Menschen und die fehlende Vorstellungskraft auszugleichen.
9
Vor der AI-Ära betrug die Halbwertszeit eines bestimmten Technologiewissens normalerweise zwischen 3 und 10 Jahren. Heute liegt sie im Allgemeinen zwischen 18 Monaten und 3 Jahren.
Die Anforderungen an die Lernfähigkeit und die Kognitionsfähigkeit einer Person sind höher geworden.
Dementsprechend wird weniger Zeit für technische Kleinigkeiten aufgewendet, und die Fähigkeit zum Auswendiglernen wird weniger gefordert.
10
Heute Abend, als ich im Park joggte, hatte ich den starken Eindruck, dass in der AI-Ära Psychologie möglicherweise noch wichtiger wird. Aber die Psychologie, von der ich spreche, ist möglicherweise nicht die alte, veraltete Psychologie. Sondern eher so etwas wie:
1. Kognition: Wie können Menschen ihre Anweisungen an die AI besser einschränken, um die kognitive Komplexität zu reduzieren?
2. Emotion: Wie können Menschen der AI helfen, den Kontext oder die Situation des Menschen besser zu verstehen?
3. Motivation: Wie können Menschen die Gewichtung der AI feinabstimmen, um Liebe oder Effizienz zu erhöhen?
4. Handlung: Wie können Menschen besser mit den Aktionen der AI zusammenarbeiten?
5. Persönlichkeit: Wie können Menschen die Persönlichkeit verschiedener großer AI-Modelle besser verstehen?
6. Gesellschaft: Wie können Menschen die neue soziale Gemeinschaft verstehen, die aus AI-Agenten und großen AI-Modellen besteht?
Die traditionelle Psychologie hat den Menschen als Zentrum, und andere Lebewesen dienen nur als Ergänzung. Weil andere Lebewesen die Intention des Menschen kaum verstehen können, sagt die traditionelle Philosophie, dass der Mensch das einsame Wesen im Universum ist.
Aber jetzt ist es ganz anders. Durch Ingenieurtechnik, wie SFT, und die Vorverarbeitung von großen Sprachkorpora hat die große AI-Modelle bereits einen Teil der menschlichen Intention integriert und kann zumindest reibungslos kommunizieren. In gewissem Sinne ist sie bereits ein Agent.
So wird die neue Psychologie allmählich vom Menschen als Zentrum hin zu einer Psychologie übergehen, die sowohl den Menschen als auch die großen AI-Modelle und die Zusammenarbeit zwischen Menschen und KI umfasst.
Vor der Ära der großen AI-Modelle war Psychologie eigentlich ein ziemlich vager Bereich. Die Verbesserung der menschlichen Kognition und Emotion brachte nur begrenzte Vorteile für Einzelpersonen und die Gesellschaft. Selbst die von Psychologen propagierten erfolgreichen Methoden waren oft nicht so erfolgreich und waren eher Übertreibungen.
Aber in der Ära der großen AI-Modelle ist es ganz anders. Kognition ist Realität.
Wenn man die Kognition und Emotion einer großen AI-Modelle verbessert, führt dies sofort zu einem Sprung in der menschlichen Produktivität.
AI-Unternehmen wie Anthropic und Notion, die sich schnell entwickeln, beschäftigen tatsächlich viele Psychologie-Doktoranden.
11
Anthropic hat tatsächlich drei Konzepte definiert, die stark mit der „menschlichen Wissensstruktur“ verbunden sind: Projekt, MCP und Fähigkeiten.
Dieser Satz ist äußerst wichtig. Ein Projekt bietet den Kontext und definiert die Grenzen von Eingabe und Ausgabe; ein Agent bietet die Handlungssubjekt und definiert die Handlungsgrenzen; Fähigkeiten bieten die Prüfkriterien oder Beispiele und definieren die Fähigkeitsgrenzen; MCP bietet die Kommunikationsweise zwischen dem Modell und der Außenwelt und definiert den Durchsatz des Modells.
12
Die Zeit ändert sich tatsächlich stark. Die Effizienz von Wissensarbeit kann um das 10-, 30- oder 100-fache gesteigert werden.
Viele Menschen merken das jedoch nicht. Im Bereich AI Coding besteht ein breiter Konsens: Die Effizienz steigt um mindestens das 10-fache.
Warum geschieht die Effizienzsteigerung in der AI zuerst und gerade im Bereich
1. Auf GitHub sind viele Codes, Daten und implizites Wissen angesammelt.
2. Die gängigen Entwicklungsframeworks in verschiedenen Bereichen können relativ leicht zusammengefasst werden.
3. Die Ergebnisse der Programmierung können leicht überprüft werden.
4. Große Sprachmodelle sind gut darin, komplexe Texte zu verarbeiten, und Code ist ein typischer komplexer Text.
5. Mit fast 100 Milliarden US-Dollar an Investitionen, einer großen Menge an manueller Annotation und synthetischen Daten wird der Bereich
6. Programmierer sind diejenigen, die am schnellsten neue Dinge annehmen und am bereitesten in Produktivitätstools investieren.
13
Das Wort „Agents“ bezeichnet eine zeitgemäße und abstrakte Entität (Objekt), und man sollte es nicht als eine statische und konkrete Instanz verstehen.
Beispielsweise verstand die Branche im Jahr 2023 „Agents“ als das Schreiben verschiedener Prompts. Ein typisches Beispiel wäre: „Stellen Sie sich vor, Sie sind ein Schriftsteller.“
Im Jahr 2024 hat die Branche etwas