StartseiteArtikel

Der CEO, der wegen eines Knochendbruchs im Bett liegt, hat seine Effizienz um 100 % gesteigert. Hier kommt das interne Steno-Manuskript.

笔记侠2026-04-21 11:59
Eine Person + KI ist eine ganze Mannschaft!

Fu Sheng hat von der Erkenntnis der überlegenen fachlichen und vertikalen Fähigkeiten der KI gegenüber dem Menschen, über das Verständnis der zugrunde liegenden Logik großer Modelle und die Beherrschung der Goldenen Regeln für die Nutzung der KI, bis hin zur Entdeckung des Kernentwurfs von Lobster und der Methoden für die Implementierung in allen Szenarien, schließlich die zukünftige Richtung der KI-nativen Organisation aufgezeigt.

Ob Sie ein Unternehmer oder Unternehmerin sind, der/die eine zehnfache Wachstumsrate erreichen möchte, oder ein Manager oder eine Managerin, der/die die Arbeitsleistung verbessern will, Sie können daraus direkt umsetzbare Methoden entnehmen, um schnell die KI zu nutzen und in der neuen Ära einen Vorsprung zu erlangen.

Im Folgenden finden Sie die Kernpunkte dieser Präsentation. Ich hoffe, sie werden Ihnen Anregungen geben.

Wir haben vor dem chinesischen Neujahr unsere Unternehmensstrategie festgelegt: Wir setzen uns vollständig auf EasyClaw als Kern.

Als 2025 Manus erschien, war ich fest davon überzeugt, dass Agenten in großem Maßstab verbreitet werden würden. Ich war überzeugt, dass die lokale Version von Manus, die tief mit dem Computer integriert ist, die Zukunft darstellt. Wir haben auch fast ein Jahr lang an der Entwicklung gearbeitet. Als ich dann das Produkt von Openclaw sah, dachte ich: Wir sind auf unterschiedlichen Wegen zum gleichen Ziel gekommen.

Heute möchte ich Ihnen meine Erfahrungen und Überlegungen aus dieser Zeit uneingeschränkt teilen.

I. Die gegenwärtige Situation würdigen: Die Fähigkeiten der KI haben bereits Ihre Vorstellungskraft übertroffen

Wenn Sie heute jeden Tag Ihr Sozial-Media-Feed durchstöbern, werden Sie immer wieder Äußerungen über die KI lesen. Ich möchte zunächst ein zentrales Faktum klarstellen: Die KI von heute hat in Bezug auf logische Denkfähigkeiten den Menschen bereits übertroffen.

1. Fachliche Fähigkeiten: Bei geschlossenen Fragen hat die KI bereits die menschlichen Rekorde gebrochen

Es gibt einen sehr anspruchsvollen Test namens GPQA (Anmerkung von Notesman: Ein hochschwieriges Fragestellungs-Kriterium zur Messung der Fähigkeit künstlicher Intelligenzmodelle, komplexe Probleme zu lösen. Man kann es als eine "Promotionsprüfung für KI" verstehen).

Man kann es als eine fachliche Prüfung aller Disziplinen verstehen, die nur aus Multiple-Choice-Fragen besteht, keine subjektiven Fragen.

Mit Hilfe des Suchmaschinen können menschliche Doktoranden in ihrem Fachgebiet eine Genauigkeit von etwa 65 - 70% erreichen. Ohne Suchmaschinen und in einem Nicht-Fachgebiet können selbst Doktoranden nur 30 Punkte erzielen.

Ich habe mir diese Prüfungsaufgaben angesehen. Viele Dinge darin verstehe ich zwar einzeln, aber wenn sie zusammengefasst werden, verstehe ich überhaupt nicht, was sie bedeuten. Die Schwierigkeit ist extrem hoch.

Aber im ersten Halbjahr 2025 erreichten die Versionen o1 bis o3 von GPT - 4 in der GPQA-Testung über 80 Punkte. Am wichtigsten ist, dass die KI nicht nur in einer Disziplin, sondern in allen Disziplinen diese Punktzahl erreichte.

Vor der KI gibt es kein Konzept wie "Fachliche Barrieren". Dies bedeutet, dass die KI bei einer geschlossenen Frage mit klaren Grenzen in Bezug auf Vollständigkeit, Genauigkeit und Kompaktheit die meisten Menschen übertrifft.

Es gibt jetzt noch ein Testbank, das als "letzter menschlicher Test" bezeichnet wird. Derzeit erreicht die KI in diesem Test nur 20 - 30 Punkte. Es ist eine Festung, die die KI noch nicht vollständig erobert hat.

Warum wird es "letzter menschlicher Test" genannt?

Weil diese Prüfungsaufgaben die schwierigsten sind, die der menschliche Intelligenzdesignen kann. Wenn die KI diese Aufgaben lösen kann, kann der Mensch keine schwierigeren Aufgaben mehr finden, um sie zu testen. Dies ist die gegenwärtige Situation der Entwicklung künstlicher Intelligenz.

2. Vertikale Bereiche: Die KI hat in den Kernproduktionsprozessen bereits Durchbrüche erzielt

Viele Diskussionen über AGI (Allgemeine Künstliche Intelligenz) drehen sich immer um die Angst, ob die KI den Menschen ersetzen wird. Über die Frage, wann AGI erreicht werden kann, gibt es verschiedene Meinungen: Einige sagen 3 Jahre, andere 5 Jahre, und wieder andere sagen, dass es niemals erreicht werden kann.

Aber das Kernproblem ist, dass die akademische Welt bis heute keine klare und einheitliche Definition von "Intelligenz" und "AGI" hat.

Der 90 - Jahre - alte chinesische Begründer der Künstlichen Intelligenz, Akademiker Zhang Bo, hat gesagt, dass die Künstliche Intelligenz in einer unentdeckten Zone erkundet wird, weil wir nicht einmal genau definieren können, was "Intelligenz" ist.

Wenn wir die KI als "Fähigkeit, in einem bestimmten Bereich den Menschen zu übertreffen und kontinuierlich zu verbessern" definieren, hat sie in vielen Bereichen dieses Ziel erreicht.

Der erste Bereich ist das autonome Fahren.

Ich habe in den USA die FSD (Full Self - Driving, vollständiges autonomes Fahren) von Tesla intensiv getestet. Auf der alten Autobahn in Los Angeles war fast keine menschliche Intervention erforderlich. In Shanghai habe ich es auch zwei Stunden lang gefahren. Seine visuellen Fähigkeiten für autonomes Fahren haben einen kritischen Durchbruch erreicht.

Wer es noch nicht gefahren hat, wird denken, dass ich es übertrage. Aber wer es tatsächlich erlebt hat, weiß, dass dieser Tag nicht mehr weit ist.

Der zweite Bereich ist das Programmieren.

Als GPT herauskam, hatte ich seit 20 Jahren nichts mehr mit Code zu tun. Ich wusste nicht einmal, was Python (eine Hochsprache) ist, und habe auch in der Fachrichtung Informationsmanagement an der Universität nicht gut abgeschnitten.

Aber durch das Gespräch mit der KI, die mich Schritt für Schritt dabei half, die Sprache auszuwählen, die Umgebung aufzusetzen und Code zu schreiben, habe ich schließlich ein Snake - Spiel geschrieben. Damals habe ich ein Video gepostet und gesagt: "Der Zeitraum für menschliche Programmierer wird immer kürzer."

Wie stark ist die Fähigkeit der KI, Code zu schreiben? Wenn Sie ihr eine Anforderung geben, ist der von ihr geschriebene Code in Bezug auf Strukturierung und Kompaktheit weit über dem von vielen normalen Programmierern.

Ich habe in der Firma öffentlich gesagt, dass der Beruf des Programmierers umstrukturiert werden wird, genau wie die Schmiedeberufe in der industriellen Revolution verschwunden sind. Dies ist ein zeitlicher Trend, der sich nicht nach dem Willen des Menschen richtet.

Der dritte Bereich ist die Büroarbeit und die Verwendung von Tools.

Seit vor dem chinesischen Neujahr haben wir Lobster eingesetzt. Das wichtigste Gefühl ist, dass es ein Werkzeug ist, das mit Ihnen wächst.

Der Gebrauch am ersten Tag und am zehnten Tag ist wie der Gebrauch zweier verschiedener Produkte. Es ist wie ein Mitarbeiter, der mit Ihnen wächst. Am wichtigsten ist, dass es fast alle Tools im Internet nutzen kann, und seine Fähigkeitsgrenzen sind unendlich erweitert.

3. Auswirkungen auf den Arbeitsmarkt: Die KI ist dabei, Arbeitsplätze und Organisationshierarchien umzugestalten

Es ist in Silicon Valley ein sehr deutliches Phänomen aufgetreten: Große Unternehmen erzielen höhere Gewinne, aber entlassen ständig Mitarbeiter. Der grundlegende Grund ist, dass die KI traditionelle Büroangestellte und Mittelmanagement ersetzt.

Zuerst die Büroangestellten. Sam Altman hat vor zwei Jahren gesagt: Die KI wird diejenigen ersetzen, die vor dem Computer sitzen.

Der Kern dieser Aussage ist, dass, wenn Ihre Arbeit darin besteht, Anforderungen in eine von Computern verständliche Ausgabe umzuwandeln - Ihr Chef gibt Ihnen eine Anforderung, und Sie schreiben einen Artikel, erstellen eine Präsentation, eine Website oder Code - Ihre Arbeit verliert an Bedeutung.

Die KI ist von Natur aus der beste Übersetzer. Ihre erste Fähigkeit war die Übersetzung von Text zu Text, und jetzt erstreckt sich dies auf die Übersetzung von Text zu Programm, Text zu Bild und Text zu Video.

Die Arbeit der meisten Büroangestellten besteht im Wesentlichen darin, "Anforderungen zu übersetzen", und dies kann die KI schneller, besser und kostengünstiger als Menschen tun.

Früher musste ich für die Erstellung einer Präsentation ein spezielles Team zusammenstellen, und es dauerte einen Monat, bis die endgültige Version fertig war. Jetzt kann ich mit der KI in etwas mehr als einem Tag eine Präsentation mit über 50 Seiten erstellen, ohne dass ich die Präsentationssoftware öffnen muss. Der Unterschied in der Effizienz ist immens.

Jetzt betrachten wir das Mittelmanagement. Es gibt einen sehr beliebten Artikel auf Weibo mit dem Titel "Die KI ist dabei, das Mittelmanagement zu eliminieren". Was ist die Kernfunktion des Mittelmanagements? Es ist die Weiterleitung von Informationen, die Aufteilung von Anweisungen und die Nachverfolgung des Fortschritts.

In der westlichen Unternehmensführung gibt es ein klassisches Konzept: Eine Person kann maximal 8 - 12 Personen leiten, weil die Energie und die Kommunikationsfähigkeit einer Person begrenzt sind. Deshalb muss ein Unternehmen eine hierarchische Organisationsstruktur aufbauen, und das Mittelmanagement wird zum Kernpunkt der Informationsweiterleitung.

Aber heute ist die Effizienz der KI bei der Organisation, Weiterleitung und Koordination von Informationen weit höher als die des Menschen. In der Zukunft kann eine Organisation so aufgebaut werden, dass ein Manager direkt eine Gruppe von Mitarbeitern leitet, ohne dass es so viele Zwischenschichten gibt.

Dies ist die neue Möglichkeit der Organisationsform in der KI - Ära.

II. Die zugrunde liegende Logik: Nur wenn Sie die großen Modelle verstehen, können Sie die KI richtig nutzen

Hier gibt es eine zugrunde liegende Logik: Nur wenn Sie die großen Modelle verstehen, können Sie die KI richtig nutzen.

Viele Menschen können die KI nicht gut nutzen und finden, dass die KI "dumm" ist und ihre Anforderungen nicht versteht. Der Kerngrund ist, dass sie die zugrunde liegende Prinzip der großen Modelle nicht verstehen.

Nur wenn Sie wissen, warum es etwas kann und warum es Fehler macht, können Sie es wirklich beherrschen.

1. Die Essenz großer Modelle: Die Wahrscheinlichkeitsvorhersage des nächsten Wortes

Denken Sie unbedingt daran: Die KI kann zwar wie ein Mensch erscheinen, aber sie ist kein Mensch. Ihre Kernlogik ist immer die Generierung und Vorhersage des nächsten Wortes.

Wenn wir sehen, dass die KI Zeichen für Zeichen ausgibt, ist dies nicht nur ein Anzeigeeffekt, sondern sie macht tatsächlich Zeichen für Zeichen Vorhersagen.

Wenn Sie ihr eine Frage stellen, aktivieren Sie einen entsprechenden Textvektor. Sie wird auf der Grundlage aller vorherigen Inhalte durch die Gewichtungsberechnung das nächste am wahrscheinlichsten auftretende Zeichen vorhersagen, dieses Zeichen zum vorherigen Inhalt hinzufügen und dann das nächste Zeichen vorhersagen, und so weiter.

Deshalb verbraucht die Verarbeitung von langen Texten und langen Gesprächen mehr GPU - Rechenleistung. Es ist nicht einfach eine Addition der Anzahl der Zeichen, sondern eine exponentielle Multiplikation.

Heutzutage werden bei der Erstellung von Kurzvideos meist nur 15 Sekunden gegeben, und es gilt die gleiche Logik: Die Generierung jeder Sekunde muss auf der Grundlage aller vorherigen Sekunden berechnet werden. Die Kosten für eine zusätzliche Sekunde können die Summe der Kosten der vorherigen 10 Sekunden betragen.

Das Wunderbare daran ist, dass die von ihr Zeichen für Zeichen vorhergesagten Inhalte schließlich zu einem Satz werden, den Sie verstehen und der genau Ihren Anforderungen entspricht. Dies ist das Auftauchen von Intelligenz.

Bis heute gibt es keine vollständige mathematische Lösung dafür, warum große Modelle Intelligenz auftauchen lassen. Wir wissen nur, dass, wenn man ihnen genügend Texte zuführt, sie Intelligenz entwickeln. Dies ist das Scaling Law (Skalierungsgesetz).

Es war erst mit der Entstehung von GPT - 3.0 und 3.5, dass die Branche dieses Gesetz wirklich bestätigte. Bis heute erkunden wir noch auf diesem Weg, und in hohem Maße basieren wir auf dem Glauben, dass es noch weitere Durchbrüche geben wird.

Genau auf der Grundlage dieses Kernprinzips zeigt das große Modell eine starke Mehrsprachenfähigkeit.

Früher musste man bei der KI - Übersetzung den KI entsprechende chinesische und englische Texte geben, damit sie Wort für Wort lernen konnte.

Aber bei den heutigen großen Modellen, wenn man ihnen genügend englische Sprachmaterialien gibt, können sie Englisch beherrschen. Wenn man ihnen dann noch einige chinesische Sprachmaterialien gibt, können sie natürlich chinesisch - englische Übersetzungen durchführen, ohne dass entsprechende Texte erforderlich sind. Wenn man ihnen dann japanische Sprachmaterialien gibt, können sie auch die japanische Übersetzung beherrschen.

Weil es durch die riesigen Sprachmaterialien die Positionsbeziehungen und semantischen Verbindungen zwischen Wörtern gelernt hat, hat es durch die Sprache eine Erkenntnis der Welt aufgebaut.

2. Das Goldene Dreieck für die effektive Nutzung der KI: Ein gutes Modell, ein guter Kontext und gute Fragen

Diese drei Faktoren bestimmen das Endergebnis Ihrer KI - Nutzung. Keiner von ihnen kann fehlen.

① Wählen Sie das richtige Modell

Modelle sind nicht allmächtig. Verschiedene Modelle haben verschiedene Stärken. Wir können sie in drei Ebenen einteilen:

Erste Ebene: Claude Opus

Entspricht dem Niveau eines Doktoranden von Stanford. Derzeit die Spitze.

Komplizierte logische Schlussfolgerungen, tiefe Analysen und Aufgabenplanung können an es übergeben werden, ohne dass es wiederholt werden muss. Meine persönliche Erfahrung ist, dass die Verwendung von Opus im Vergleich zu anderen Modellen wie ein Wechsel des Mitarbeiters ist. Es