StartseiteArtikel

Adam Smith hat ein „großes Modell“ geschaffen

复旦《管理视野》2026-06-12 10:08
Während die ganze Welt der KI nachjagt, hat ein schottischer Professor vor 267 Jahren möglicherweise früher als jeder Ingenieur im Silicon Valley herausgefunden, wie man „große Modelle“ baut.

Während die ganze Welt sich dem KI-Boom widmet, hat ein schottischer Professor, der vor 267 Jahren lebte, möglicherweise früher als irgendein Ingenieur in Silicon Valley verstanden, wie man ein "Großmodell" baut. Noch wichtiger ist, dass die von ihm beschriebene Maschine nicht nur in der KI funktioniert, sondern auch in jedem Unternehmen und bei jeder Managemententscheidung. Das Verständnis, wo diese Maschine versagt, könnte ein derzeit stark unterschätztes Managementthema sein.

Fast Reading

  • Adam Smith hat in seiner "Theorie der moralischen Gefühle" aus dem Jahr 1759 mit dem "Simulationsmotor" Sympathie ein "Großes Moralmodel" (LMM) aufgebaut, das erklärt, woher die menschliche Gesellschaft stammt. Seine Trainingsdaten sind soziale Erfahrungen, seine Architektur ist die Einfühlung in die Situation des anderen, und die Ausgabe ist das "Gewissen". Dies stimmt erstaunlich mit dem Ansatz heutiger Sprachmodelle (LLM) überein: Beide verzichten auf die Schreibung von Regeln und lassen das System aus Erfahrungen lernen.
  • Von Kindern, die lernen, mit Konflikten umzugehen, über neue Mitarbeiter, die lernen, Entscheidungen zu treffen, bis hin zu Unternehmen, die ins Ausland expandieren, zur Unabhängigkeit von Vorständen und zur Entartung von KPIs - Smiths Konzept des "Richters im Herzen", wie er sich entwickelt und wo er versagt, kann fast eins zu eins auf die Managementprobleme von Unternehmen übertragen werden. Die Fehlermuster des Einfühlungssystems (Selbsttäuschung, unbegründeter Selbstvertrauen, kollektive Begeisterung, Verehrung des "Sichtbaren") tauchen in der KI-Ausrichtung und im Unternehmensmanagement nur in anderer Form auf.
  • Ein Mitarbeiter, der dir immer nur zustimmt, ein Produkt, das immer nur den Wünschen der Nutzer entspricht, und ein Vorstand, der dem CEO immer nur folgt, sind alles Beispiele für fehlgeschlagene "perfekte Ausrichtung". Wir brauchen nicht eine einheitliche Stimme, sondern eine Harmonie: nah genug, um einander zu verstehen; weit genug, um einander zu korrigieren. Dies ist die tiefste Isomorphie zwischen dem Großen Moralmodel und dem Großen Sprachmodell.

1. Warum ist es verletzend, wenn niemand über einen Witz lacht?

Im Jahr 1759 veröffentlichte Adam Smith sein erstes Buch, "Theorie der moralischen Gefühle". In der ersten Abteilung erzählt er von einer alltäglichen Situation, die uns alle bekannt ist:

Ein Mann erzählt auf einem Abendessen einen Witz. Danach schaut er erwartungsvoll um sich, aber außer ihm lacht niemand.

Smith sagt, dass dies einer der peinlichsten Momente in der menschlichen Gesellschaft ist. Aber er sieht darin ein tiefes Problem: Warum ist dieser Mann peinlich? Er wurde nicht beschimpft und hat keinen materiellen Schaden erlitten. Was hat es ihm angetan, dass die anderen nicht lachen?

Smiths Antwort ist: Der Mensch hat ein natürliches Bedürfnis, mit anderen Menschen emotional zu resonieren. Er verwendet das Wort Sympathie. Wir brauchen, dass andere "wie wir fühlen", genauso wie wir Luft und Wasser brauchen. Dieses Bedürfnis ist eine grundlegende Eigenschaft des Menschen.

Aber wie wird diese Resonanz erreicht? Wir können niemals direkt in den Kopf eines anderen Menschen schauen. Smith war sich dessen bewusst: Wir haben keine direkte Erfahrung mit den Gefühlen anderer Menschen. Die einzige Möglichkeit ist, uns vorzustellen, wie wir uns in derselben Situation fühlen würden.

Was tun? Wir müssen es simulieren. Wir versetzen uns in die Situation des anderen und "laufen" es in unserem Kopf durch. Je öfter wir es tun, desto genauer wird unsere Simulation. Smith sagt: Zuerst gibt es tausende konkrete Erfahrungen, erst danach gibt es abstrakte moralische Regeln.

Dieser Text wurde vor 267 Jahren geschrieben, aber er beschreibt genau die Arbeitsweise einer der derzeit am meisten beachteten Technologien. Ein Großes Sprachmodell hat ebenfalls keine Möglichkeit, direkt in den Kopf des Nutzers zu schauen. Es kann nur aus den Informationen, die ihm zur Verfügung gestellt werden, die Situation des Nutzers ableiten und dann auf Grundlage seiner "Erfahrungen" in einer riesigen Menge menschlicher Sprache eine Antwort generieren.

Der eine Weg führt von Schottland im Jahr 1759, der andere von Silicon Valley im 21. Jahrhundert. Diese beiden Wege haben sich nicht unter Smiths Führung getroffen, sondern unabhängig voneinander zum gleichen Ziel gelangt: Wenn man nicht in den Kopf eines anderen Menschen schauen kann, muss man es mit Hilfe von Erfahrungen erraten.

Das von Smith aufgebaute System ist im Wesentlichen ein "Großes Moralmodel" (Large Moral Model, LMM), das erklärt, woher die menschliche Gesellschaft stammt. Das heutige "Große Sprachmodell" (Large Language Model, LLM), das von Ingenieuren entwickelt wurde, ähnelt ihm erstaunlich.

Ist der nur eine Buchstabe Unterschied zwischen LMM und LLM nur ein Zufall?

2. Wie kann man einem Computer beibringen, eine Katze zu erkennen?

Lassen Sie uns Smith vorerst beiseite lassen und zunächst über die Entstehung von Großsprachmodellen sprechen.

In der Geschichte der KI gab es zwei grundsätzlich verschiedene Ansätze: Symbolismus und Konnektionismus. Im Wesentlichen handelt es sich um zwei unterschiedliche Wege, mit komplexen Problemen umzugehen. Der eine ist ein top - down Ansatz, der andere ein bottom - up Ansatz, der auf Erfahrungsakkumulation beruht.

Nehmen wir als Beispiel an, Sie möchten einem Computer beibringen, zu erkennen, ob auf einem Bild eine Katze ist.

Der symbolistische Ansatz besteht darin, zunächst die Schlüsselmerkmale einer Katze aufzulisten, wie z. B. spitze Ohren, große Augen, Bart und ein pelziges Körper. Dann schreibt man eine Reihe von Regeln und gibt diese an den Computer weiter, damit er sie ausführt. Der Vorteil dieses Ansatzes ist offensichtlich. Die Regeln sind transparent, die Logik ist nachvollziehbar, und wenn etwas schief geht, weiß man, welche Regel fehlerhaft ist. Wissenschaftler bevorzugen diesen Ansatz, da er mit dem Ideal der Wissenschaft übereinstimmt: klar, genau und verifizierbar. Von den 1950er Jahren bis Anfang dieses Jahrhunderts war der Symbolismus in der KI - Welt über einen langen Zeitraum der dominierende Ansatz.

Aber dieser Weg hat ein fataler Nachteil: Die Welt ist zu komplex, um alle Regeln aufzuschreiben.

Katzen haben nicht immer das gleiche Aussehen. Ein und dieselbe Katze kann auf Bildern unter verschiedenen Lichtverhältnissen ganz unterschiedliche Pixelmerkmale haben. Man müsste für jede Situation eine Regel schreiben, was nahezu unmöglich ist. Und was genau sind "spitze Ohren"? Ein Hund mit aufgerichteten Ohren hat auch etwas spitze Ohren. Es ist schwierig, dem Computer eine genaue Definition zu geben, um "spitz" von "nicht so spitz" zu unterscheiden.

Der Konnektionismus geht einen völlig anderen Weg. Er schreibt keine Regeln. Stattdessen baut er ein Netzwerk aus einer großen Anzahl von "Neuronen" auf und zeigt diesem Netzwerk Tausende von markierten Bildern: Dies sind Katzen, das sind keine. Bei jedem Fehler wird die interne Verbindung leicht angepasst. Nach dem Betrachten von Millionen von Bildern findet das Netzwerk selbst die Regeln heraus. Was diese Regeln genau sind, kann niemand genau sagen. Deshalb werden Deep - Learning - Modelle auch "Schwarze Boxen" genannt. Sie funktionieren zwar, aber man versteht nicht, was sie intern tun.

Im Jahr 2012 hat das AlexNet aus dem Konnektionismus - Lager die Fehlerrate bei der Bilderkennung von 26 % auf 15 % gesenkt. Die schwarze Box hat das Regelbuch geschlagen. In den folgenden zehn Jahren haben Neuronale Netzwerke, Deep Learning und Großsprachmodelle, die Nachkommen des Konnektionismus, das gesamte KI - Feld erobert.

3. Wo liegt der Witz an Zhao Benshan?

Kommen wir wieder zum Witz zurück. Wie kann man einem Computer beibringen, zu entscheiden, ob ein Witz lustig ist?

Nehmen Sie an, Sie sind ein "symbolistischer Humoringenieur". Sie haben die folgenden Kriterien aufgelistet: Überraschende Wendung, Pluspunkt; Logischer Abstand, Pluspunkt; Berührung von Tabus, aber keine Überschreitung, Pluspunkt; Aufbau und Abbau in weniger als drei Sätzen, Pluspunkt. Dann geben Sie die Dialoge aus Zhao Benshans Sketchs ein. Das System gibt aus: Nicht lustig.

Das System prüft die Kriterien und stellt fest, dass Zhao Benshans Sketchs eine unübersichtliche Struktur haben, dass es lange dauert, bis der eigentliche Witz kommt, dass der gleiche Witz immer wiederholt wird und dass es stark von Dialekt, Mimik und Gestik abhängt. Alle diese Dinge sind Minuspunkte im Regelbuch. Aber Zhao Benshan war über ein Jahrzehnt lang der Garant für hohe Zuschauerzahlen bei den chinesischen Neujahrsfeierlichkeiten. Woher kommt sein "Lachfaktor"?

Er kommt aus der langfristig aufgebauten emotionalen Resonanz zwischen ihm und den Zuschauern. Sein Rhythmus ist nicht der, der in Lehrbüchern beschrieben wird, sondern der Rhythmus des Gesprächs in der nordchinesischen Landwirtschaft. Hundert Millionen Menschen, die aus dem Land in die Städte gezogen sind, kennen diesen Rhythmus von Herzen. Dieser Rhythmus selbst ist Sicherheit. Die Worte, die er verwendet, sind keine künstlich konstruierten Witze, sondern die Worte, die echte Menschen sagen. Die Charaktere, die er spielt, die schlauen, etwas unverschämten, ehrgeizigen, aber armen Kleinleute, sind die Menschen, die diesen Hundert Millionen Menschen um uns herum sind, oder sogar sie selbst.

Später trat Zhao Benshan aus der Bühne zurück, und das Talk - Show - Format wurde zur neuen Hauptform des Comedy. Es geht nicht um den Unterschied zwischen hohem und niedrigem Geschmack. Wenn sich das Publikum ändert, ändert sich auch die Schwelle für die kollektive Resonanz. Sie brauchen einen anderen Rhythmus, um andere Ängste zu bewältigen. Mit demselben menschlichen "Hardware" und anderen Erfahrungsdaten ändert sich auch, was "lustig" ist.

In der chinesischen Komikszene hat man schon früher die Arbeit eines "symbolistischen Humoringenieurs" gemacht. Ma Ji hat 22 Techniken zur Aufbau von Witzen zusammengefasst, wie "Grundlage legen, dreimal aufbauen und dann den Witz auslösen". Aber Guo Degang hat selbst gesagt, dass seine besten Witze nicht nach Regeln erzählt werden, sondern aus der chemischen Reaktion zwischen ihm, den Zuschauern und Yu Qian kommen. Die Regeln sind das Gerüst, aber das, was Menschen zum Lachen bringt, kann nicht von den Regeln gefasst werden.

Smith hat dies erkannt. Ob ein Witz lustig ist, hängt nicht vom Witz selbst ab, sondern davon, ob die Emotionen des Witzers und des Zuhörers in diesem Moment synchronisiert sind. Dies basiert auf den langjährigen sozialen Erfahrungen. Man "weiß", was lustig ist, genauso wie ein neuronales Netzwerk "weiß", dass es sich um eine Katze handelt.

Theorie der moralischen Gefühle

The Theory of Moral Sentiments

Autor: [GB] Adam Smith

Übersetzer: Jiang Ziqiang / Qin Beiyu / Zhu Zhongdi / Shen Kaizhang

Verlag: Commercial Press

4. Wie funktioniert die menschliche Gesellschaft?

Dass niemand über einen Witz lacht, scheint ein unbedeutendes Problem zu sein. Ob Zhao Benshan lustig ist, scheint ein Thema für das Plaudern nach dem Essen zu sein. Aber Smith hat in diesen unbedeutenden Dingen ein großes Problem gesehen: Wie funktioniert die menschliche Gesellschaft überhaupt?

Milliarden Menschen haben alle ihre eigenen Wünsche, Ängste und Interessen. Niemand kann direkt wissen, was im Kopf eines anderen Menschen vorgeht. Trotzdem haben die Menschen nicht in den von Hobbes beschriebenen "Krieg aller gegen alle" verfallen, sondern haben Familien, Dörfer, Städte, Staaten und Zivilisationen gegründet. Wie ist das möglich?

Ökonomen würden sagen: Markt und Preis. Aber der Markt setzt Vertrauen voraus. Man muss vertrauen können, dass das Brot, das man kauft, nicht vergiftet ist. Politiker würden sagen: Gesetz und Staat. Aber das Gesetz setzt voraus, dass die meisten Menschen die Regeln in den meisten Fällen freiwillig befolgen. Also muss es etwas Grundlegendes geben, das vor Markt und Gesetz funktioniert. Smith sagt, dass dies die Einfühlung ist, die Fähigkeit, die jeder von uns ständig und unbewusst nutzt.

Wenn man sich in die Situation des anderen versetzt und simuliert, kann man ungefähr beurteilen, ob sein Verhalten vernünftig oder absurd ist. Der andere macht dasselbe mit uns. Im Laufe der Zeit sedimentieren diese unzähligen kleinen Interaktionen zu einem gemeinsamen Verhaltenskodex. Er ist nicht von jemandem entworfen, sondern entsteht spontan aus dem Alltag.

Smith verwendet ein architektonisches Vergleich: Wohltätigkeit ist wie die Verzierung eines Gebäudes, eine zusätzliche Schönheit. Aber Gerechtigkeit ist die Hauptsäule des Gebäudes. Ohne sie würde "das riesige und imposante Gebäude der menschlichen Gesellschaft in einem Augenblick zusammenbrechen". Das Fundament, das diese Hauptsäule stützt, ist das automatische Simulationssystem in jedem Menschen.

Dieses System, das aus kleinen Interaktionen Regeln entstehen lässt, stützt nicht nur die grandiose menschliche Zivilisation, sondern steckt auch in den Kapillaren des täglichen Betriebs moderner Unternehmen.

Warum ist ein Team "kampffähig"? Auf den ersten Blick liegt es an einer klaren Aufteilung der Arbeit und einem reibungslosen Ablauf. Aber was wirklich die Zusammenarbeit antreibt, ist oft etwas Feinere unterhalb der formalen Regeln: Man weiß ungefähr, warum der andere in Eile ist, und der andere weiß, warum man zögert. Man hat eine ungefähre Vorstellung, ob die Beschwerde eines Kunden nur eine Emotionsausbruch oder eine Frühwarnung ist. Diese Dinge können teilweise durch Regeln ersetzt werden, aber es ist schwierig, sie vollständig in Regeln zu fassen. Regeln können bestimmen, wen man berichtet, aber nicht, wann man noch einmal nachfragen sollte.

Also ist ein Unternehmen auch wie ein Modell. Es verarbeitet nicht nur Berichte und Protokolle, sondern auch die Erfahrungen, die es bei der Behandlung von Kunden, Fehlern, Missverständnissen und Kooperationen gesammelt hat. Mit der Zeit entwickelt es eine kollektive Intuition. Die Schwierigkeit im Management besteht nicht darin, die Regeln klar zu schreiben, sondern darin, dass diese kollektive Urteilsfähigkeit langsam entsteht.

Aber Smith hat nicht hier aufgehört. Er hat eine tiefere Frage gestellt: Wie entwickelt sich dieses Simulationssystem bei einem Menschen?

Er verwendet ein Vergleich: Wenn ein Mensch auf einer einsamen Insel aufgew