Die KI-Generierung wird immer günstiger, was wirklich teurer wird, ist die Überprüfung
Jede bedeutende technologische Veränderung wird zunächst leicht als Sieg der Maschinenfähigkeiten missverstanden. Die Dampfmaschine wurde als Sieg der Kraft, die Elektrizität als Sieg der Energie und der Computer als Sieg der Rechengeschwindigkeit verstanden. Im Zeitalter der Künstlichen Intelligenz heißt es populär, dass Maschinen jetzt schreiben, malen, programmieren und Fragen beantworten können und sogar anfangen zu denken. Diese Aussagen sind nicht falsch, aber sie sind nicht aus ökonomischer Sicht ausreichend.
Die Ökonomie fragt nie nur danach, was eine Technologie leisten kann. Sie fragt tatsächlich: Welche Kosten verändert die Technologie, und wie verändert sich die relative Preisstruktur im gesamten System daraus? Sobald sich die relativen Preise ändern, ändert sich auch die Arbeitsteilung, die Organisationsgrenzen, die Wertgewinnung und die Eigentumsrechtsstruktur.
Von diesem Blickwinkel aus ist die wichtigste Veränderung im Zeitalter der Künstlichen Intelligenz, dass die Grenzkosten der Generierung drastisch sinken, und nicht dass Maschinen die Fähigkeit erlernt haben, Inhalte zu generieren. Früher mussten für die Erstellung von Kandidatentexten, -plänen, -codes und -hypothesen ein Autor, ein Anwalt, ein Forschungs- oder Beratungsteam eingesetzt werden. Heute können Maschinen diese in großen Mengen und zu minimalen Kosten produzieren. Die Generierung ist nicht mehr knapp - zumindest die niedrigwertigen, vorläufigen und aufzählbaren Formen der Generierung verlieren schnell an Knappheit.
Die Knappheit verschiebt sich daher. Wenn es immer mehr Kandidatenpläne gibt, wird die Fähigkeit, zu beurteilen, ob ein Plan umsetzbar und lohnenswert ist, wirklich knapp: Steckt ein Vertrag Risiken, hat der Code Fehler, ist ein Medikament im menschlichen Körper sicher und wirksam, hat ein Forschungsdesign wirklich Exogenität, und wer trägt die Folgen einer strategischen Fehlbeurteilung. Die Engpässe im Marktssystem verschieben sich von mangelnder Generierung hin zu mangelnder Verifizierung.
Diese Beurteilung bedarf einer Einschränkung. Die hier besprochene Verifizierung ist nicht alle Verifizierung. Die Prüfung, ob ein Code kompilierbar ist, ob ein Kontenrahmen stimmt, ob eine Dosis im zulässigen Bereich ist oder ob ein Vertrag eine bestimmte Vorschrift verletzt, gehört zu den formalisierbaren Überprüfungen; auch diese werden durch KI preiswerter, und es ist sogar das Gebiet, in das strukturierte Intelligenz am ehesten eindringen kann. Die wirklich knappe Form der Verifizierung ist eine andere: Sie kann nicht vollständig formalisieren werden, und jemand muss die Folgen tragen. Ob eine Forschungsannahme wirklich den kausalen Mechanismus erfasst hat, ob ein Geschäftseinsatz lohnend ist, auf wen die Risiken eines Vertrags in nicht festgelegten Fällen fallen und ob ein Politikvorschlag die komplexen Reibungen bei der lokalen Umsetzung überstehen kann - diese Urteile können nicht vollständig in Vorschriften festgelegt werden. Sie sind knapp, weil der Zustandsraum der Welt unvollständig ist, Verträge unvollkommen sind und die Folgen nicht outsourcen lassen, und nicht weil es "schwierig zu berechnen" ist.
Hier ist ein Einwand zu beseitigen. Man könnte sagen, dass "nicht formalisierbar" nur vorübergehend ist. Vor zehn Jahren wurde angenommen, dass die Bildauswertung in der Radiologie, die Straßenlagebeurteilung beim autonomen Fahren und die Vertragsdurchsicht von Menschen durchgeführt werden mussten. Heute werden diese Aufgaben zunehmend von Algorithmen übernommen. Wenn die Grenzen der Formalisierung ständig zurückgehen, dann ist "nicht formalisierbar" nur ein Synonym für "noch nicht besiegt" und keine stabile Quelle der Knappheit.
Dieser Einwand ist richtig, aber er zeigt genau auf den eigentlichen Bezugspunkt. Die Grundlage der Knappheit ist nicht die technische Eigenschaft "schwierig zu formalisieren" - die technologischen Grenzen werden tatsächlich ständig erweitert - sondern die Eigentumsrechtseigenschaft "Folgen nicht übertragbar". Selbst wenn die Straßenlagebeurteilung vollständig von Algorithmen übernommen wird, muss bei einem Unfall die Schadensersatzpflicht auf einem Subjekt lasten, das diese tragen kann; auch die höchste Vorhersagegenauigkeit kann die Frage "wer ist verantwortlich?" nicht beseitigen. Was formalisierbar ist, ist die Vorhersage, was nicht übertragbar ist, sind die Folgen. Die hier besprochene Knappheit der Verifizierung bezieht sich genau auf letzteres; warum die Folgen nicht übertragbar sind, wird in Abschnitt drei mit dem Konzept der unvollständigen Verträge erklärt.
Diese Knappheit ist kein vorübergehendes Phänomen technologischer Rückständigkeit, sondern eine tiefliegende Struktur, die sich nach der Umstrukturierung der Preissysteme im Zeitalter der KI zeigt. KI kann die Kosten für die Suche, die Neuordnung und die Darstellung stark senken, aber nicht die Kosten für den Körper, die Institutionen, die Verantwortung und die Zeit selbst. Sie kann uns helfen, schnellere Kandidatenantworten zu generieren, aber nicht die Selektion der Antworten in der realen Welt ersetzen.
Große probabilistische Modelle sind keine niedrige Intelligenz
Um diese Frage zu diskutieren, müssen wir uns zunächst von zwei extremen Ansichten über die Technologiestrategien der KI befreien.
Eine ist die Theorie von der Allmacht großer Modelle: Es scheint, dass alle kognitiven, kommerziellen, wissenschaftlichen und organisatorischen Probleme schließlich von einem einzigen probabilistischen Vorhersagesystem gelöst werden können, wenn das Modell immer größer wird, die Trainingsdaten immer umfangreicher werden und das Kontextfenster immer länger wird. Die andere ist die Herabsetzung großer probabilistischer Modelle: Sie werden als "Vorhersage des nächsten Tokens" vereinfacht und als Ansammlung statistischer Korrelationen, als Sprache imitierende Maschinen angesehen, die weder ein echtes Weltmodell noch kausale Strukturen und zuverlässige Schlussfolgerungen haben. Nach dieser Ansicht kann echte Intelligenz nur von einem anderen Ansatz kommen - Weltmodellen, Symbolssystemen, strukturellen Schlussfolgerungen oder einer tieferen kausalen Maschine. Beide Ansichten sind einseitig.
Große probabilistische Modelle erzeugen natürlich Illusionen, machen in den Ausläufern Fehler und geben flüssige Sprache für Tatsachenurteile aus. Sie können auch nicht Experimente, klinische Studien, Prüfungen, Compliance, Kausalidentifikation und organisatorische Verantwortung ersetzen. Aber diese Mängel zeigen gerade, dass sie in einer offenen und unbestimmten Welt arbeiten, und nicht, dass es sich um eine niedrige Intelligenz handelt.
Die menschliche Gesellschaft ist keine abgeschlossene Prüfung. Es gibt keine vollständigen Antworten auf Unternehmensstrategien, die Präferenzen der Verbraucher sind nicht stabil, die politische Umgebung ist voller Spiele, die Verbreitung von Ideen hängt vom Kontext ab, und bei wissenschaftlichen Erkundungen weiß man oft nicht, wie die richtige Form der Frage lautet. Viele wichtige Urteile befassen sich nicht mit einem bereits definierten Problem, sondern mit einem noch unvollständig entwickelten Zustandsraum. In diesen Fällen ist die wichtigste Fähigkeit die, die Möglichkeiten unter unvollständigen Informationen zu organisieren, und nicht, eine geschlossene Aufgabe mit null Fehler zu lösen.
Genau hier liegt der Wert großer probabilistischer Modelle. Sie tun weit mehr als nur Tatsachen zu wiederholen: Sie komprimieren den Zustand des menschlichen Wissens in einem hochdimensionalen semantischen Raum, ordnen die in Texten verstreuten Beziehungen neu an und bilden schnell Kandidatenerklärungen. Sie holen die potenziellen Beziehungen, die in Literatur, langen Texten, Code, Fällen, institutionellen Texten und alltäglichen Sprache schlummern, hervor und stellen sie vor neue Probleme. Sie geben möglicherweise keine endgültigen Antworten, aber sie erweitern erheblich die Menge der Antworten, die wir in Betracht ziehen können.
Mit Hilfe der Sprache der Wissenschaftsphilosophie wird dies deutlicher. Wahrscheinlichkeit hat nicht nur die Frequenzinterpretation. In John Maynard Keynes' "A Treatise on Probability" aus dem Jahr 1921 wird Wahrscheinlichkeit als eine logische Beziehung zwischen Propositionen verstanden: Gegeben einem Satz von Beweisen, wie viel vernünftiges Vertrauen sollte einem bestimmten Schluss entgegengebracht werden. Sie beschreibt die logische Form, wie ein rationaler Akteur bei unvollständigen Beweisen schließt, und nicht die statistische Häufigkeit von Ereignissen. Keynes betont insbesondere, dass viele Wahrscheinlichkeiten überhaupt nicht numerisch ausgedrückt werden können, und sogar nicht miteinander verglichen werden können - in der realen Unsicherheit können wir nicht eine genaue Posteriorwahrscheinlichkeit berechnen, sondern müssen die relativen Positionen der verschiedenen Möglichkeiten so konsistent wie möglich innerhalb der Grenzen der vorhandenen Beweise anordnen. Diese logische Interpretationsrichtung, die von Harold Jeffreys und Richard T. Cox weitergeführt wurde, wurde von Edwin T. Jaynes als "Wahrscheinlichkeit als erweiterte Logik" formuliert: Wahrscheinlichkeit ist die einzig konsistente Erweiterung der Logik in einer Welt mit unvollständigen Informationen, und das Maximum-Entropie-Prinzip sagt uns, dass unter gegebenen Beschränkungen die rationale Prioriwahrscheinlichkeit diejenige sein sollte, die am wenigsten voreingenommen ist und die Möglichkeiten am weitesten ausbreitet.
Dieser logische, oder kognitive, Wahrscheinlichkeitsbegriff beschreibt genau die Arbeitsweise und die vergleichenden Vorteile großer probabilistischer Modelle. In einer offenen Welt mit unvollständigem Zustandsraum besteht die rationale Operation nicht darin, den Fehler gegen null zu treiben - das gehört zur geschlossenen Welt, zur Frequenzinterpretation und zur strukturellen Schätzung - sondern darin, die Möglichkeiten unter den Beschränkungen der bekannten Informationen so konsistent und so vollständig wie möglich zu organisieren. Große probabilistische Modelle präsentieren in der bedingten Verteilung eines riesigen Korpus "die semantischen Erweiterungen, die unter dem Zustand des menschlichen Wissens am meisten in Betracht gezogen werden sollten", was im Wesentlichen genau diese Operation der "Ausbreitung von Möglichkeiten unter Beschränkungen" ist. Ihre Kernqualität besteht daher darin, in offener Unsicherheit gut strukturierte Kandidatenmengen zu generieren, und nicht, auf null Fehler zu streben.
Es ist bemerkenswert, dass Keynes, der diesen Wahrscheinlichkeitsbegriff vertrat, auch der Keynes ist, der die "fundamentale Unsicherheit" in das Zentrum der Ökonomie stellte. Seine berühmte Aussage aus dem Jahr 1937 "Wir wissen es einfach nicht" bezieht sich genau auf diese Welt mit unvollständigem Zustandsraum, die nicht im Voraus erschöpft werden kann. Die logische Wahrscheinlichkeitstheorie und die keynesianische fundamentale Unsicherheit sind zwei Seiten derselben philosophischen Position; und die offene Welt, die diese Position beschreibt, ist genau der Bereich, in dem große probabilistische Modelle vergleichende Vorteile haben. Die Herabsetzung großer probabilistischer Modelle ist eigentlich ein Missverständnis der Form, die Intelligenz in einer offenen Welt haben sollte.
Der andere Technologieansatz ist ebenfalls wichtig. Die strukturierte Intelligenz, repräsentiert durch Weltmodelle, symbolische Schlussfolgerungen, regelbasierte Systeme und spezialisierte kleine Modelle, strebt eine andere Fähigkeit an: die Erreichung einer geringen Fehlerrate und einer hohen Kontrollierbarkeit in einer Umgebung mit klaren Grenzen, klaren Zielen und stabiler Rückmeldung. Ob ein Code funktioniert, ob ein Kontenrahmen stimmt, ob ein Prozess konform ist, ob Produktionsparameter abnormal sind, ob ein Medikamentenkandidat die vorgegebenen Beschränkungen erfüllt - diese Aufgaben erfordern Konvergenz, Prüfung, Durchführung und Risikokontrolle, und nicht offene Generierung. Wenn man es mit der Ökonomie vergleicht, ist die strukturierte Intelligenz eher wie die Schätzung von Strukturmodellen: Sie muss in einem gut definierten Aufgabenraum stärkere Beschränkungen, Mechanismen und Parameter finden, und nicht nur auf Korrelationen abzielen. Ihre Tugend besteht in geringer Varianz, Wiederholbarkeit und Prüfbarkeit.
Stellen Sie sich zwei Situationen vor. Der Kassierer hinter der Theke steht vor einer geschlossenen Welt, in der es nur richtig oder falsch gibt, und es keinen Platz für Unklarheiten gibt. Er braucht eine strukturierte Prüfung, die niemals fehlerhaft ist. Ein CEO hingegen steht vor einer Welt, die niemals schwarz oder weiß ist: Es gibt keine Standardantworten auf Unternehmensstrategien, die Präferenzen sind nicht stabil, die Politik ist voller Spiele, und viele Urteile beziehen sich auf noch unvollständig entwickelte Zustandsräume. Er braucht die Fähigkeit, die Möglichkeiten unter unvollständigen Informationen zu organisieren - genau die Form, die große probabilistische Modelle haben. Es ist zu beachten, dass der Statusunterschied zwischen CEO und Kassierer irreführend sein kann: Meistens sind es nicht zwei verschiedene Arten von Menschen, sondern zwei aufeinanderfolgende Schritte eines einzigen Prozesses, wie wir im nächsten Abschnitt sehen werden.
Große probabilistische Modelle und strukturierte Intelligenz stehen daher vor unterschiedlichen Unsicherheitsstrukturen. Es gibt keine Rangordnung zwischen ihnen, und es ist keine einfache Substitution möglich. Das erste eignet sich für offene Welten und generiert und erweitert Möglichkeiten in der Verwirrung; das zweite eignet sich für geschlossene Aufgaben und konvergiert und gewährleistet die Durchführung innerhalb der Grenzen. Die eigentliche Frage ist, wie sich beide in einem ökonomischen System eine neue Arbeitsteilung teilen, und nicht, welche Strategie am Ende gewinnt.
Vier Schritte und die Zeilenwirkung der KI
Viele Diskussionen über die Anwendung von KI teilen gerne Aufgaben in zwei Kategorien auf: Offene Aufgaben werden großen probabilistischen Modellen zugewiesen, geschlossene Aufgaben werden strukturierten Systemen zugewiesen. Diese Klassifizierung ist analytisch sauber, stimmt aber nicht mit dem realen Betrieb von Unternehmen überein. In der Realität ist es häufiger, dass es eine vertikale Staffelung innerhalb einer Aufgabe gibt, anstatt dass zwei Arten von Aufgaben horizontal getrennt werden.
Stellen Sie sich die gesamte Volkswirtschaft als eine Matrix vor. Die Spalten dieser Matrix repräsentieren N Arten von Aufgaben in der wirtschaftlichen Aktivität - das Entwerfen eines Vertrags, das Schreiben eines Codes, die Entwicklung eines neuen Medikaments, die Treffen einer strategischen Entscheidung, das Verfassen einer Dissertation. Die Zeilen repräsentieren vier Schritte, die fast jede Aufgabe durchlaufen muss: Generierung (die Vorschläge von Kandidatentexten, -plänen, -codes und -hypothesen), Verifizierung (die Beurteilung, ob diese Kandidaten zutreffen), Durchführung (die Umsetzung der genehmigten Pläne in die reale Welt), und Verantwortung übernehmen (die Übernahme der Restansprüche und die Verantwortung für die endgültigen Ergebnisse). Jede Aufgabe ist eine Spalte in dieser Matrix und durchläuft diese vier Schritte von oben nach unten.
Die KI senkt die Kosten einer ganzen Zeile in dieser Matrix - die Generierungszeile - in allen Spalten auf nahezu null. Ich nenne dies die Zeilenwirkung der KI: Die Wirkung trifft auf eine ganze Zeile, nicht auf einige Spalten. Der Zusammenbruch dieser Zeile wird auch die formalisierbare Hälfte der Verifizierungszeile beeinflussen (die Prüfung, ob ein Code kompilierbar ist oder ob ein Kontenrahmen stimmt, wird ebenfalls billiger), aber er erreicht nicht den nicht formalisierbaren Kern der Verifizierung, geschweige denn die Durchführung und die Verantwortung.
Die Standarddarstellung der Automatisierung in der Ökonomie - der Aufgabenrahmen von Daron Acemoglu und David Autor - ist spaltenweise aufgebaut. Sie sieht die Produktion als eine Sammlung von Aufgaben an und fragt, welche Aufgaben von Menschen an Maschinen übertragen werden. In der Sprache dieser Matrix bedeutet dies, dass jede Aufgabe auf eine einzelne Zeile reduziert wird, und die Automatisierung wird zu einer Spaltenwirkung: Die Wirkung wählt einige Spalten aus und überträgt die gesamte Spalte aus der Hand der Menschen. Die populäre Frage "Welche Jobs werden ersetzt?" ist eine einfache Version dieser Vorstellung.
Wenn man die Aufgaben vertikal in die vier Zeilen Generierung, Verifizierung, Durchführung und Verantwortung aufteilt, ändert sich die Richtung der Wirkung. Die KI senkt nicht mehr die Kosten einiger Spalten, sondern die Kosten einer ganzen Zeile in allen Spalten - dies ist eine Zeilenwirkung. Die Spaltenwirkung entfernt Aufgaben, die Zeilenwirkung ordnet die Aufgaben neu. Die erste fragt, welche Spalten verschwinden werden, die zweite fragt, wie die relativen Pre