Was tun, wenn KI Menschen rückwärts finetuned? Wie beherrschen wir die neue Intelligenz?

Was sollen wir tun, wenn KI beginnt, Menschen rückwärts zu finetunen? Wie können wir die neue Intelligenz beherrschen?

„Alle fragen mich, ob ich es dringend versuchen soll, mich mit Hummern zu befassen. Eigentlich denke ich, dass die meisten Menschen es falsch angehen.“

„Produktmanager, die sich mit KI beschäftigen, sollten sich nicht mit Hummern befassen, sondern mit dem gesamten System von Anthropic. Ich denke, das ist für jeden Produktmanager ein Muss.“

„Wenn Sie direkt der KI fragen, ob es sich um ein gutes Produkt handelt und was in der Dokumentation verbessert werden kann, wird sie Ihnen nur sinnvolle, aber trockene Reden geben. Wie können Sie aber in einem Moment die besten Geschäftsgeister der Welt, wie Steve Jobs oder Elon Musk, heranziehen?“

„Mitten in der Nacht war ich so erschreckt, dass ich fast aufspringen wollte, denn die KI hat fast jede meiner Fragen vorhergesagt.“

…

In der neunten Ausgabe von Shanyou's Exploration Stream hat Professor Li Shanyou Zhang Fan, den Gründer von Yuanli Intelligence, eingeladen. Als ehemaliger COO von Zhipu AI war er an der Hunderten-Modell-Kampf beteiligt und hat tiefgreifende Überlegungen zur kommerziellen Umsetzung von Large Language Models angestellt. In diesem Gespräch werden alle Scheinbilder aufgedeckt, und es wird eine äußerst aufschlussreiche Einschätzung getroffen: Die Art und Weise, wie die meisten Menschen KI heute nutzen, bleibt im Wesentlichen auf der Ebene des „Feuerwerksschauens“.

Das Problem liegt nie in den Werkzeugen, sondern in der Wahrnehmung. Der echte Bruchpunkt ist nie, „ob man KI nutzen kann“ oder nicht, sondern: Können Sie die Essenz des Modells erkennen, können Sie die Grenzen der Probleme definieren und können Sie aus dem unendlichen Lösungsraum die „optimale Lösung“ für Sie herausholen?

Wenn Sie sich Sorgen über die Unsicherheit, die die KI mit sich bringt, machen oder bereits unbewusst spüren, dass „es nicht genügt, nur die Werkzeuge zu lernen“, dann könnte dieses Gespräch Ihnen helfen, einen kognitiven Sprung zu machen.

Im Folgenden finden Sie eine Auswahl aus dem Podcast.

Die echten Experten „kontrollieren“ das Modell

Li Shanyou: Viele Menschen zögern derzeit, „Hummer“ zu installieren. Tatsächlich ist es wie im Jahr 2023, als alle in Hektik lernten, Prompts zu schreiben, Sora, Klammern und Manus zu nutzen... Wenn wir heute zurückschauen, sind all diese Dinge nur Scheinbilder, die sich zu schnell ändern.

Zhang Fan: Die Veränderungen auf dem Markt stimmen im Großen und Ganzen mit unseren Prognosen von letzter März und April überein, nur dass die aktuelle Situation eher wie ein „Feuerwerk“ ist. Daher wird die zukünftige Fragestellung lauten - die Kontrollierbarkeit der „Feuerwerksfähigkeiten“ des Modells. Diejenigen, die am besten mit Modellen umgehen, wie Anthropic, haben fast alle das Ziel, sicherzustellen, dass die KI nicht außer Kontrolle gerät. Es geht nicht darum, zu sehen, wie sie Hüpfburgen macht, sondern darum, dass sie uns bei komplexen Geschäften wirklich helfen kann. Wir haben jetzt einige Mittel gefunden, um die Kontrolle zu üben.

Li Shanyou: Der Punkt, den Sie gerade gemacht haben, klingt sehr interessant. Können Sie das genauer erklären?

Zhang Fan: Nehmen wir das Schreiben von Prompts als Beispiel. Anfänger schreiben gerne lange Prompts und denken, dass desto mehr Informationen, desto besser. Tatsächlich wird dadurch jedoch die Generalisierungsfähigkeit des Modells eingeschränkt. Wenn Sie zu viele Einschränkungen setzen, kann es nicht hervorragende Ergebnisse liefern; wenn Sie zu wenig Informationen geben, erreichen Sie nicht das gewünschte Ziel. Der Schlüssel besteht darin, die richtige Grenze zu finden.

Die Ausgabe eines Modells zu einer bestimmten Frage folgt im Wesentlichen einer Normalverteilung. Je näher man sich dem Zentrum nähert, desto höher ist die Wahrscheinlichkeit und desto allgemeiner ist das Ergebnis, aber es ist oft auch eher durchschnittlich. Wenn Sie beispielsweise fragen, „Was schmeckt am besten?“, wird es Ihnen die weltweit anerkanntesten Antworten geben, aber es wird sicherlich nicht besonders herausragend sein. Die echten guten Lösungen befinden sich immer am Rand. Das Schreiben von Prompts besteht im Wesentlichen darin, die Form dieser Verteilung zu verändern und den Rand in das Zentrum zu drängen, um so die bessere Lösung zu erhalten. Aber wie kann man das bewerkstelligen?

Nehmen wir an, Sie möchten ein Produktkonzept erstellen. Wenn Sie direkt fragen, „Bitte bewerten Sie, ob dies ein gutes Produkt ist und welche Verbesserungsvorschläge es in der Dokumentation gibt?“, kann ich Ihnen sagen, dass es Ihnen nur eine durchschnittliche Lösung geben wird, voller sinnvoller, aber trockener Reden.

Wie kann man also die Randlösungen aktivieren?

Ich würde zunächst fragen, „Bitte nennen Sie mir die besten Produktmanager der Welt?“ Es wird Namen wie Steve Jobs und Elon Musk nennen.

Dann würde ich weiter fragen, „Nehmen Sie an, Sie sind Steve Jobs. Summieren Sie seine fünf Kernmethoden zum Problemlösen auf.“ In diesem Schritt verschiebt das Modell „Steve Jobs“ aus dem Rand in das Zentrum und gibt einige Lösungen von Steve Jobs.

Schließlich würde ich sagen, „Bitte beurteilen Sie mein Konzept aus Steve Jobs' Perspektive und mit diesen Methoden.“

Dann würde ich dasselbe mit Elon Musk tun. Der eine spricht von der Kreuzung von Menschlichkeit und Technologie, der andere von der Ersten Prinzipien-Methode. Dies sind alle Randlösungen. Wenn wir verschiedene Randlösungen und extreme Vorschläge aus verschiedenen Perspektiven zusammenfassen, erhalten wir eine effektivere Beurteilung.

Dies ist die Nutzung der ursprünglichen Fähigkeiten des Modells. In dieser Zeit ist das Denken selbst schon billig geworden. Die Kunst besteht darin, die Richtung des Denkens zu steuern. Das ist das, was jeder von uns tun sollte. Wenn man dies standardisieren und produktivieren kann, wird es ganz anders sein.

Der Weg in die „Vertikale“ ist der Wettbewerbsvorteil

Zhang Fan: In Zukunft wird man sich nicht mehr damit beschäftigen, wie Menschen Regeln schreiben, sondern wie man das Modell dazu bringt, sich selbst zu verbessern, sich selbst zu überprüfen und sich selbst zu verbessern. So wird Wissen ständig entstehen. Unser Unternehmen arbeitet daran, dies zu einem standardisierten Produkt zu machen, damit Menschen das Selbstentwicklungspotenzial des Modells mit geringerem Aufwand nutzen können.

Li Shanyou: Um das Modell sich selbst entwickeln zu lassen, nutzen Sie fremde Modelle oder eigene?

Zhang Fan: Ich nutze fremde Modelle. Man kann das Basismodell als menschliche DNA verstehen. Es ist die optimale Lösung, die durch unzählige Generationen natürlicher Selektion entstanden ist. Wenn man eine Zivilisation schaffen und Wissen erkunden möchte, muss man nicht von der DNA anfangen, sondern kann einfach eine Universität gründen.

Li Shanyou: Wie lassen Sie es wachsen? Können nur die Modellunternehmen die Gewichte ändern?

Zhang Fan: Ich denke, dass es in Zukunft sehr einfach sein wird, die Gewichte zu ändern. Früher musste man für die Anpassung eines allgemeinen Modells eine enorme Rechenleistung und riesige Datenmengen aufbringen. Nur die Modellunternehmen konnten dies tun. Aber heute brauchen wir kein allgemeines Modell mehr. Wir können unsere eigenen Präferenzen in einem vertikalen Bereich hinzufügen. Es ist wie bei der Einstellung von Mitarbeitern. Man muss nicht von Zellen anfangen, um Menschen zu erschaffen.

Li Shanyou: Meinen Sie, dass man die Gewichte in einem vertikalen Modell ändern kann?

Zhang Fan: Ja. So ist es bei Menschen. Die Gene bestimmen ungefähr die Gewichte, so dass sie einen gewissen gesunden Menschenverstand haben. Aber ob sie in China oder in den USA geboren werden, ob sie Ingenieurwesen oder Medizin studieren, ändert ständig ihre Gewichte.

Die optimale Lösung kann nicht durch ein allgemeines Modell erraten werden. Sie muss in unserer eigenen Umgebung konstruiert werden. Ich denke, dass dies der Schlüssel dieser Zeit ist und sich von der bisherigen Logik unterscheidet.

Heute versuchen alle KI-Basismodelle, die Entropie zu reduzieren und die Kontrolle zu üben. Beispielsweise definiert Claude mit MCP, Skill, Cowork usw. immer wieder die vertikalen Bereiche neu. Ich denke, dass es in Zukunft unweigerlich zu einem Gewichts-Engineering kommen wird. Jeder kann mit geringen Kosten seine eigene Umgebung definieren und auf dem Basismodell die optimale Lösung in seiner eigenen Umgebung trainieren.

Ich denke, dass die Kernkompetenz von Unternehmen heute nicht darin besteht, ein Modell zu trainieren, sondern darin, ihr vertikales Wissen, MCP, Skill usw. zu definieren. Viele Unternehmen investieren derzeit viel Zeit und Energie in die Infrastruktur, was falsch ist.

Li Shanyou: Das ist eine sehr gute Erkenntnis. Wo liegt Ihre Kernkompetenz?

Zhang Fan: Das Basismodell löst die allgemeinen Fähigkeiten, aber es besteht noch eine weite Distanz zwischen den allgemeinen Fähigkeiten und einem wirklich effizienten „Mitarbeiter“ in einem Unternehmen.

Ich denke, dass hier eine „Universität“ fehlt, d. h. wie man diesen „Mitarbeiter“ „fächert“. Beispielsweise gibt es Leute, die sich mit Geschäftswesen befassen, und andere, die sich mit Programmierung beschäftigen. Unterschiedliche Unternehmen haben unterschiedliche Randrichtungen, aber 80 % oder sogar 90 % dieser Randrichtungen können übereinstimmen. Ich kann diese 80 % übereinstimmenden Teile zusammenfassen, so dass die Unternehmen nicht von der Gründung einer „Universität“ anfangen müssen.

Wir bieten die besten Branchenpraktiken an - beispielsweise, welche 20 Strategien ein Verkäufer hat und wie man sie bewertet. Auf Unternehmens Ebene kommt es darauf an, ob Sie Hüte oder Hosen verkaufen, ob Sie online oder offline sind, ob Sie per Livestream oder auf Regalen verkaufen. Das sind Ihre eigenen Präferenzen.

Li Shanyou: Wie setzen Sie Ihre Preise?

Zhang Fan: Es gibt auf dem Markt normalerweise drei Preismodelle. Das erste ist die Sitzplatzgebühr, das Softwaremodell. Ich denke, dass dies nicht funktioniert. Es ist noch die Denkweise der vergangenen Zeit. Manche sagen, Sie bezahlen für einen Mitarbeiter 10.000 Yuan, und ich biete Ihnen einen Intelligenten Agenten für 2.000 Yuan an. Ist das nicht günstig? Ich denke, dass diese Logik auch nicht funktioniert. Der Wettbewerb in dieser Zeit ist der Wettbewerb zwischen Intelligenten Agenten. Es ist nicht sinnvoll, einen Bagger nach der Anzahl der Menschen, die er ersetzt, zu bewerten.

Das zweite Preismodell ist die Leistungspauschale. Beispielsweise bekommen Sie für jedes verkaufte Produkt eine Bezahlung. Es ist sehr wahrscheinlich, dass Sie mich beschuldigen, dass ich nicht gut verkaufe, und ich Sie beschuldige, dass Ihre Waren schlecht sind. Am Ende zweifeln wir uns gegenseitig.

Ich denke, dass das sinnvollste Preismodell die Energiegebühr ist. Man sollte die KI wie Strom oder Wasser preisen, d. h. pro Einheit. Das ist die Zukunft.

Aber dies würde die KI als äußerst billig erscheinen lassen. Unternehmen müssen sich darum kümmern, wie sie die KI optimal nutzen können und wie sie auf der Grundlage der geringen Kosten ihre Kreativität entfalten können. Wie sie die KI in die physische Welt integrieren können, um Gewinne zu erzielen. Aus unserer Sicht möchten wir nur den Prozess der Integration beschleunigen, damit die KI schneller in die physische Welt integriert werden kann.

Die drei Hauptströmungen der aktuellen KI-Anwendungen

Zhang Fan: Heute gibt es bereits verschiedene Strömungen bei den Intelligenten Agenten. Die gesamten KI-Produktanwendungen können derzeit in drei Hauptströmungen unterteilt werden, die drei verschiedenen Philosophien entsprechen.

Die erste Strömung ist OpenAI, die Romantik der KI. Alle ihre Produkte haben eine sehr hohe Vorstellungskraftschwelle. Wenn Sie sich jedes Produkt ansehen, haben Sie das Gefühl, dass es alles übertreffen kann. Beispielsweise soll Sora TikTok ersetzen, und Atlas soll Chrome ersetzen. Alles sind riesige Feuerwerksschellen, aber die Benutzerbindung ist äußerst gering.

Die Philosophie von OpenAI besteht darin, die Vorstellungskraft der KI zu verkaufen. Es geht nicht darum, dass Sie das Produkt nutzen, sondern darum, dass Sie die KI als unendlich wahrnehmen, um so die Entwicklung voranzutreiben und größere Investitionen zu fördern. Sam Altman hat im Wesentlichen einen Investor-Hintergrund, daher sieht er den Zustand des gesamten Marktes in zehn Jahren.

Eine andere Produktphilosophie ist die praktische Strömung der KI von Google. Die Produkte wirken sogar eher unspektakulär, aber die Benutzerbindung steigt stetig. Das bekannteste Beispiel ist Notebook LM.

Anfangs dachte ich, dass es nur ein Wissensspeicher sei. In China ist das längst ausgegraut. Aber je mehr ich es nutze, desto mehr merke ich, dass es im Wesentlichen kein Wissensspeicher ist, sondern eine Pipeline zur Verwaltung des Modellwissens - durch Deep Search werden schnell Informationen ergänzt und in Podcasts, Dokumente, Präsentationen usw. verarbeitet. Sie werden feststellen, dass es eine Pipeline zur Wissensproduktion ist. Je mehr Sie es nutzen, desto besser gefällt es Ihnen, und Sie können es nicht mehr missen. Ich denke, dass die Grundlage von Google die Produktivität ist.

Hier gibt es einen noch stärkeren Akteur, nämlich Anthropic, die Geek-Strömung oder die Ursprungsphilosophie der KI.

Die ersten beiden Strömungen entwickeln Produkte für die Menschen, während Anthropic Produkte für Agenten entwickelt. Ich erinnere mich, dass Elon Musk vor kurzem etwas sehr Aufschlussreiches sagte. Er sagte, dass es in den nächsten sechs Monaten keine C-Sprache mehr geben würde, wenn es um KI-Programmierung geht. Man sollte direkt von der Binärsprache anfangen.

Diese Logik ist sehr fundamental. Die C-Sprache ist im Wesentlichen für Menschen gedacht. Warum muss sie für Menschen verständlich sein? Weil die Maschinen früher nicht in der Lage waren, mussten die Ingenieure die Programme in einer für Menschen verständlichen Sprache schreiben. Jetzt kann man direkt in Binärsprache programmieren, ohne die Verluste durch den Compiler. Die Effizienz ist höher.

Li Shanyou: Das würde bedeuten, dass viele Programmierer arbeitslos werden müssten.

Zhang Fan: Das wird sicherlich passieren. Wir beurteilen nicht, ob dies gut oder schlecht ist, sondern sagen nur, dass es unweigerlich passieren wird. Als Sora zum ersten Mal erschien, wussten wir bereits, dass es danach Seedance geben würde. Es gibt keine Umwege in dieser Zeit mehr.

Warum ist die KI eher wie „Strom“?

Li Shanyou: Was halten Sie von der Iterationsgeschwindigkeit der Basismodelle dieser Unternehmen? Steigt sie oder sinkt sie?

Zhang Fan: Sie steigt.

Li Shanyou: Warum hat man aber nicht mehr das Gefühl, beeindruckt zu werden?

Zhang Fan: Hier gibt es eine Logik: Je größer der Unterschied zwischen einem Ding und der menschlichen Wahrnehmung ist, desto eher wird man beeindruckt. Aber wenn man beeindruckt ist, ist das Ding oft nicht nützlich. Als ChatGPT-3 herauskam, waren alle beeindruckt. Man hätte nie gedacht, dass ein Modell mit einem sprechen kann. Aber damals konnte es eigentlich nichts tun, es

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

Was tun, wenn KI beginnt, Menschen rückwärts zu finetunen? Wie können wir die neue Intelligenz beherrschen?

Die echten Experten „kontrollieren“ das Modell

Der Weg in die „Vertikale“ ist der Wettbewerbsvorteil

Die drei Hauptströmungen der aktuellen KI-Anwendungen

Warum ist die KI eher wie „Strom“?