Verabschieden Sie sich vom wissenschaftlichen "Sieben-Schritte-Marathon": Künstlicher Intelligenz-Agent verändert die Wissensproduktion

Was würde passieren, wenn der gesamte Forschungsprozess einem Agenten zur Ausführung übergeben würde?

Die wissenschaftliche Forschung wurde lange Zeit idealisiert.

Es ist nicht eine einheitliche Tätigkeit, sondern eine fein aufgelöste Fertigungsstraße. Recherche, Selektion, Lektüre, Organisation, Hypothesenbildung, Experimentieren, Validierung und schließlich Schreiben und Publikation - diese sieben Schritte bilden fast den grundlegenden Weg aller akademischen Arbeiten.

Das Problem ist, dass jeder Schritt dieses Weges Zeit kostet, aber nicht alle Schritte schaffen auch Wert.

Die Literaturrecherche bedeutet oft, aus Tausenden von Publikationen einige Dutzend wirklich relevante Inhalte auszuwählen. Im Lesestadium muss man die Methoden und Ergebnisse jeder Publikation verstehen und in seinem Kopf eine noch instabile kognitive Struktur aufbauen. Erst beim Definieren des Problems beginnt der Forscher mit dem "Schaffen", und bis dahin ist bereits viel Zeit verbraucht.

Im Wesentlichen gehören all diese Schritte zu "bestimmten Arbeitsaufgaben". Sie können zerlegt, beschrieben und wiederholt werden, aber sie erfordern immer noch die menschliche Arbeit. Dies führt zu einer typischen Fehlanpassung: Die wertvollsten kognitiven Ressourcen werden in den Teilen verschwendet, die am leichtesten ersetzt werden können.

In den letzten zehn Jahren hat sich KI in die wissenschaftliche Forschung eingeschlichen, aber meist nur an den Rändern. Sie hilft Menschen, schneller Publikationen zu finden, Texte besser zu übersetzen und sogar umfassende Übersichtsartikel zu schreiben. Doch diese Fähigkeiten haben die grundlegende Form der Forschung nicht verändert. Die Forschung bleibt immer noch ein "Sieben-Schritte-Marathon", nur wird es etwas schneller.

Eine radikalere Frage steht nun auf dem Tisch: Was würde passieren, wenn man den gesamten Forschungsprozess einem intelligenten Agenten überlässt?

Der kürzlich aktualisierte KI-Akademie-Intelligent Agent, Qiewen Academic (die chinesische Version von WisPaper), bietet eine neue Möglichkeit. Man überlässt die bestimmten Arbeitsaufgaben der Rechenleistung und gibt den unbestimmten Einfällen die Menschen zurück. Hinter diesem Satz verbirgt sich eine ganze Reihe von Neuzuteilungen im Bereich der wissenschaftlichen Produktionsweise.

KI produziert keine Publikationen, sondern beschleunigt den Prozess

Im traditionellen Forschungsprozess muss der Forscher bei dem siebenstufigen Forschungsmarathon ständig zwischen verschiedenen Schritten wechseln und diese verbinden.

Die Entstehung von Qiewen Academic bedeutet nicht, dass es direkt Publikationen produzieren kann. Es wird eher in den Forschungsprozess integriert und wird zu einer durchgängigen Fähigkeit. Bei einer gegebenen Forschungsaufgabe kann das System mit der Literaturrecherche beginnen, die Lektüre, Analyse und Informationsstrukturierung durchführen, auf dieser Grundlage potenzielle Probleme identifizieren, weiter zur Experimentplanung und -durchführung gehen und schließlich Ergebnisse und Berichte ausgeben.

Die Rolle der KI in der Forschung hat sich dadurch verändert. Früher war die KI eher wie ein "Assistent", der Ratschläge gibt oder einen Teil der Arbeit erledigt. Diese Arbeiten waren meist lokal, wie das Übersetzen einer Publikation, das Zusammenfassen eines Inhalts oder das Ergänzen eines Codes. Der Forscher musste ständig den Prozess übernehmen und zwischen verschiedenen Aufgaben wechseln, um den Gesamtprozess aufrechtzuerhalten.

Die unvermeidlichen Maschinenillusionen machen es notwendig, diese Arbeit zu überprüfen, um das Risiko von akademischem Betrug und Fälschungen zu vermeiden. Qiewen Academic, als KI-Intelligent Agent, ist eher wie ein "Ausführender", der einen Teil des Inhalts autonom erledigen kann, ohne dass ständige menschliche Eingriffe erforderlich sind. Dies bedeutet, dass es erstmals möglich ist, den Forschungsprozess zu "verwalten".

Mit einer anschaulicheren Analogie ist es wie bei der autonomen Fahrweise. Im System der autonomen Fahrweise legt der Mensch das Ziel fest, und das System ist für die Route und die Ausführung verantwortlich.

Das gleiche Prinzip wird nun in die Forschung eingeführt, und eine ähnliche Aufgabenteilung tritt auf. Der Forscher definiert das Problem, und Qiewen Academic, als Intelligent Agent, ist für den Fortschritt des Prozesses verantwortlich.

Die Veränderungen im Forschungsprozess werden hier sichtbar.

Zunächst wird die Zugehörigkeit des Prozesses neu definiert. Die Aufgaben, die ursprünglich schrittweise von Menschen erledigt werden mussten, werden zu einem Prozess zusammengefasst, der vom System insgesamt übernommen werden kann. Die Schritte der Recherche, Lektüre und Organisation, die ursprünglich stark von der menschlichen Arbeit abhängig waren, erfordern keine einzelne Eingriffe mehr, sondern werden in derselben Logik kontinuierlich verarbeitet.

Zweitens ändert sich die Arbeitsweise der Forschung von einem seriellen Prozess zu einer parallelen Struktur. Nach der Einbindung eines solchen KI-Intelligent Agenten kann die Forschung nicht mehr nur entlang eines einzigen Weges voranschreiten. Mehrere Hypothesen können gleichzeitig entwickelt werden, und mehrere Richtungen können parallel validiert werden. Die Arbeitsweise eines Forschers ändert sich von der Lösung eines Problems zur Verwaltung einer Gruppe von Problemen.

Wenn der Prozess selbst neu organisiert wird, ändert sich auch der Rhythmus der Forschung.

Ein 100-facher Beschleuniger, die erste "Generationslücke" in der Forschung

Was die Produktfähigkeiten betrifft, macht Qiewen Academic zunächst, dass es die Kette des traditionellen Forschungspfades "entkoppelt". Im traditionellen Pfad gibt es zwischen jedem Schritt Warte- und Wechselkosten. Qiewen Academic bringt jedoch eine exponentielle Effizienzsteigerung.

Diese Veränderung ist konkret. Laut den öffentlichen Informationen des Unternehmens ist die AI4S-Methode von Qiewen Academic bei der Literaturrecherche um das 10- bis 100-fache effizienter als die traditionelle menschliche Arbeit. Die Literaturauswahl, die ursprünglich Wochen dauern würde, wird auf Minuten reduziert; die Lektüre von Publikationen wird um das 20-fache beschleunigt, und das Lesen und Organisieren, das Monate dauern würde, wird auf Stunden für die strukturierte Extraktion reduziert; die Problemidentifikation kann in der gesamten Datenmenge systematisch gescannt und lokalisiert werden, und die Lokalisierung wird um das 50-fache beschleunigt. Eine solche Effizienzsteigerung kann fast den gesamten Lebenszyklus der Forschung neu gestalten.

Zugleich basiert die Effizienzsteigerung von Qiewen Academic auf einer effektiven und zuverlässigen Grundlage. Laut den veröffentlichten Daten erreicht Qiewen Academic eine Genauigkeit von 93,78 % bei der Literaturrecherche, während die Hauptmodelle bei etwa 70 % bleiben; die Genauigkeit bei der Analyse des Dokumentlayouts, der Formeln und der Tabellen liegt bei über 90 %, was insgesamt höher als der Branchenstandard ist.

Diese Fähigkeiten erzeugen keine direkten Ergebnisse, aber sie bestimmen, in welcher Form die Informationen in die nachfolgende Verarbeitung eingehen. Die Variablenbeziehungen, die experimentelle Struktur und die Datenverteilung werden im Voraus aufgelöst, und das Lesen wird von der stückweisen Verarbeitung zu einer strukturierten Aufnahme umgestellt.

Insbesondere hat Qiewen Academic in den Tests eine Übereinstimmung von 22,26 % bei der Zusammenfassung erreicht, und die Echtheit der Zitate liegt bei fast 99,8 %. Die erste bestimmt, ob Informationen aus verschiedenen Quellen in dasselbe logische Rahmenwerk aufgenommen werden können, und die zweite macht einen großen Schritt bei der Vermeidung von Maschinenillusionen bei generativen Modellen.

Genau auf dieser Grundlage hat seine Einbindung in den Forschungsprozess einen Raum, um sinnvoll zu sein.

Eines der Highlights dieser Aktualisierung liegt in der Vertiefung von Experimenten und anderen Schritten. Wenn man eine Publikation hochlädt, liest und versteht das System automatisch, zerlegt die Kernaufgaben und die Algorithmenlogik; auf dieser Grundlage analysiert es die experimentellen Methoden und erstellt ein ausführbares Experimentplan; anschließend baut es automatisch die Rechenumgebung auf, einschließlich der Rechenleistungskonfiguration und der Abhängigkeiten; erzeugt Code und führt den Experimentprozess aus und gibt schließlich die Ergebnisse und einen vollständigen Experimentbericht aus.

Der gesamte Prozess erfordert keine schrittweise menschliche Eingriffe. Qiewen Academic kann auf der Grundlage vorhandener Literatur oder der von dem System identifizierten Forschungslücken automatisch einen Experimentpfad generieren, Daten automatisch anpassen oder suchen, die Umgebung aufbauen, das Experiment durchführen und die Ergebnisse ausgeben.

Im traditionellen Forschungsprozess sind das "Verstehen" und das "Ausführen" getrennt. Das Verstehen kann beschleunigt werden, aber die Validierung hängt immer noch von Menschen ab. Jetzt wird ein ganzer Abschnitt, der ursprünglich von Menschen ständig gewechselt und getestet werden musste, insgesamt beschleunigt. Der Forschungsprozess wird von "menschlich angetrieben" zu "intelligent angetrieben".

In diesem Sinne könnte es die generelle Verbesserung der Forschungseffizienz repräsentieren.

All dies kann nicht einfach durch ein allgemeines großes Modell erreicht werden. Beispielsweise ist die Lernfähigkeit. Traditionelle große Modelle sind vielleicht gut in Prüfungen, aber sie haben Schwierigkeiten, neue, nie gesehene Kenntnisse zu lernen. Im CL-Bench-Test müssen die großen Modelle eine völlig fremde Regel verstehen und sie sofort im Kontext anwenden. Die meisten Modelle scheitern in diesem Schritt, und die durchschnittliche Erfolgsrate liegt nur bei 17,2 %.

Die Forschungsszenarien hängen genau von dieser Fähigkeit ab. Jedes Problem ist neu. Erst wenn das Modell in der Lage ist, in einem Kontext schnell die Regel zu verstehen, hat es die Grundlage, in den Forschungsprozess einzutreten.

Deshalb hat Qiewen Academic die Vorgehensweise bei der Durchführung von Aufgaben in einer realen Umgebung gezielt optimiert. Die Trainingsmethode AgentGym-RL, die es anwendet, ist einer realen Forschung näher. Das Modell muss bei Aufgaben wie der Webseitenbedienung und dem Experimentprozess ständig den Pfad anpassen. Die Ausführung kann nicht auf vordefinierte Antworten verlassen, sondern muss ständig anhand der Rückmeldungen korrigiert werden.

Laut den relevanten Publikationen hat ein kleines Modell mit nur 7 Milliarden Parametern (Llama-3.1-8B) nach der AgentGym-RL-Trainierung in mehreren Szenarien eine ähnliche oder sogar bessere Leistung wie GPT-4o und Claude 3.5-Sonnet erreicht.

Zugleich werden bei der Trainierung die Token, die mit Schlüsselkompetenzen wie Inferenz und Code verbunden sind, höher gewichtet, um die Fähigkeitssteigerung mit den Trainingsindikatoren in Einklang zu bringen.

Aber selbst wenn es die Fähigkeit hat, Aufgaben in einer realen Umgebung durchzuführen, ist dies dennoch nicht so einfach. Damit das Modell wirklich in den Forschungsprozess eintreten kann, muss es noch ein versteckteres Problem lösen, nämlich die Stabilität des Trainings selbst.

RLHF ist fast der Kernweg für die Anpassungsfähigkeit aller großen Modelle. Aber diese Methode hat ein allgemein anerkanntes Problem: Das PPO-Training ist äußerst instabil. Deshalb funktionieren viele Modelle gut bei kurzen Aufgaben, aber sobald sie in komplexe Prozesse eintreten, treten unkontrollierbare Abweichungen auf.

Qiewen Academic verwendet PPO-max, um durch feinere Beschränkungen und Belohnungsmechanismen das Trainingsverfahren stabil zu halten und nicht mehr vom Zufall abhängig zu sein.

Nach der Stabilität kommt die Ausführung. Das Aufrufen von Tools, das Schreiben von Code und die Verwaltung von Umgebungsabhängigkeiten sind an sich mit Unsicherheiten verbunden. Traditionelle Modelle verlassen sich in diesem Teil oft auf Vorlagen oder bleiben auf der Ebene des "Codegenerierens". Sobald sie in eine reale Ausführungsumgebung eintreten, treten Abweichungen auf.

In der Forschungsumgebung ist die Information nicht immer konsistent. Zwischen verschiedenen Publikationen können sich die Ergebnisse widersprechen, und die Datenquellen können auch Abweichungen verursachen. Wenn das Modell einfach die Informationen zusammenfasst, kann es leicht in der mehrfachen Information verfälscht werden.

Wenn Qiewen Academic auf eine Inkonsistenz zwischen "bestehendem Gedächtnis" und "aktueller Eingabe" stößt, bildet es intern zwei Verarbeitungspfade und trifft schließlich eine Entscheidung basierend auf den verschiedenen Signalstärken. Dies gibt dem Modell die grundlegende Urteilsfähigkeit in einer komplexen Literaturumgebung, anstatt die Informationen passiv zu akzeptieren.

Wenn diese Fähigkeiten zusammenkommen, ist die Veränderung nicht nur eine lokale Verbesserung. Sie repräsentiert vielmehr eine echte Paradigmenwende in der wissenschaftlichen Produktionsweise.

Wenn die Forschung auf den "Menschen" zurückkehrt, der kritische Punkt der Beschleunigung und des Durchbruchs

In dieser Veränderung wird nicht nur die Effizienz verändert.

Die Arbeitsweise der Forschung beginnt sich von der persönlichen Ausführung jedes Schritts hin zur Entscheidung an kritischen Knotenpunkten zu verändern. Wenn der Ausführungsprozess vom System übernommen wird, muss der Forscher nicht mehr ständig in die bestimmten Prozesse eintreten, sondern kann sich allmählich von der konkreten Ausführung entfernen und sich stattdessen auf die Ebene des Verstehens des Problems, der Auswahl des Weges und der Prüfung der Ergebnisse begeben.

Diese Veränderung scheint subtil, aber sie ändert auch stillschweigend die Rollenverteilung in der Forschung. Die klügsten Gehirne müssen nicht mehr im Prozess herumlaufen.

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

Verabschieden Sie sich vom wissenschaftlichen "Sieben-Schritte-Marathon", ein künstlicher Intelligenz-Agent ist dabei, die Art und Weise der Wissensproduktion zu verändern.

KI produziert keine Publikationen, sondern beschleunigt den Prozess

Ein 100-facher Beschleuniger, die erste "Generationslücke" in der Forschung

Wenn die Forschung auf den "Menschen" zurückkehrt, der kritische Punkt der Beschleunigung und des Durchbruchs