Ultraman: Ich möchte zwei Polen besonders loben. OpenAI hat noch nie ein Problem gehabt, das sie nicht lösen konnten.
Altman hat zwei Polen persönlich gelobt.
Ohne sie wäre OpenAI nicht, was es heute ist.
Sie sind der Chefwissenschaftler von OpenAI Jakub Pachocki und Szymon Sidor mit dem Titel "Technical Fellow".
Links: Jakub Pachocki, Rechts: Szymon Sidor
Die beiden sind nicht nur Polen, sondern auch Schulfreunde gewesen. Sie haben sich während ihres Promotionsstudiums für Informatik und Robotik entschieden und sich später bei OpenAI wiedergefunden.
Heute, wo ChatGPT weltweit beliebt ist und jeden Tag Hunderte von Millionen von Nutzern bedient, hat Altman die Meinung geäußert, dass die meisten Menschen nie an diejenigen denken würden, die hinter diesen Erfolgen stehen. Diese beiden polnischen Wissenschaftler sind genau zu diesen Schlüsselfiguren zu zählen.
Ihre Beiträge bei OpenAI reichen von der Massenexpansion des Reinforcement Learnings im Dota-Projekt über die Leitung der Vorhersage von GPT-4 bis hin zur gemeinsamen Förderung der ersten Ideen, die zu einem Durchbruch bei der Inferenz führten, zusammen mit Ilya und Lukasz.
Natürlich könnte es noch einen anderen Grund für Altmans hohe Einschätzung geben:
Bei der internen Krise von OpenAI im Jahr 2023 hatten sie auch als Pioniere ihre Kündigung erklärt und wollten Altman folgen.
Von der Schulzeit bis zur Wiedervereinigung bei OpenAI
Die Geschichte beginnt an einer Schule in Polen, der dritten Oberschule in Gdynia.
Dort haben die beiden unter demselben Lehrer Informatik gelernt. Die Qualität ihrer Ausbildung übertraf weit die eines normalen Gymnasiums und beinhaltete Themen wie Graphentheorie.
Ihr erstes Treffen war auf einem Programmiercamp, wo sie jedes Jahr zwei Monate lang intensiv trainierten.
Dennoch erinnerten sie sich später, dass ihre Beziehung in der Schule nicht so eng war. Sie waren nur akademische Partner. Erst als sie gemeinsam in den USA arbeiteten, entwickelten sie eine tiefe Freundschaft.
Zuerst betrachten wir Pachocki (im Folgenden Paulo genannt).
Mit 15 Jahren war er wie viele Jugendliche unsicher, was er in der Zukunft machen wollte.
Sein Vater gab ihm ein Buch, die polnische Übersetzung der Essaysammlung «Hacker und Maler» von Paul Graham, dem Mitbegründer von YC.
Was Paulo am meisten berührte, war die Beschreibung im Buch: Der Gemeinsame Punkt zwischen Hackern und Malern ist, dass beide Schöpfer sind.
Genau wie Komponisten, Architekten und Schriftsteller bemühen sich Hacker und Maler darum, schöne Dinge zu schaffen. Im Wesentlichen betreiben sie keine Forschung, aber wenn sie beim Versuch, schöne Dinge zu schaffen, neue Technologien entdecken, ist das umso besser.
Paulo war sehr glücklich, dass er nicht nur sein Interesse an der Informatik entdeckte, sondern auch bald feststellte, dass er in dieser Richtung wirklich talentiert war: Er gewann in der Schule eine Silbermedaille beim Internationalen Informatikolympischen Wettbewerb (IOI).
Übrigens war auch Altmans berufliche Laufbahn stark von Graham beeinflusst, aber eher auf dem Gebiet des Venture Capital.
In der OpenAI-Podcast-Ausgabe im August sagte Paulo, dass er heute noch denke, dass die ganze Sache lustig war. Damals hatte er diese Zusammenhänge wirklich nicht gesehen.
Nach der Schule studierte Paulo Informatik an der Universität Warschau in Polen und gewann während seines Bachelorstudiums viele Wettbewerbe.
2012 gewann er die Goldmedaille beim ICM-ICPC und den Google Code Jam. Bis heute kann man noch Fragmente seiner Preisschrift bei der ICPC finden.
Mitte: Jakub Pachocki
Nach seinem Bachelorstudium absolvierte er einen Doktorstudiengang in Informatik an der Carnegie Mellon University.
Was die KI betrifft, dachte er ursprünglich, dass es lange dauern würde, bis eine KI entwickelt werden könnte, die wirklich denken kann. Es bräuchte größere Computer und eine sehr solide mathematische Grundlage.
Aber AlphaGo im Jahr 2016 hat alles verändert.
Der Suchraum des Go-Spiels ist zu groß, als dass unsere Algorithmen damit fertig werden könnten. Aber sie haben dieses Problem mit Deep Learning gelöst. Das hat mich gezwungen, alles neu zu überdenken.
Nach seinem Abschluss arbeitete Paulo zunächst ein Jahr als Postdoktorand an der Harvard University und trat dann im Februar 2017 bei OpenAI ein.
Betrachten wir nun Sidor (im Folgenden Si genannt). Auch für ihn war AlphaGo der Anlass, sich dem Reinforcement Learning zu widmen. Aber als Jugendlicher war er am meisten von dem Film «Iron Man» inspiriert.
Nach der Schule studierte er zunächst für seinen Bachelor in England an der Universität Cambridge und absolvierte dann seinen Doktorstudiengang an der MIT.
Es war jedoch nicht seine aktive Entscheidung, an der MIT zu studieren. Er hatte viele amerikanische Universitäten beantragt, und nur die MIT hatte ihn nicht abgelehnt, weil die MIT kein Englischtest verlangt und er schlechte Englischkenntnisse hatte (peinlich).
Zunächst hatte er sich für das Fach Robotik entschieden, aber bald war er enttäuscht, dass reale Roboter nicht so cool waren wie in den Filmen. Also wechselte er zu Deep Learning und Reinforcement Learning.
Bei seiner Promotion hatte er als Thema «Reinforcement Learning in der Mehrstufeninferenz in der natürlichen Sprachverarbeitung» gewählt. Selbst heute würde dieses Thema als neues Thema für die Forschung an großen Modellen geeignet sein.
Damals war Si's Forschungsgegenstand das LSTM-Modell und der Deep Q-Learning-Reinforcement-Learning-Algorithmus. Die Aufgabe der Mehrstufeninferenz war das Problem des Neusortierens von Sätzen.
Nach seiner Promotion hat er sich zunächst um eine Stelle bei DeepMind beworben, aber bei dem Interview wurden ihm viele theoretische Fragen zu maschinellem Lernen gestellt, und er konnte keine von ihnen beantworten, also ist er durchgefallen.
Obwohl OpenAI damals noch ein unbekanntes Unternehmen war, schien es, als würde es sich ernsthaft mit Reinforcement Learning beschäftigen. Also hat Si sich entschieden, dort anzutreten.
Im Jahr 2017 trafen sich die beiden Polen bei OpenAI wieder.
Kurz nach ihrem Eintritt bei OpenAI haben sie sich an dem Dota 2-Projekt beteiligt. Das Ziel war, dass die KI in diesem komplexen E-Sportspiel professionelle menschliche Spieler schlagen sollte.
Frühe Interview im Dota-Projekt, Rechts: Szymon SIdor
Ursprünglich wollten sie durch dieses Projekt herausfinden, wo die Grenzen des Reinforcement Learnings liegen und wann es versagen würde. Aber das Ergebnis war ein großer Erfolg: Sie haben eine professionelle menschliche Spielertruppe geschlagen und damit Geschichte geschrieben.
Der Preis dafür war, dass beide ihr Haar verloren haben.
Bei diesem Projekt hat Paulo sich auf das Massen-Reinforcement Learning und die Optimierung konzentriert, während Si an der Entwicklung eines verteilten Trainingssystems und eines kontinuierlichen Trainingswerkzeugs beteiligt war.
Ihr Partnerschaftsmodell hat sich in diesem Projekt allmählich gebildet.
Paulo geht im Büro oder in seiner Wohnung auf und ab und denkt intensiv darüber nach, wie man ein Phänomen untersuchen sollte. Si dagegen bevorzugt es, direkt loszulegen und zunächst einige Daten zu sammeln.
Diese Kombination aus tiefgehender Überlegung und praktischer Experimentierung war ihr Geheimnis zum Erfolg.
Während der Entwicklung von GPT-4 war Paulo bereits der Leiter des Projekts. Altman hat einmal öffentlich gesagt: «Ohne seinen Beitrag hätten wir nicht die heutigen Errungenschaften erzielen können.»
Si's Rolle war sehr flexibel. Er hat sich als «unabhängiger Mitarbeiter» definiert und übernahm nur gelegentlich leitende Aufgaben. Sein Kernziel war es, die wertvollsten Dinge zu tun.
Im Krisenfall zeigt sich der wahre Wert
Die interne Krise von OpenAI im November 2023 hat endgültig die Bedeutung dieses Paars gezeigt.
Am Mittag des 17. November haben die beiden, die gerade am Mittagessen waren, die Nachricht über Altmans Entlassung erhalten.
Si erinnerte sich, dass er damals im Korridor über ein Problem nachdachte. Als er die Nachricht erhielt, ging er sofort zu Paulo. Paulo diskutierte gerade intensiv mit jemandem über ein Problem. Si hat sie unhöflich unterbrochen und ihnen die Ankündigung gezeigt.
Paulos Reaktion war sehr entschieden. Er ging sofort aus dem Gebäude und rief Altman an, um zu erfahren, was passiert war. Auch Altman war auf der anderen Seite des Telefons verwirrt.
Später waren die beiden in ihrem Vorgehen einheitlich. Sie haben gemeinsam mit Aleksander Madry als Pioniere ihre Kündigung erklärt und woll