Agent "Strafregistereintrag" zurückverfolgbar: Der ehemalige GitHub-CEO gründet erneut ein Unternehmen und schreibt den Denkprozess in Git.
Über einen langen Zeitraum wurde Thomas Dohmke als der „untypischste CEO“ angesehen.
Er beantwortete selbst in der späten Nacht GitHub Issues persönlich, demonstrierte auf Veranstaltungen öffentlich den Prozess des Code-Schreibens und betonte in der frühen internen Testphase von Copilot immer wieder: „Wenn dieses Ding die Arbeitsweise von Entwicklern am Tag nicht verändern kann, ist es nicht wert, zu existieren.“
Letzten August verließ der GitHub-Chef jedoch offiziell sein Amt. Die Außenwelt spekulierte, ob er einer anderen großen Firma beitreten oder in die AI-Startup-Investitionen eintauchen würde. Einige Monate später gab er jedoch eine klarere Antwort – er gründete erneut ein eigenes Unternehmen.
Thomas Dohmke, der heute 48 Jahre alt ist, gründete ein neues Unternehmen namens Entire, eine Open-Source-Entwicklerplattform für die „Ära des intelligenten Codierens“.
Er kündigte diese Nachricht auf x an.
Philipp Kandal, der Chefproduktmanager von Grab, gratulierte auf x.
1 Wer ist Entire?
Was genau ist also dieses Entire?
Laut Dohmke ist Entire eine Plattform, die jedoch nicht unbedingt mit GitHub konkurrieren muss. Dohmke sagte, dass die Idee darin besteht, eine Plattform auf einer höheren Ebene des Technologiestapels zu erstellen, damit Entwickler den Inferenzprozess von Agenten verwalten und mit ihnen zusammenarbeiten können. Das Code-Repository bleibt dabei der Kern.
Entire baut eine dreistufige Plattform auf. Die Basis ist eine neue, von Grund auf neu erstellte Git-kompatible Datenbank, die Mitte ist eine semantische Inferenzschicht und ganz oben ist eine Benutzeroberfläche.
Das Team ist der Meinung, dass aufgrund der unterschiedlichen Informationen, die in diesen neuen Repositories gespeichert werden, eine neue Datenbankebene erforderlich ist – genauer gesagt können Agenten bei der Verwendung dieser Tools mehr Kontextinformationen liefern als Menschen. Diese neue Datenbank wird es Menschen und Agenten ermöglichen, nicht nur den Code abzufragen, sondern auch die Logik hinter dem Code.
Da Agenten diese Datenbank und ihre API-Endpunkte möglicherweise viel häufiger nutzen als Menschen Git-Repositories, muss das Team auch die Leistung berücksichtigen.
Dohmke sagte auch, dass sich diese neue Art von Datenbank im Gegensatz zu herkömmlichen zentralisierten Git-Repositories als ein global verteiltes Netzwerk von Knoten aufbauen lässt.
Für Benutzer, die (oder die möchten) die Souveränität ihrer Daten sicherstellen müssen, ist dies ein wichtiger Verkaufspunkt.
Obwohl die Benutzeroberfläche noch in der Entwicklung ist, hat Entire bereits einige Funktionen entwickelt, um die in Git gespeicherten Checkpoints zu visualisieren. Derzeit konzentriert sich das Team jedoch hauptsächlich auf die Befehlszeilen-Erfahrung.
Was den Grund für die Entwicklung einer solchen Plattform angeht, gab Dohmke seine Erklärung.
Dohmke betonte, dass ein Problem im aktuellen Arbeitsablauf von Entwicklern/Support-Mitarbeitern, das wir jetzt oft hören, darin besteht, dass die Engstelle bei der Code-Lieferung nicht im Schreiben des Codes liegt, sondern in der Prüfung des von Support-Mitarbeitern geschriebenen Codes. Dies hat dazu geführt, dass Entwickler ausgelaugt sind.
Beispielsweise hat Addy Osmani, ein irischer Softwareingenieur und Google-Gemini-Entwickler (der auch an der Entwicklung von Chrome beteiligt ist), öffentlich seine Skepsis gegenüber Vibe Coding geäußert.
„Wir verwenden auch Vibe Coding bei Google – ich finde es sehr gut für Prototypen und minimale einsatzfähige Produkte (MVP) und auch sehr hilfreich zum Lernen …“ sagte Osmani in einem Podcast Anfang November. „Aber insgesamt liegt der Schwerpunkt von Vibe Coding eher auf Geschwindigkeit und Exploration, als auf Korrektheit und Wartbarkeit.“
Dohmke ist der Meinung, dass in Zukunft mehr Agenten auftauchen werden.
„Wenn Sie diesen Prozess während des gesamten Softwarelebenszyklus befolgen, ist der nächste Schritt nach dem Schreiben des Codes die Code-Prüfung – sei es Ihr eigener Code oder der Code von Teammitgliedern über Pull Requests“, sagte Dohmke. „Aber Pull Requests haben dasselbe Problem (bei der Code-Verständnis). Es werden Änderungen in Dateien angezeigt, die ich nie geschrieben habe. Und Code-Prüfungstools wie Copilot geben mir Feedback zu ihrem Code, was sehr nützlich ist, wenn ich noch ein gewisses Grundverständnis des Codes habe, aber wenn ich nicht wirklich verstehe, was dieser Code tut, wird dieses Feedback sinnlos oder überflüssig.“
Wenn es viel Code und wenig Kontext gibt, kann die Lösung darin liegen, Agenten und deterministische Tools zu verwenden, um den Code zu testen und seine Einhaltung und Sicherheit zu gewährleisten.
Er erklärte: „Dies wird allmählich zur Engstelle, also müssen Sie diesen Schritt aus dem Prozess entfernen. Ich denke, dass dies eine der größten Herausforderungen in der Branche ist, denn während wir mit zunehmenden Cyberangriffen fertig werden müssen, haben viele Organisationen Zero-Trust-Prozesse eingeführt, was bedeutet, dass jede Bereitstellung manuell überprüft werden muss. Daher denke ich, dass aus unserer Sicht viele Innovationen in diesem Bereich auftauchen werden, und wir möchten Teil davon sein.“
2 Erstes Produkt: Checkpoints und Open-Source
Checkpoints ist das erste Produkt von Entire. Dieses neue Open-Source-Tool integriert Claude Code und Google's Gemini CLI (Open Codex wird bald unterstützt) und kann automatisch die Inferenz, Absicht und Ergebnisse von Agenten extrahieren und aufzeichnen.
In der aktuellen Agent-Entwicklungsarbeit wird ein seit langem vernachlässigtes Problem immer deutlicher: Gespräche sind kurzlebig und Entscheidungen sind irreversibel.
In den meisten Fällen bleiben die Prompts von Agenten im Terminal, und der Inferenzprozess wird in das Kontextfenster gepackt. Sobald das Gespräch endet, verschwinden diese Informationen. Der Code wird schließlich in Git eingecheckt, aber Git protokolliert nur, „was geändert wurde“, aber nicht, „warum es so geändert wurde“. Wenn ein Agent in einem Gespräch Hunderte oder Tausende von Codezeilen generiert, wird das Fehlen dieses Kontexts schnell sichtbar: Frühe Einschränkungen, Design-Entscheidungen und abgelehnte Lösungen können nicht mehr zurückverfolgt werden.
Das Ergebnis ist, dass Agenten praktisch nicht miteinander zusammenarbeiten können. Sie wiederholen die Inferenz und das Ausprobieren von Fehlern in verschiedenen Gesprächen, verbrauchen erneut Token und widerrufen sogar Entscheidungen, die sie Stunden oder Tage zuvor getroffen haben. Mit der Zunahme der Größe des Code-Repositories wird diese „Amnesie-Entwicklung“ zu einer versteckten Kostenfaktor für Effizienz und Konsistenz.
Um dieses Problem zu lösen, wurde ein neues Konzept namens Checkpoints vorgeschlagen. Es versucht, den sonst flüchtigen Kontext von Agenten in dauerhafte und nachverfolgbarer Engineering-Ressourcen umzuwandeln.
Der Kerngedanke von Checkpoints ist: Der vollständige Gesprächskontext von Agenten wird als Daten erster Ordnung in Git gespeichert. Wenn der von Agenten generierte Code eingecheckt wird, protokolliert das System nicht nur den Code selbst, sondern erfasst auch die Schlüsselinformationen aus diesem Gespräch, einschließlich Prompts, Logs, zugegriffenen Dateien, Tool-Aufrufen und Token-Verbrauch. Diese Informationen werden mit dem Code-Einchecken verknüpft und bilden eine semantische Spur, die erklärt, „warum es so geschrieben wurde“.
Betrachtet man die Verwendungsmethode, so läuft Checkpoints als ein „Git-sensibles“ Befehlszeilentool. Jede Eincheckung, die von einem Agenten ausgelöst wird, erzeugt ein strukturiertes Checkpoint-Objekt, das mit der entsprechenden Eincheckung-SHA verknüpft ist. Der Inhalt des Code-Repositories ändert sich nicht, sondern es wird eine zusätzliche Schicht von Kontext-Metadaten hinzugefügt. Wenn Entwickler den Code in ein Remote-Repository pushen, werden diese Checkpoints in einen separaten, nur anhängbaren Zweig synchronisiert, um ein vollständiges Audit-Protokoll zu bilden.
Das bedeutet, dass Entwickler nicht nur die Code-Unterschiede selbst zurückverfolgen können, sondern auch den Inferenzprozess und die Entscheidungsgründe, die zu diesen Unterschieden geführt haben. In einem Szenario mit mehreren Menschen und Agenten hat das Code-Repository erstmals die „Gedächtnisfähigkeit“ und ist nicht mehr nur eine Ansammlung von Ergebnissen.
„Die Rolle der mittleren Schicht besteht darin, Menschen und Agenten alle Informationen bereitzustellen, die zur Entstehung eines Softwareprodukts beigetragen haben“, erklärte Dohmke. „Heute enthält das GitHub-Code-Repository zwar alle Codes, manchmal auch Dokumentationen und Abhängigkeiten, aber im Wesentlichen fehlen alle Informationen darüber, wie diese Codes umgesetzt wurden.“
Dies liegt daran, dass diese Systeme für menschliche Entwickler entwickelt wurden. Obwohl Entwickler möglicherweise Testfälle und Dokumentationen schreiben, nachdem sie den Code geschrieben haben, werden ihre spezifischen Inferenzschritte nie in den Prozess aufgenommen. In traditionellen, nicht Agent-basierten Arbeitsabläufen werden große Mengen an institutionellem Wissen nie festgehalten.
„Dies ist der erste Schritt in unsere größere Vision, eine semantische Inferenzschicht im Lebenszyklus von Softwareprojekten bereitzustellen, damit Sie zu jedem Zeitpunkt in Zukunft als Mensch oder Agent die Gründe für Entscheidungen verfolgen können“, erklärte Dohmke.
Indem alle diese Daten gespeichert werden, können Entwickler sehen, wie Agenten Code generieren.
Außerdem fragte ein x-Benutzer auf x, wie die Daten verarbeitet werden würden und ob sie an anderen Orten verwendet würden.
Dohmke sagte: „Entire speichert den Kontext und die Checkpoints in Ihrem GitHub-Code-Repository. Sobald Sie sich anmelden, synchronisiert Entire sie in eine Supabase-Datenbank, nur für Anzeigezwecke. Langfristig möchten wir eine semantische Schicht aufbauen, damit menschliche Entwickler und Agenten parallel inferenzieren, zusammenarbeiten und bauen können. Wir werden Ihre Daten nicht für andere Zwecke als die Bereitstellung von Plattformfunktionen für Sie und Ihr Team verwenden.“
3 Der Weg eines „Ingenieur-CEO“
Thomas Dohmke stammt nicht aus dem traditionellen Bereich der „beruflichen Manager“.
Vor seinem Eintritt bei GitHub war er ein Ingenieur, Unternehmer und langjähriger intensiver GitHub-Benutzer. Nach der Übernahme von GitHub durch Microsoft im Jahr 2018 trat er in das Microsoft-System ein und übernahm 2021 die Position des CEO, der erste echte „Ingenieur-Skipper“ in der Geschichte von GitHub.
Während seiner Amtszeit absolvierte GitHub eine entscheidende Wende: Von einer „Code-Hosting-Plattform“ zur „AI-Entwicklungsplattform mit Copilot als Kern“.
Die Einführung von Copilot war nicht nur eine einfache Funktionsverbesserung, sondern eine grundlegende Paradigmenänderung. GitHub bedient sich nicht nur der Frage, „wie Menschen zusammen Code schreiben“, sondern beginnt auch, sich der Frage zu widmen, „wie Menschen mit AI zusammen Code schreiben“. Diese Einschätzung erwies sich später als der Wendepunkt für die gesamte Branche.
Deshalb betonte Dohmke, als er 2025 seine Abmeldung ankündigte:
Dies war ein völlig freundschaftlicher Abschied und keine Ablehnung der Strategie von GitHub oder Microsoft.
Erinnerte er sich in einem Interview mit The New Stack, hatte er im Juni ein langes Gespräch mit Satya Nadella, dem CEO von Microsoft. Er teilte Nadella offen seine Gedanken mit: Er wolle wieder in den Zustand zurückkehren, in dem er „Dinge von Grund auf neu erstellt“. Nadellas Antwort war, dass er ihn ermutigte, „die CEO-Arbeit ordentlich zu beenden“ und ihm auch freundlich zugestimmt, im Microsoft-Okosystem zu bleiben.
Dies erklärt auch ein Detail: Das Microsoft-Venture-Capital-Team M12 wurde einer der Investoren von Entire.
Mit seiner Berufserfahrung als technischer Leiter von GitHub genießt Dohmke auf den Kapitalmärkten großen Zuspruch.
Die erste Finanzierungsrunde von Entire belief sich auf 60 Millionen US-Dollar, die von Felicis angeführt wurden, wobei Madrona, Basis Set und Microsoft M12 ebenfalls beteiligt waren. Der Unternehmenswert beträgt 300 Millionen US-Dollar.
Tatsächlich ist eine Finanzierung von 60 Millionen US-Dollar in der Branche der Entwicklertools nicht üblich. Noch wichtiger ist, dass dies eine Plattform in einem frühen Entwicklungsstadium ist.
Aber aus Sicht der Investoren ist dies keine „Wette auf das Produkt“, sondern eine Wette auf die Person und die Einschätzung.
Dohmke's zentrale Einschätzung lautet:
Die Generation von Entwicklerplattformen, die von GitHub repräsentiert wird, entstand in der Zeit, in der „Menschen Code schrieben“, nicht in der Zeit, in der „Agenten Code