Codex kompatibel mit in China entwickelten Open-Source-Modellen: Trotz DeepSeek-Integration hohe Hürden

Die Integration funktioniert, aber die Benutzerfreundlichkeit ist noch nicht ausreichend.

Am 17. Juni hat Tibo (@thsottiaux), der Leiter des OpenAI Codex - Teams auf X, einen Tweet gepostet. Er hat die Leute darauf hingewiesen, dass die Codex - App, die CLI und das SDK jetzt mit jedem Open - Source - Modell kompatibel sind und nicht nur mit den Modellen von OpenAI. Er hat auch direkt den Link zur offiziellen Konfigurationsdokumentation gepostet, der auf den Abschnitt über den OSS - Modus und den lokalen Anbieter verweist. Als ich diese Nachricht sah, war ich zunächst ziemlich überrascht, denn OpenAI hat sich lange Zeit als relativ geschlossen erwiesen. Dieses Mal hat es plötzlich die Tür für benutzerdefinierte Modellanbieter geöffnet, was wirklich etwas Neues ist.

Insbesondere ist Codex kein gewöhnliches Werkzeug. Im Wesentlichen ist es ein vollständiges Arbeitsplatzsystem, das es dem Modell ermöglicht, Dateien zu lesen und zu schreiben, Shell - Befehle auszuführen, Webseiten zu crawlen, Befehle auszuführen und auf der Grundlage der Ergebnisse von Tools weiter zu schließen und schließlich einsatzfähige Ergebnisse auszugeben. Das heißt, in Codex muss das Modell nicht nur reden können, sondern vor allem auch wirklich arbeiten können.

(Quelle: X)

Viele Leute haben in der Vergangenheit OpenAI wegen seiner Schließung kritisiert. Dies lag nicht nur daran, dass die Modelle nicht Open - Source sind, sondern vor allem daran, dass seine Tools, Modelle und Workflows in einem eigenen System verpackt sind. Man kann sie zwar nutzen, aber es ist schwierig, sie zu zerlegen und neu zu kombinieren. Insbesondere bei Agent - Tools wie Codex handelt es sich im Wesentlichen um eine Kombination aus Modellfähigkeiten, Tool - Aufrufen, Kontextverwaltung, Zugriffskontrolle und der lokalen Umgebung. Je stärker das Modell und je vollständiger der Arbeitsplatz, desto unwahrscheinlicher ist es, dass die Benutzer gehen. Jetzt hat OpenAI für Codex einen Eingang für benutzerdefinierte Modellanbieter geschaffen. Mindestens in Bezug auf das Produktverhalten wird Codex nicht mehr ausschließlich an die eigenen Modelle von OpenAI gebunden.

Aber glauben Sie, dass OpenAI plötzlich völlig offen geworden ist? LeiTech (ID: leitech) hat es getestet und festgestellt, dass es nicht so einfach ist.

Möchten Sie ein Drittanbieter - Modell einfach nur mit einem API - Key nutzen? Es ist nicht so einfach.

Der Teil, der am leichtesten missverstanden wird, ist die Aussage "Codex unterstützt Drittanbieter - Modelle". Viele Leute denken, wenn Modelle wie DeepSeek, Qwen und Kimi APIs anbieten und einige sogar behaupten, mit der OpenAI - API kompatibel zu sein, können sie einfach die Schnittstellenadresse und den API - Key in Codex eintragen und direkt nutzen. Auch wir haben zunächst so getestet. In der offiziellen erweiterten Konfigurationsdokumentation von Codex wird tatsächlich benutzerdefinierte Modellanbieter erwähnt. Ein Anbieter kann die Art und Weise definieren, wie Codex mit dem Modell verbunden wird, einschließlich der Schnittstellenadresse, des Protokolltyps, der Authentifizierungsmethode und einiger zusätzlicher Anforderungsinformationen. Sie können in der Konfigurationsdatei einen neuen Modellanbieter hinzufügen und Codex darauf verweisen.

Aber unser erster Versuch, die API von DeepSeek V4 Pro zu integrieren, war fehlgeschlagen.

Nach dem Durchlesen der offiziellen technischen Dokumentation ist die Antwort klar: Codex ist zwar geöffnet, aber nur halb und unter bestimmten Bedingungen. In der Dokumentation steht deutlich, dass das einzige öffentlich unterstützte Protokoll für benutzerdefinierte Anbieter derzeit das Responses - API ist. Wenn es nicht angegeben wird, ist es auch das Standardprotokoll. Einfach ausgedrückt, Codex erlaubt es Ihnen, den Modellanbieter zu wechseln, aber der derzeit öffentliche Konfigurationspfad basiert auf dem Responses - API - Protokoll. Ob ein Modellanbieter integriert werden kann, hängt nicht nur davon ab, ob er eine API hat, sondern auch davon, ob er Codex die gewünschte Responses - Form liefern kann.

(Quelle: LeiTech - Grafik)

Der Hauptzugang zur offiziellen API von DeepSeek ist der Chat Completions - Endpunkt. Er kann mit dem OpenAI - SDK aufgerufen werden, und das Modell DeepSeek V4 Pro kann normalerweise eingesetzt werden. Für viele Chat - Anwendungen, gewöhnliche API - Aufrufe und OpenAI - SDK - kompatible Szenarien ist dies kein Problem. Aber Codex macht die Anfragen nicht so. Wir haben versucht, Codex direkt mit DeepSeek zu verbinden, das Modell auf DeepSeek V4 Pro eingestellt und die Authentifizierung über den DeepSeek - Key durchgeführt. Nach dem Start hat Codex tatsächlich nach einem Responses - Endpunkt von DeepSeek gesucht, der nicht existiert, und es wurde eine 404 - Fehlermeldung zurückgegeben.

Tatsächlich bietet der OpenAI - kompatible Zugang von DeepSeek nicht den Responses - API - Endpunkt, den Codex derzeit benötigt.

Selbst wenn Modelle "OpenAI - kompatibel" genannt werden, gibt es verschiedene Ebenen. Chat Completions ist ein Schnittstellenprotokoll, und Responses - API ist ein anderes. Die Strukturen für gewöhnliche Chats, Tool - Aufrufe, Streaming - Ausgabe, Inferenzblöcke und die Rückgabe von Funktionsergebnissen sind in verschiedenen Protokollen nicht vollständig gleich. Für die Benutzer sind diese Unterschiede hinter den Konfigurationen verborgen, aber für ein Agent - Arbeitsplatzsystem wie Codex können sie direkt bestimmen, ob eine Aufgabe ausgeführt werden kann.

Der echte Wendepunkt kam von einem anderen Zugang von DeepSeek, nämlich dem Anthropic - API - kompatiblen Endpunkt. In der offiziellen Dokumentation von DeepSeek wird neben dem üblichen OpenAI - kompatiblen Zugang auch ein Anthropic - kompatibler Zugang angeboten. Letzterer eignet sich besser für Agent - Szenarien, die Tool - Aufrufe und die Rückgabe von Tool - Ergebnissen erfordern, und ist der Arbeitsweise von Codex näher. Der Weg, den wir schließlich erfolgreich getestet haben, war nicht, dass Codex direkt auf DeepSeek zugreift, sondern dass wir auf dem lokalen Rechner eine leichte "Übersetzungsschicht" hinzugefügt haben. Codex startet weiterhin Aufgaben in seiner gewohnten Weise. Diese Übersetzungsschicht wandelt dann die Anfragen in ein Format um, das DeepSeek verstehen kann. Nach der Rückgabe von DeepSeek wird das Ergebnis wieder in ein Format übersetzt, das Codex für die weitere Ausführung von Tools nutzen kann.

(Quelle: LeiTech - Grafik)

Einfacher ausgedrückt, können derzeit Modelle wie DeepSeek, Mimo, Kimi und Zhipu GLM nicht einfach mit einem API - Key in Codex integriert werden. Es muss eine Vermittlungsschicht verwendet werden, ähnlich wie bei der früher beliebten CC - Swich - Lösung. Natürlich ist es auch möglich, einen "direkten" Versuch zu unternehmen. Das Alibaba Bailian - Modell bietet derzeit einen Responses - Endpunkt an. Der Preis beträgt 200 Yuan pro Monat. Interessierte Personen können es ausprobieren.

Wie ist die Erfahrung mit Codex, das von DeepSeek angetrieben wird?

Nachdem die Konfiguration erfolgreich getestet wurde, haben wir DeepSeek + Codex einige Aufgaben zugewiesen, die eher der täglichen Arbeit von LeiTech entsprechen. Wir wollten vor allem sehen, ob die Kombination aus Drittanbieter - Open - Source - Modellen und Codex funktionieren würde.

Die erste Aufgabe war, Informationen über LeiTech im Internet zu suchen und auf der Grundlage der Website - Beschreibung, Artikel und speziellen Berichten, wie z. B. Berichten über MWC, IFA und AWE, ein Geschäfts - Werbe - Dokument zu erstellen und es als Markdown - Datei auszugeben. Diese Aufgabe scheint wie das Schreiben eines Artikels, aber sie beinhaltet tatsächlich mehrere Agent - Fähigkeiten. Zunächst muss es Informationen suchen. Wenn die Suchtools nicht verfügbar sind, muss es eine andere Strategie wählen. Nach dem Abrufen der Webseiten muss es die nützlichen Informationen extrahieren, die Informationen dürfen nicht einfach zusammengehäuft werden, sondern müssen gemäß der Struktur des Werbe - Dokuments neu organisiert werden. Schließlich muss es das Ergebnis als lokale Markdown - Datei schreiben.

(Quelle: LeiTech - Grafik)

Zu Beginn des Versuchs war das integrierte Web - Suchtool von DeepSeek V4 Pro nicht verfügbar, und die Web - Suchfähigkeit war auch nicht reibungslos. Es hat stattdessen eine andere Methode gewählt und direkt von der lokalen Konsole die ersten Seiten der LeiTech - Website abgerufen, einschließlich der Startseite, der "Über uns" - Seite, der Kontaktseite, der Liste der historischen Themen, des MWC26 - Themas, des MWC26 - Siegesberichts und des AWE2026 - Themas. Schließlich hat es ein 320 - Zeilen - Markdown - Dokument erstellt. Inhaltlich hat es die Markenpositionierung, das Medien - Netzwerk, das Benutzerprofil, die Inhaltssektionen, die Kern - Daten, die Fähigkeit zur Berichterstattung über Messen, die Video - Verteilung, das Geschäfts - Kooperationsmodell, die Kooperationsbeispiele und die Kontaktinformationen von LeiTech zusammengefasst.

(Quelle: LeiTech - Grafik)

Obwohl die Seite recht grob ist, ist sie dennoch brauchbar.

Die zweite Aufgabe ging einen Schritt weiter. Es sollte das im vorherigen Schritt erstellte Werbe - Dokument gelesen und ein Werbebericht für LeiTech im Jahr 2026 als PPT erstellt und in HTML - Format ausgegeben werden. Dieser Schritt testet die Fähigkeit zur Ausführung von aufeinanderfolgenden Aufgaben. Wenn der erste Schritt nur von der Webseite zur Markdown - Datei ging, ist der zweite Schritt von der vorhandenen Datei zur strukturierten Darstellung. Das Modell muss die neun Kapitel in der Datei des vorherigen Schritts verstehen und sie in zehn Folien umwandeln, einschließlich der Titelseite, "Über LeiTech", des Medien - Netzwerks, des Inhaltsystems, der Kern - Daten, der globalen Messen, der Video - Strategie, der Geschäfts - Kooperation, der Kooperationsbeispiele und der Kontaktinformationen.

(Quelle: LeiTech - Grafik)

Das endgültige Ergebnis ist eine einzelne HTML - Datei mit etwa 790 Zeilen und einer Größe von fast 40 KB. Sie enthält ein dunkles Tech - Design, blau - lila Akzentfarben, Animationen, die durch das Scrollen ausgelöst werden, eine Punktnavigation auf der rechten Seite, die Möglichkeit, mit den Pfeiltasten der Tastatur zu blättern, ein responsives Layout und die Unterstützung für das Exportieren als PDF. Dies ist kein perfekt ausgearbeiteter Entwurf, aber es ist ein ausführbares, vorschaubares und weiter bearbeitbares Ergebnis. Bezogen auf die Vollständigkeit kann DeepSeek in diesen leichten Aufgaben eingesetzt werden. Seine Stärken sind offensichtlich: Es kann Informationen schnell organisieren, hat gute Fähigkeiten bei der Organisation von langen Dokumenten, versucht, wenn die Tools nicht verfügbar sind, andere Wege zu finden und generiert Markdown - und HTML - Dateien relativ reibungslos. Für Aufgaben wie "Eine Beschreibung schreiben", "Informationen zusammenstellen" oder "Eine Präsentationsseite auf der Grundlage eines Dokuments erstellen" kann es bereits die erste Version erstellen.

(Quelle: LeiTech - Grafik)

Bezüglich der Benutzererfahrung ist es jedoch noch nicht so reif wie das offizielle Modell. Bei Codex + GPT 5.5 funktionieren alle Fähigkeiten in demselben Ökosystem. Das Modell, die Tool - Aufrufe, der Kontext, die visuelle Fähigkeit usw. können reibungslos aufgerufen werden. Aber bei DeepSeek in Codex ist die Verarbeitungsstrecke sehr lang, da es eine Vermittlungsschicht dazwischen gibt. Die Geschwindigkeit ist natürlich langsamer als bei der "offiziellen" Kombination.

Bezüglich der Reaktionsgeschwindigkeit ist DeepSeek in einfachen Text - und Informationsorganisationstasks zwar nicht so langsam, dass es nicht mehr brauchbar ist, aber es ist tatsächlich langsamer als das offizielle Modell. Insbesondere in einem Agent - Workflow wie Codex antwortet es nicht auf einmal, sondern muss während des Tool - Aufrufs auf die Ergebnisse warten und weiter schließen. Da es eine zusätzliche lokale Übersetzungsschicht gibt und die Tool - Aufrufe hin und her gehen, fühlt sich die Geschwindigkeit natürlich langsamer an.

Bezüglich der Kosten war die Erfahrung sehr direkt. Wir haben unserem DeepSeek - Kon

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

Codex ist mit in China entwickelten Open-Source-Modellen kompatibel, und die praktische Integration von DeepSeek hat gezeigt: Die Hürden sind immer noch zu hoch

Möchten Sie ein Drittanbieter - Modell einfach nur mit einem API - Key nutzen? Es ist nicht so einfach.

Wie ist die Erfahrung mit Codex, das von DeepSeek angetrieben wird?