OpenAI hat dringend ein Unternehmen mit 23 Mitarbeitern für die Hummer akquiriert.
Die Krebse sind unglaublich beliebt, und OpenAI lässt auch nicht locker –
Zuerst hat es den "Vater der Krebse" gewonnen, und dann hat es sofort ein neues Unternehmen erworben.
Außerdem zielt es auf das ziemlich bemerkenswerte Sicherheitsproblem von Agenten ab.
Laut Ankündigung von OpenAI ist das erworbenes Unternehmen Promptfoo, ein Startup, das sich auf AI-Sicherheit und -Evaluierung konzentriert.
Mit ein wenig Recherche wird man feststellen, dass dieses Unternehmen in der Open-Source-Community schon recht bekannt ist –
Sein Evaluierungsframework Promptfoo ist eines der beliebtesten Open-Source-Tools im Bereich der AI-Anwendungsbewertung. Es hat über 300.000 Entwicklerbenutzer, und bisher hat es auf GitHub 11.200 Sterne erreicht.
Vor der Übernahme waren auch OpenAI, Anthropic, Amazon und andere treue Benutzer.
Laut dem CTO der B2B-Anwendungen von OpenAI werden mit der Einbindung von "AI-Kollegen" in die tatsächlichen Arbeitsabläufe von Unternehmen die Bewertung, Sicherheit und Compliance zu grundlegenden Anforderungen.
Daher füllt Promptfoo eine wichtige Lücke in OpenAIs "Krebs-Sicherheit" aus.
Nach der Übernahme durch OpenAI wird Promptfoo weiterhin Open-Source bleiben.
Was ist Promptfoo?
Öffentliche Informationen zeigen, dass Promptfoo im Jahr 2024 gegründet wurde und zwei Gründer hat.
Der Mitbegründer und CEO war früher Leiter der LLM-Engineering und der Entwicklerplattform bei Discord. Der Mitbegründer und CTO war früher stellvertretender Leiter der Engineering und AI-Sprecher bei Smile Identity (einem Unternehmen für digitale Identitätsüberprüfung).
Der Grund für die Gründung von Promptfoo war einfach, dass das Team bemerkte:
Die Künstliche-Intelligenz-Systeme werden immer komplexer, aber die Sicherheitstools können nicht mitkommen.
Also beschlossen sie, sich von der Hauptstraße der großen Modelle abzuwenden und Entwicklern und Unternehmen einige AI-Sicherheitsüberprüfungstools anzubieten, um sich von der Konkurrenz abzuheben.
Überraschenderweise war diese Entscheidung richtig.
Nach nur zwei Jahren hat dieses kleine Team von bisher nur 23 Personen beeindruckende Erfolge erzielt –
Mehr als 350.000 Entwickler haben ihre Produkte verwendet, die monatlichen aktiven Benutzer betragen 130.000, und über 25 % der Teams (etwa 125 Unternehmen) aus den Fortune 500 nutzen ihre Produkte.
Und diese Erfolge haben es auch auf dem Kapitalmarkt anerkannt.
Ihre neueste Finanzierungsrunde wurde im Juli 2025 angekündigt. Damals führte die Top-Venture-Kapitalgesellschaft Insight Partners die Runde an, und a16z beteiligte sich. Promptfoo absolvierte eine Serie-A-Finanzierung von 18,4 Millionen US-Dollar (etwa 127 Millionen Yuan).
Laut Daten der Finanzinformationsplattform PitchBook hat Promptfoo seit seiner Gründung 23 Millionen US-Dollar (etwa 158 Millionen Yuan) finanziert. Die Finanzierung im Juli des vergangenen Jahres hat seinen Post-Finanzierungs-Wert auf 86 Millionen US-Dollar (etwa 592 Millionen Yuan) gebracht.
(Hinweis: Der obige Betrag enthält nicht den Kaufpreis dieser Transaktion. Beide Seiten haben die Transaktion noch nicht veröffentlicht.)
Die Tatsache, dass es in kurzer Zeit eine solche Benutzerbasis und Finanzierung erreicht hat, liegt hauptsächlich an seinem Produkt – dem Open-Source-Evaluierungsframework Promptfoo, das wir am Anfang erwähnt haben.
Dieses Framework soll ein reales Problem lösen, mit dem viele AI-Teams konfrontiert sind:
Große Modelle sind sehr nützlich, aber schwer zu testen.
In der traditionellen Softwareentwicklung können Entwickler Unit-Tests und automatisierte Tests durchführen, um die stabile Funktion des Systems sicherzustellen. Aber in der Ära der großen Modelle müssen viele Teams oft nur durch ständiges Testen von Prompts und manuelles Prüfen der Ausgabe das Modell einstellen.
Das ist nicht nur ineffizient, sondern es ist auch schwierig, die Stabilität und Sicherheit nach der Veröffentlichung zu gewährleisten.
Was Promptfoo erreichen möchte, ist es, die AI-Anwendungsüberprüfung zu einem standardisierten Engineering-Prozess zu machen.
Insbesondere umfasst es die folgenden Fähigkeiten:
Erstens automatisierte Evaluierung. Entwickler können verschiedene Prompts und Modelle in Batches testen, und das System bewertet automatisch die Ausgabe.
Zum Beispiel zeigt das folgende Bild, wie Promptfoo die Leistung verschiedener Open-Source-Modelle vergleicht:
Zweitens AI-Red-Team-Übungen. Das System simuliert verschiedene Angriffe, die reale Benutzer möglicherweise starten, um potenzielle Sicherheitslücken in LLM-Anwendungen frühzeitig zu entdecken und einen vollständigen Sicherheitslückenbericht zu erstellen.
Drittens Engineering-Integration. Promptfoo kann direkt in den Entwicklungsprozess integriert werden. Beispielsweise kann es automatisch Modelltests im CI/CD-Prozess ausführen, Sicherheitsfragen im Zusammenhang mit LLM beim Code-Commit automatisch scannen und die Evaluierungsergebnisse an das Team weitergeben.
Kurz gesagt, versucht Promptfoo, den bisher eher mystischen "Prozess des Einstellens von Prompts und Testens von Modellen" in ein wiederholbares und quantifizierbares Engineering-System zu verwandeln, ähnlich wie bei der Softwareüberprüfung.
Beim Einsatz bietet es sowohl eine webbasierte visuelle Oberfläche als auch eine Befehlszeilenschnittstelle (CLI). Entwickler können direkt auf lokalen Rechnern oder Servern umfangreiche Evaluierungsaufgaben ausführen.
Promptfoo sagt, dass es langfristig das Ziel hat, dass dieses Framework zum "Standardtool" im Bereich der Künstlichen Intelligenz wird, genauso unverzichtbar wie CI (Continuous Integration) im Bereich von DevOps.
Bei jeder Einführung eines neuen Modells, Änderung eines Prompts oder Integration eines neuen Tools wird das System es automatisch evaluieren und Red-Team-Tests durchführen und je nach Ergebnis des Sicherheitsberichts entscheiden, ob es freigegeben oder blockiert wird.
In der heutigen Ära der Agenten, oder sagen wir in der "Krebs-Ära", wird die Rolle von Promptfoo offensichtlich immer wichtiger.
Tatsächlich haben sie seit der Serie-A-Finanzierung im vergangenen Jahr ihren Fokus auf Agenten gelegt. Damals beobachteten sie:
Das Internet wird für Agenten neu strukturiert.
Konkret zeigt sich dies in vier Trends: Zusammenarbeit mehrerer Agenten, MCP wird zum Standardprotokoll, Ausbruch der Sprachinteraktion, testgetriebene Entwicklung.
Basierend auf diesem Hintergrund wird die Mission von Promptfoo immer deutlicher – von einem Prompt-Evaluierungstool zu einer Sicherheitsinfrastruktur in der Ära der Agenten zu werden.
Und das entspricht genau OpenAIs Planung in der "Krebs-Ära".
"Die ersten, die Krebse züchten, können nicht schlafen"
Warum OpenAI jetzt ein solches Unternehmen erworben hat, liegt auf der Hand.
Zusammengefasst gibt es zwei Gründe:
Erstens sind die Krebse unglaublich beliebt, und alle versuchen, sich in diesem Bereich zu positionieren (OpenAI natürlich auch);
Zweitens wird das Sicherheitsproblem der Agenten unter der großen Beliebtheit immer dringlicher.
Wie beliebt die Krebse sind, braucht nicht weiter erklärt zu werden. Lassen Sie uns über das Sicherheitsproblem sprechen.
Seit dem berühmten E-Mail-Löschungsfall sind die Risiken der Krebse zunehmend deutlich geworden.
Letztendlich liegt das Problem nicht an den Modellen selbst, sondern daran, dass Agenten wie die Krebse zu viele Rechte haben.
Frühere große Modelle waren meist nur für die Inhaltserzeugung zuständig. Selbst wenn die Antworten fehlerhaft waren, blieb die Auswirkung im Wesentlichen auf die Informationsebene beschränkt – am schlimmsten sagten sie etwas falsches oder beantworteten nicht die Frage, also das sogenannte "Hallenphänomen".
Aber die Krebse sind anders.
Um die Aufgaben wirklich zu erfüllen, erhalten sie oft viele Rechte für reale Weltoperationen, wie den Zugang zu E-Mail, Dokumenten und Datenbanken, die Nutzung verschiedener APIs und Unternehmenswerkzeuge... All das sind die sensibelsten und wichtigsten digitalen Vermögenswerte in Ihrem Arbeits- und Privatleben.
Das bedeutet, dass wenn es zu Fehlurteilen oder Manipulation durch böswillige Prompts kommt, das Problem nicht nur "ungenaue Antworten" sein kann, sondern auch reale operative Fehler.
Wie groß das Risiko ist, braucht wohl nicht weiter erklärt zu werden (kein Wunder, dass viele Menschen es nicht nutzen wollen oder einen separaten Rechner brauchen).
Wenn Privatpersonen so vorsichtig sind, wie viel größer wird das Risiko für Unternehmen sein, wenn immer mehr Unternehmen ihre Geschäftsprozesse an Agenten übergeben.
Gerade heute ist ein Thema auf der Weibo-Hotlist aufgetaucht – "Die ersten, die Krebse züchten, können nicht schlafen", was sich auf die beiden oben genannten Punkte bezieht (natürlich liegt der Schwerpunkt auf dem Sicherheitsproblem).
Schauen wir uns an, wie OpenAI dieses Problem löst –
Da die Krebse beliebt sind, hat es schnell den "Vater der Krebse", Peter Steinberger, gewonnen, und der CEO, Altman, hat angekündigt, dass er sich stark in den Bereich der Agenten-Zusammenarbeit begeben wird.
Wenn die Krebse Fehler machen (z. B. löschen sie heimlich die E-Mails des Sicherheitsdirektors von Meta AI), dann kauft es einfach Promptfoo, ein fertiges Unternehmen für die Agenten-Sicherheit.
Laut der gemeinsamen Ankündigung wird die Technologie von Promptfoo in OpenAI Frontier integriert, das von OpenAI speziell für die Erstellung und den Betrieb von Agenten entwickelt wurde.
Nach der