Google hat das "Agent Skill Super Toolbox" Open Source gemacht. Cloud, Bibliothek, Engine und KI sind vollständig verbunden. Entwickler sind überglücklich.
Letztes Freitag hat OpenAI die Veröffentlichung von GPT-5.5 und DeepSeek die Einführung des V4-Modells fast gleichzeitig durchgeführt. Der Wettbewerb auf dem Markt für Large Language Models (LLMs) hat nun einen heißen Draht erreicht.
Angesichts der schnellen Iteration ihrer Konkurrenten suchen Technologie-Praktiker in der Google-Ökosystem aktiv nach Lösungen. Immer mehr Menschen beginnen, sich des Agenten (Intelligent Agent) zu bedienen, um Anwendungen auf der Google Cloud Platform zu bauen und zu optimieren, von Firebase, Gemini API bis hin zu BigQuery und Google Kubernetes Engine (GKE).
Es ist jedoch zu beachten, dass in einem Kontext zunehmenden Wettbewerbs und rascher technologischer Entwicklung eine zentrale Frage besonders hervortritt: Wie kann man sicherstellen, dass das Modell genaue und aktuelle Informationen über diese Technologien besitzt?
In der praktischen Entwicklung ist dieses Problem schwieriger zu lösen, als man ursprünglich annimmt.
Entwickler müssen oft Adapter für jeden Cloud-Service schreiben, die API-Aufrufe in Funktionen verpacken, die der Agent aufrufen kann. Anschließend müssen sie wiederholt testen, ob das Modell die Tools korrekt aufruft und die richtigen Parameter übergibt. Was noch ärger ist, müssen alle Adapter manuell aktualisiert werden, sobald sich die API des zugrunde liegenden Dienstes ändert. Dies ist nicht nur redundant, sondern auch eine versteckte technologische Schuldenlast.
Um dieses Problem zu lösen, bietet Google für die Entwicklerdokumentation einen Model Context Protocol (MCP)-Server an, der es Agenten ermöglicht, sich an zuverlässige Echtzeitinformationsquellen anzuschließen. Dies bringt jedoch eine neue Herausforderung mit sich, die als "Kontext-Überblähung" (Context Inflation) bezeichnet wird.
Der Kernwert des MCP-Servers liegt darin, dass er das Modell mit sofortigen externen Informationen versorgt.
Allerdings hat er auch seine Grenzen: Wenn Agenten den MCP-Server in großem Maßstab nutzen, werden eine große Menge an Kontextinformationen ununterschieden in das Kontextfenster des Modells geladen. Dies hat zwei ernste Folgen: Erstens kann zu viel Information das Modell verwirren und die Inferenzqualität verringern - dieses Problem wurde in Unternehmenspraktiken wiederholt bestätigt. Ein Team hat festgestellt, dass der Agent bei jedem Aufruf 15.000 Tokens an Anweisungen lädt, was praktisch keinen Kontextraum für den tatsächlich zu verarbeitenden Inhalt lässt. Zweitens wird jedes Mal, wenn das Kontextfenster gefüllt wird, ein realer Token-Kostenfaktor. Mit zunehmender Anzahl von Aufrufen wird die Kostenkurve nicht mehr zu vernachlässigen.
Angesichts dieser Herausforderung besteht ein dringender Bedarf an einer präziseren Informationsversorgungsmethode, die es Agenten ermöglicht, das benötigte Fachwissen zu erwerben, ohne von überflüssigen Informationen überflutet zu werden.
Genau hier setzt der Hintergrund für die Entstehung von Agent Skills an.
Google's offizielle Skill-Bibliothek geht live
Was genau sind also die Skills eines Agenten?
Nach der offiziellen Definition ist ein Skill ein "einfaches und offenes Format, um Agenten neue Fähigkeiten und Fachwissen zu verleihen". Man kann es als eine vereinfachte, auf den Agenten ausgerichtete Dokumentation für eine bestimmte Technologie oder Aufgabe verstehen.
Die Design-Philosophie von Skills lässt sich in zwei Sätzen zusammenfassen: Schreiben Sie in Markdown und halten Sie es leichtgewichtig; laden Sie nur bei Bedarf, um Redundanz zu vermeiden. Jede Skill-Datei kann Referenzdokumente, Code-Schnipsel und andere Ressourcen enthalten. Der Agent lädt die relevanten Informationen nur, wenn er sie benötigt, was das Risiko eines Überlastens des Kontextes erheblich verringert.
Technologisch gesehen nimmt Skills eine einzigartige Position ein. Sie stehen über traditionellen Prompts, da Skills wiederverwendbar und dauerhaft sind; leichter als Fine-Tuning, da sie sich mit der Geschwindigkeit der Geschäftslogik iterieren lassen; aktiver als RAG (Retrieval Augmented Generation), da es sich nicht um eine passive Informationssuche, sondern um eine aktive Fachwisseneingabe handelt; und reicher als normale Tools, da sie nicht nur codieren, was getan werden soll, sondern auch, wie und warum es getan wird.
Am ersten Tag der Google Cloud Next 2026-Konferenz hat Google offiziell die Veröffentlichung der Google offizielle Agent Skills-Bibliothek angekündigt.
Diese Ankündigung gilt als eine der praktischsten Veröffentlichungen der diesjährigen Konferenz.
Die Projektadresse lautet: github.com/google/skills.
Dieses Code-Repository enthält 13 Skills, die die wichtigsten Dienste von Google Cloud abdecken: AlloyDB, BigQuery, Cloud Run, Cloud SQL, Firebase, Gemini API und Google Kubernetes Engine (GKE).
Diese Skills helfen dem Agenten zu verstehen, wie man Cloud-Ressourcen erstellt, abfragt und verwaltet. Sie bilden die Grundlage für die Fähigkeiten des Agenten, die Google Cloud-Infrastruktur zu bedienen.
Es gibt auch drei Skills, die die architektonischen Säulen darstellen.
- Sicherheit (Security): Der Agent lernt die besten Praktiken für Cloud-Sicherheit kennen, einschließlich Identitäts- und Zugriffsverwaltung, Datenverschlüsselung und Bedrohungsschutz.
- Zuverlässigkeit (Reliability): Dies umfasst die Gestaltung von hochverfügbaren Architekturen, Fehlertoleranzmechanismen und Katastrophenwiederherstellungsstrategien.
- Kostensenkung (Cost Optimization): Der Agent wird in der Lage sein, bei architektonischen Entscheidungen die Ressourceneffizienz und die Kostenkontrolle zu berücksichtigen.
Der Schwerpunkt dieser drei Säulen-Skills liegt nicht darin, dem Agenten zu lehren, wie er eine bestimmte API aufruft, sondern ihm zu helfen, die Prinzipien und Entscheidungslogik der Cloud-Systemgestaltung zu verstehen, um so die Qualität der Anwendungen auf einer höheren Ebene zu verbessern.
Darüber hinaus bietet das Repository drei Prozessleitfäden für häufige Aufgaben: Einstieg in Google Cloud (Onboarding to Google Cloud), Authentifizierung bei Google Cloud (Authenticating to Google Cloud) und Netzwerkbeobachtbarkeit bei Google Cloud (Google Cloud Network Observability). Diese "Geheimnisse" zerlegen die alltäglichen Vorgänge in ausführbare Schritte, damit der Agent bestimmte Aufgaben nach einem festgelegten Prozess ausführen kann.
Was bringt Agent Skills?
Um den wahren Wert von Agent Skills zu verstehen, betrachten wir die reale Entwicklungsumgebung.
Im Jahr 2026 unterscheidet sich die tatsächliche Situation bei der Entwicklung von Agenten stark von den Demonstrationen: Entwickler verbringen viel Zeit mit dem Schreiben und Warten von Tool-Adaptern. Eine Entwicklerin, die einen Dokumentenverarbeitungs-Agenten entwickelt, hat angegeben, dass sie mehr Zeit damit verbringt, die Adapter zu warten, als mit der Entwicklung der Agentenlogik selbst.
Die Skills-Bibliothek wurde genau für dieses Problem entwickelt. Die offiziellen Skills wurden anhand realer Modelle getestet und optimiert. Google hat bestätigt, dass sie zuverlässig auf Gemini laufen. Gleichzeitig sind die Skills MCP-kompatibel und können plattformübergreifend verwendet werden, nicht nur auf Vertex AI. Wenn sich die zugrunde liegende Cloud-API ändert, aktualisiert Google die entsprechenden Skills, und die Entwickler müssen keine Wartungsarbeiten durchführen. Darüber hinaus verwenden die Skills direkt die vorhandenen GCP-Anmeldeinformationen, ohne dass zusätzlicher Authentifizierungscode geschrieben werden muss.
In Bezug auf die Kompatibilität zeigen die Skills eine starke plattformübergreifende Fähigkeit. Mit dem Befehl "npx skills install github.com/google/skills" können Entwickler diese Skills in verschiedene Agentenplattformen installieren, einschließlich Antigravity, Gemini CLI und Drittanbieter-Agenten-Tools wie Claude Code und Cursor.
Die kürzlich veröffentlichte Antigravity-Plattform hat das Skills-System tief integriert und unterstützt die Transformation eines allgemeinen Agenten in einen professionellen, robusten und effizienten Arbeitskollegen über drei Ebenen: Regeln (Rules), Skills und Workflows. Gleichzeitig unterstützt die Gemini CLI nun die Skills nativ, sodass Entwickler spezialisierte Skills direkt in der Befehlszeile aufrufen können.
Schauen wir uns ein konkretes Beispiel an. Jeder Skill enthält:
Tests an realen Modellen - nicht einfach nur "hier ist eine Funktion", sondern optimierte Beschreibungen, die von Google getestet wurden und stabil mit Gemini kompatibel sind. MCP-Kompatibilität - Sie entsprechen dem Model Context Protocol (MCP) und können daher plattformübergreifend verwendet werden, nicht nur auf Vertex AI. Versionskontrolle und Wartung - Wenn sich die zugrunde liegende Cloud-API ändert, aktualisiert Google die Skills, ohne dass der Benutzer es selbst tun muss. Vorkonfiguration - Sie verwenden die vorhandenen GCP-Anmeldeinformationen, ohne dass benutzerdefinierter Autorisierungscode erforderlich ist.
Zum Beispiel sieht der BigQuery-Skill in der Praxis so aus:
Vergleichen wir dies mit dem, was man schreiben müsste, wenn man diesen Skill nicht verwendet:
Für jedes Projekt muss man möglicherweise vier bis zehn solcher Tool-Codes schreiben. Die Skill-Bibliothek kann Ihnen all diesen Code ersparen.
Tatsächlich hat Addy Osmani, Leiter der Google Cloud AI und Leiter des Gemini-Projekts, bereits vor der Veröffentlichung der offiziellen Agent Skill-Bibliothek von Google auf LinkedIn die Veröffentlichung einer Agent Skills-Bibliothek angekündigt: 19 Engineering-Skills + 7 Befehle für AI-Coding-Agenten, inspiriert von Google's besten Praktiken.
Projektadresse: https://github.com/addyosmani/agent-skills
Er schrieb in seinem Artikel: "Wir wissen, dass AI-Coding-Agenten sehr leistungsfähig sind. Aber wenn man sie frei spielen lässt, nehmen sie Kürzungen - sie überspringen Spezifikationen, Tests und Sicherheitsüberprüfungen. Sie streben eher nach 'Fertigstellung' als nach 'Richtigkeit'. Deshalb habe ich die Agent Skills entwickelt. Jeder Skill codiert die Arbeitsabläufe, Qualitätskontrollen und besten Praktiken, die erfahrene Ingenieure tatsächlich verwenden: Definieren Sie die Spezifikation vor dem Coding, testen Sie vor dem Zusammenführen und messen Sie vor der Optimierung. All dies ist so verpackt, dass Ihr Agent es konsequent befolgen kann."
Vollständige Lebenszyklusabdeckung:
→ Define (Definieren) - Polieren Sie Ihre Idee und schreiben Sie die Spezifikation, bevor Sie die erste Zeile Code schreiben.
→ Plan (Planen) - Zerlegen Sie die Aufgabe in kleine, überprüfbare Teilaufgaben.
→ Build (Bauen) - Inkrementelle Implementierung, Kontext-Engineering, klare API-Design, Testgetriebene Entwicklung (TDD).
→ Verify (Verifizieren) - Verwenden Sie DevTools für Browser-Tests und systematische Fehlersuche.
→ Review (Überprüfen) - Code-Qualität, Sicherheitsstärkung, Leistungsoberprüfung.
→ Ship (Liefern) - Git-Arbeitsablauf, CI/CD, Architekturentscheidungsdokumentation (ADR), Checkliste vor der Veröffentlichung.
Diese Skills sind kompatibel mit Claude Code, Cursor, Antigravity und jedem Agenten, der Markdown-Anweisungen akzeptiert.
Addy Osmannis Agent Skills-Code-Repository teilt die Arbeitsgewohnheiten von erfahrenen Google-Ingenieuren in 20 kombinierbare Skills auf, um die AI bei jedem Schritt an die Ingenieursstandards zu halten.
Der Open-Source-Projekt von Addy Osmani hat bisher fast 24.000 Sterne auf Github erhalten.
Was unterscheidet diese beiden von Google stammenden Agent Skills-Code-Repositories, und welche Probleme lösen sie jeweils?
Osmannis Projekt löst das Problem, "wie man es richtig baut" - es ist ein allgemeines Ingenieurdisziplin-Framework, das sicherstellt, dass das Agenten-Coding-Verhalten professionellen Standards entspricht. Unabhängig von der Cloud-Plattform oder der Art der Softwareentwicklung können diese Skills Ihrem Agenten helfen, sich an Spezifikations-getriebene Entwicklung, inkrementelle Implementierung, Test-first-Praktiken und andere professionelle Praktiken zu halten.
Das von Google offiziell veröffentlichte Agent Skills-Repository löst das Problem, "was man bauen und wie man es bedienen soll" - es bietet spezifisches Handlungswissen für einen bestimmten Technologiestack (Google Cloud). Wenn der Agent ein BigQuery-Dataset erstellen, einen GKE-Cluster konfigurieren oder einen Cloud Run-Service