Gerade jetzt hat Anthropic in der späten Nacht eine Branche mit einem Volumen von 50 Milliarden US-Dollar durchkreuzt. Das Ende der Code-Audits ist angebrochen.
Gerade jetzt hat es im globalen KI-Bereich ein Erdbeben gegeben: Eine neue Funktion von Anthropic hat die traditionelle Branche der Code-Audits im Wert von 50 Milliarden US-Dollar direkt aus dem Spiel geschmissen! Traditionelle Sicherheitsanbieter, die einen Jahresbeitrag von 50.000 US-Dollar verlangen, werden nun komplett ersetzt. Das neue Tool kostet mindestens nur 15 US-Dollar.
Gerade jetzt hat Anthropic wieder etwas unternommen!
Der Vater von Claude Code hat eine sensationelle Ankündigung gemacht: Claude Code hat eine neue Funktion für Code-Reviews (Code-Bewertungen) hinzugefügt.
Diesmal hat es sich auf eine Branche im Wert von 50 Milliarden US-Dollar gerichtet - die Code-Sicherheitsüberprüfung.
Die neu veröffentlichte Funktion von Anthropic stellt mit einer äußerst einfachen und drastischen Methode eine direkte Herausforderung an die gesamte Code-Sicherheitsbranche.
Manche haben geschrien: Die Branche im Wert von 50 Milliarden US-Dollar wurde von Anthropic in einer Nacht umgekrempelt!
Jetzt kann man sich darauf freuen, wie die Aktien von Sicherheitsunternehmen stark fallen.
Bei Anthropic hat fast jeder Pull Request (PR) dieses System getestet.
Nach Monaten des Testens sind die Ergebnisse wie folgt:
Der Anteil der PRs mit substantiellen Review-Kommentaren ist von 16 % auf 54 % gestiegen.
Der Anteil der PRs, bei denen die Ingenieure die Review-Ergebnisse für fehlerhaft hielten, lag bei weniger als 1 %.
Bei großen Pull Requests (über 1.000 Zeilen) wiesen 84 % der PRs oberflächliche Probleme auf, und durchschnittlich waren es 7,5 Probleme pro PR.
Derzeit ist diese Funktion als Forschungsvorschau in der Claude Team- und Enterprise-Testversion verfügbar.
Der Albtraum eines Marktes von 50 Milliarden US-Dollar
Dieses Produkt von Anthropic hat eine geschichtsträchtige Erschütterung im globalen KI-Bereich und in der Netzwerksicherheitsbranche (AppSec) ausgelöst.
Erfahrene Entwickler haben geschrien, dass die Branche der Code-Audits im Wert von 50 Milliarden US-Dollar zerstört wurde!
Dies liegt daran, dass in der Vergangenheit große Unternehmen, um zu verhindern, dass Bugs oder Sicherheitslücken im Code in die Produktionsumgebung gelangen, traditionellen Sicherheitsanbietern (wie Snyk, Checkmarx usw.) jährlich eine Lizenzgebühr von bis zu 50.000 US-Dollar oder sogar mehr zahlten und professionelle Teams einstellten, um Scans und Audits durchzuführen.
Jetzt kann Claude jedoch einfach ein Team von KI-Agenten in Ihren PR einschleichen und 24 Stunden am Tag bereit sein.
Außerdem beträgt die durchschnittliche Kosten pro Review, berechnet nach Tokens, nur 15 - 25 US-Dollar!
Der Unterschied zwischen 50.000 US-Dollar und 25 US-Dollar beträgt das 2.000-fache.
Dies ist kein einfacher Funktionsupdate, sondern das Ende der traditionellen Code-Audits.
Code Review - der schmerzlichste Teil für Entwickler
Wenn Sie eine beliebige Ingenieurgruppe fragen: Welcher Teil ist der größte Engpass bei der Softwareentwicklung?
Ich glaube, viele würden sagen, es ist der Code Review.
In den letzten Jahren hat die Fähigkeit von KI, Code zu schreiben, sich rasant entwickelt. Ob GitHub Copilot, Cursor, Claude Code oder ChatGPT - Entwickler, die diese Tools nutzen, haben die Menge des geschriebenen Codes sprunghaft erhöht.
Das Problem ist nun, dass zwar der Code schnell produziert wird, aber die Anzahl der Personen, die den Code überprüfen, nicht zugenommen hat.
Anthropic hat festgestellt, dass in den letzten 12 Monaten die Codeproduktion pro Ingenieur um 200 % gestiegen ist, aber viele PRs (Pull Requests) wurden nur flüchtig überflogen.
Selbst die Entwickler geben zu, dass viele Code Reviews nur formell durchgeführt werden.
So werden viele Bugs, Sicherheitslücken und logische Probleme in die Produktionsumgebung eingeschleust.
Deshalb sind viele Unternehmen bereit, enorme Summen für Sicherheits-Scanning-Tools auszugeben.
Aber es gibt ein Problem - diese Tools sind nicht sehr intelligent.
Was sind die Probleme bei traditionellen Code-Scanning-Tools?
Wenn Sie traditionelle AppSec-Tools wie Snyk, Checkmarx, Veracode, SonarQube usw. verwendet haben, werden Sie wahrscheinlich feststellen, dass es zu viele Falschalarme gibt.
Der Grund ist, dass die meisten dieser Tools auf statischen Regeln und bekannten Sicherheitslückenbibliotheken basieren. Sie können den Code scannen, aber ihn nicht wirklich verstehen.
Oft passiert es, dass das Tool eine Warnung ausgibt, dass es möglicherweise ein SQL-Injection-Risiko gibt, aber der Entwickler nach langer Prüfung feststellt, dass es kein Problem gibt.
Deshalb beginnen die Leute allmählich, die Warnungen zu ignorieren, und die wirklich gefährlichen Probleme werden oft übersehen.
Deshalb benötigen Unternehmen immer noch viele manuelle Code Reviews, und was Anthropic diesmal macht, ist, diese Aufgabe zu automatisieren.
Anthropic setzt eine Armee von KI-Code-Reviewern ein
Diesmal ist der Ansatz von Claude Code Review ziemlich einfach.
In Claude Code kann das System Pull Requests automatisch analysieren und von mehreren Perspektiven überprüfen, beispielsweise:
Ob der Code der Projektregeln entspricht
Ob es potenzielle Bugs gibt
Ob die Änderungen mit der Logik des historischen Codes in Konflikt stehen
Ob die Probleme, die in früheren PRs aufgetreten sind, erneut auftreten
Am Ende werden zwei Ergebnisse ausgegeben: Ein hochwertiges Zusammenfassungs-Kommentar und ein Inline-Kommentar an der spezifischen Code-Position.
D.h., wenn Sie einen PR öffnen, können Sie einen KI-Review-Bericht sehen und die wirklich wichtigen Probleme entdecken, anstatt Blätter voller unsinniger Details.
Die Zeit von "KI schreibt Code, KI überprüft Code" ist endlich da.
Claude zeigt Anzeichen von Selbstzyklus und Selbstrekursion.
Mit der zunehmenden Stärke der KI-Fähigkeiten könnte die einzige Aufgabe der Menschen in Zukunft nur noch das Einschalten der KI sein, und es würde nur noch eine Claude-Taste auf der Tastatur geben.
Multi-Agent-System - Die Claude Code-Review-Armee zieht aus
Das größte Merkmal von Claude Code Review ist, dass es nicht eine einzelne KI ist, sondern ein Team.
Wenn ein PR erstellt wird, startet das System automatisch ein Team von KI-Agenten.
Demzufolge wird die neue Code-Review-Funktion von Claude mehrere KI-"Review-Agenten" parallel einsetzen, wobei jeder Agent für einen anderen Typ von Überprüfung zuständig ist.
Diese Agenten filtern Falschalarme durch Validierung und sortieren die Fehler nach ihrer Schweregrad. Das endgültige Ergebnis wird als ein hochwertiges zusammenfassendes Kommentar sowie als Inline-Kommentare zu bestimmten Fehlern im PR angezeigt.
Das Review-Format wird je nach Größe des PR angepasst.
Große oder komplexe Änderungen erhalten mehr Agenten und eine tiefere Prüfung; kleine Änderungen werden schnell durchgelassen. Laut den Tests von Anthropic beträgt die durchschnittliche Review-Zeit etwa 20 Minuten.
Schließlich kann durch die gegenseitige Validierung der Multi-Agenten die Anzahl der Falschalarme reduziert werden.
In diesem Prozess sucht es insbesondere nach logischen Fehlern, Sicherheitslücken, Randbedingungen (Edge Cases) und verborgenen Regression-Problemen.
Alle gefundenen Probleme werden mit Schweregrad (Severity) markiert.
Rote Punkte stellen normale Probleme dar, d.h. Bugs, die vor dem Zusammenführen des Codes behoben werden sollten;
Gelbe Punkte stellen leichte Probleme dar, die behoben werden sollten, aber das Zusammenführen nicht verhindern;
Lila Punkte stellen bestehende Probleme dar, d.h. Bugs, die nicht durch diesen PR eingeführt wurden.
Jedes Review-Kommentar enthält auch eine entfaltbare Begründung (extended reasoning).
Wenn Sie es entfalten, können Sie sehen:
Warum Claude dieses Problem markiert hat
Wie es überprüft hat, dass dieses Problem tatsächlich existiert