StartseiteArtikel

Unbegrenzte kostenlose Nutzung. Die Top 10 AI-Lab weltweit öffnen die Full-Modal-API. Ich habe es schon für dich getestet.

智东西2026-06-01 14:16
Kostenlose Generierung von Code, Bildern und Videos!

Tokenmaxxing“ (Maximierung des Token-Verbrauchs) wird zur neuen Modewort in der Entwickler-Community. Das Token-Budget gilt als neues Maß für die Tiefe der AI-Nutzung. Ein CEO eines Start-ups hat sogar seine Anthropic-Rechnung auf LinkedIn gepostet, um die AI-Intensität seines Unternehmens zu beweisen.

Quelle: Swan AI CEO Amos Bar-Joseph

Allerdings wird eine entscheidende Frage übersehen: Was schaffen wir eigentlich mit Tokens?

Die Kosten steigen tatsächlich stark. Goldman Sachs prognostiziert, dass der Token-Verbrauch in den nächsten Jahren um mehr als das 24-fache steigen könnte. Der Vizepräsident für angewandtes Deep Learning bei Nvidia gestand sogar, dass die AI-Kosten inzwischen die Gehälter des Teams übersteigen.

Quelle: Goldman Sachs

Aber wie ist die Qualität der Ergebnisse? Die Daten geben eine nicht allzu optimistische Antwort.

Der Bereich des Code-Generierens ist besonders repräsentativ. Waydev verfolgte über 50 Unternehmen und stellte fest, dass die langfristige Beibehaltungsrate von AI-generiertem Code nur 10 % bis 30 % beträgt. Ein Bericht von GitClear ist noch direkter: Die Nachbearbeitungsmenge von starken AI-Nutzern ist 9,4-mal höher als die von Nicht-AI-Nutzern. Eine Statistik von Jellyfish zeigt, dass einige Teams die Code-Durchsatzrate verdoppelten, aber dafür die Token-Kosten um fast das 10-fache erhöhten.

Die Zunahme der Code-Umarbeitung überschreitet die Produktivitätszunahme. Datenquelle: GitClear

Wenn der Token-Verbrauch weiter steigt, wird das Verhältnis von Input zu Output besonders wichtig. Die Token-Angst wird zu einer realen Hürde für die Umsetzung von AI.

In dieser sich ausbreitenden „Token-Angst“ fällt die Aktion von Agnes AI besonders auf – dieses weltweit neun-rangierte AI-Labor hat angekündigt, ab dem 1. Juni seine API für alle multimodalen Modelle unbefristet kostenlos bereitzustellen.

01. Wenn Tokens immer teurer werden, setzt ein AI-Labor die Rechnung auf Null

Agnes AI öffnet diese Zeit seine drei Kernmodelle: das Textmodell Agnes-2.0-Flash, das Bildmodell Agnes-Image-2.0-Flash und das Videomodell Agnes-Video-V2.0.

Ab dem 1. Juni wird die API der oben genannten Modelle unbefristet für Entwickler weltweit kostenlos zur Verfügung stehen. Für kleine und mittlere Teams, unabhängige Entwickler und Schöpfer verschwindet die Kostenbarriere für den Zugriff auf die Modelle vollständig, und der Spielraum für Experimente wird stark erweitert.

Nach Ansicht von Agnes AI sollte hochwertige AI nicht nur Großunternehmen mit hohem Budget vorbehalten sein. Agnes AI möchte durch die kostenlose Bereitstellung der API für alle multimodalen Modelle in Text, Bild und Video ermöglichen, dass begrenztes Budget eher für Produktinnovation und Funktionsentwicklung verwendet wird.

02. Text, Bild und Video werden gemeinsam geöffnet. Lassen Sie uns die Leistung direkt testen.

Nach der Beseitigung der Kosten ist den Entwicklern die Frage wichtig: Wie gut sind die Modelle tatsächlich? Wir haben das Text-, Bild- und Videomodelle getestet.

  • Textmodell: 1M lange Kontextfenster, schnelle Erstellung von Produktivitätsszenarien

Agnes-2.0-Flash unterstützt 1M Kontextfenster und Tool-Aufrufe und deckt Szenarien wie Codeentwicklung, Unternehmenswissensdatenbanken, intelligente Kundenservice, Dokumentenverarbeitung und Agent-Arbeitsabläufe ab. Um die Leistung dieser Fähigkeiten in realen Szenarien zu testen, haben wir Tests in den Bereichen Code-Generierung, Webseiten-Erstellung und Frontend-Design durchgeführt.

Zuerst schauen wir uns die Programmierfähigkeit an. Wir haben Agnes-2.0-Flash gebeten, ein Flugzeugkampfspiel als Webseite zu generieren.

Das Modell hat nicht nur ein komplettes Spielgerüst (Kampfflugzeuge, Gegner, Bosskämpfe, Punktesystem, Lebenspunkte) erstellt, sondern auch automatisch Kombinationshinweise, Partikelexplosionen, einen dynamischen Sternenhimmel als Hintergrund und Soundeffekte hinzugefügt. Der Abschlussgrad ist weit höher als bei einem normalen Demo und nahe an einem spielbaren Produkt.

Im zweiten Test haben wir die Richtung geändert. Mit nur einem Hinweiswort hat Agnes-2.0-Flash die Erstellung einer SBTI-Persönlichkeitstest-Website abgeschlossen.

Die Website enthält einen kompletten Testablauf, Logik zur Ergebnisberechnung und Seiten zur Anzeige der Persönlichkeitstypen. Benutzer können direkt nach Abschluss der Fragen ihre Ergebnisse einsehen. Das Endergebnis ähnelt stark gängigen Online-Persönlichkeitstestprodukten.

Aus den beiden obigen Beispielen geht hervor, dass Agnes-2.0-Flash sowohl Webspiele als auch Testwebsites relativ schnell erstellen kann.

Als nächstes erhöhen wir die Schwierigkeit und legen den Schwerpunkt auf die Fähigkeiten im Frontend-Design und in der Erstellung von Produktoberflächen.

Der dritte Test betrifft eine Website zur Präsentation von Fotografien. Das generierte Ergebnis macht einen guten ästhetischen Eindruck. Das Gesamtlayout und der visuelle Stil nähern sich bereits vielen Websites von unabhängigen Fotografen.

Wenn das Testen der ästhetischen und Layoutfähigkeiten ist, dann erfordert ein soziales Produkt mehr die Fähigkeit für komplexe Interaktionen. Deshalb haben wir Agnes-2.0-Flash gebeten, eine soziale Teiler-Website ähnlich X zu generieren.

Die generierte Seite enthält mehrere Kernmodule wie Informationsfluss, Suchfeld, Follower-Button, Seitenleiste und empfohlene Inhalte. Die Buttons für Follower und Likes können auch entsprechende Animationsreaktionen auslösen. In Bezug auf die visuelle Darstellung und die Interaktionsexperience ähnelt das Design stark dem von X.

Insgesamt kann Agnes-2.0-Flash die Anforderungen für die frühe Validierung und Präsentation vieler Projekte als Produkt-Demo oder Frontend-Prototyp erfüllen.

  • Bildmodell: Schwerpunkt auf Bearbeitbarkeit, Abdeckung von Porträtretuschen, E-Commerce-Bildern und Infografiken

Agnes-Image-2.0-Flash unterstützt Fähigkeiten wie Bildbearbeitung, Mehrbildfusion, Hintergrundersetzung, lokale Bearbeitung, Textänderung und Stilumwandlung und eignet sich für häufige Szenarien wie E-Commerce-Hauptbilder, Werbedesign, Produktposter und Inhaltserstellung für soziale Medien.

Wir haben zunächst eine Aufgabe zur Umgestaltung von Personenbildern versucht, um die Bearbeitungsfähigkeit des Modells in der Nahaufnahme von Portraits zu testen. Das Modell sollte die ursprünglichen Identitätsmerkmale der Person beibehalten und sie gleichzeitig in den Stil eines K-Pop-Iddols auf der Bühne umgestalten.

Das Ergebnis zeigt, dass die Gesichtskonsistenz stabil bleibt, während die Personendarstellung stark geändert wird. Gleichzeitig werden die Hauttextur, die Licht- und Schattenebenen sowie die Kamerasensation verstärkt, und die Person sieht näher an professionelle fotografische und kommerzielle visuelle Werke aus.

Im zweiten Test haben wir uns auf das E-Commerce-Design konzentriert. Wir haben ein Originalfoto eines Haaröls hochgeladen und das Modell gebeten, ein komplettes E-Commerce-Poster zu generieren.

Das generierte Ergebnis behält nicht nur das Produkt und das Markenlogo, sondern ergänzt automatisch die Produktvorteile, visuelle Dekorationselemente und ein E-Commerce-typisches Layout. Das fertige Bild hebt das Produkt hervor, verstärkt das Licht und die Textur und fügt dem Hintergrund visuelle Elemente hinzu, die zur Produktstimmung passen. Für E-Commerce-Betreiber, Markenmarketing- und Inhaltsteams kann diese Fähigkeit die Arbeit bei der Fotografie, Retusche und Layoutgestaltung reduzieren.

Infografiken stellen eine komplexere Herausforderung für das Bildmodell dar. Deshalb haben wir zwei Gruppen von Infografikaufgaben in verschiedenen Richtungen entworfen.

Die erste Gruppe von Tests betrifft Flussdiagramme und Wissensvermittlungsszenarien.

Das generierte Ergebnis hat nicht nur ein komplettes Flussdiagramm erstellt, sondern auch automatisch viele Symbole, Illustrationselemente und visuelle Leitzeichen hinzugefügt. Die verschiedenen Schritte werden durch Pfeile, Farbfelder und Hierarchiebeziehungen verbunden. Selbst wenn es viele Texte enthält, bleibt die visuelle Unterscheidbarkeit gut.

Die zweite Gruppe von Tests erhöht die Schwierigkeit weiter. Wir haben das Modell gebeten, eine Informationsgrafik für ein Architekturkonzept basierend auf den Merkmalen mariner Lebewesen zu generieren, die sowohl die Inspiration als auch den Entwurfsablauf und das endgültige Architekturkonzept darstellen soll.