Echtzeit-Test von GPT For PPT: Die Qualität des in 5 Minuten erstellten Manuskripts ist bedenklich. Die "letzte Meile" muss der Angestellte immer noch selbst bewältigen.
Wieder einmal hat OpenAI in der späten Nacht einen Knaller gelandet und möglicherweise die aufregendste neue Funktion des ersten Halbjahres vorgestellt.
Am frühen Morgen des 22. Mai kündigte OpenAI an, dass das Codex For Powerpoint-Plugin nun in die interne Testphase eingetreten ist. Einfach ausgedrückt, kann ChatGPT jetzt direkt in PowerPoint integriert werden und Folien in PowerPoint generieren.
(Quelle: OpenAI)
In der Vergangenheit war das größte Problem bei der Verwendung von KI für die Erstellung von PowerPoint-Präsentationen nicht, dass die KI keine Inhalte ausdenken konnte, sondern dass es schwierig war, sie in den eigentlichen PowerPoint-Arbeitsablauf zu integrieren.
In der Vergangenheit gab es ungefähr zwei gängige Lösungen.
Eine Lösung bestand darin, dass die KI direkt HTML-Präsentationen erstellt. Diese Methode ist schnell, und die visuellen Effekte können relativ vollständig gestaltet werden. Es können sogar einige Webseiten-ähnliche Animationen erstellt werden. Aber der Nachteil ist auch offensichtlich: HTML ist kein PowerPoint. Was Sie sehen, ist eine Webseite, die wie eine Präsentation aussieht, aber kein Dateiformat, das in PowerPoint direkt bearbeitet werden kann. Wenn Sie einen Titel ändern, eine Karte verschieben oder die Position eines Icons anpassen möchten, ist das nicht möglich.
Die andere Lösung besteht darin, dass GPT zunächst Folienvorschau-Bilder erstellt und dann die Elemente aus den Bildern extrahiert und in PowerPoint, Keynote oder andere Präsentationsprogramme importiert, um die Präsentation neu aufzubauen. Dieser Ansatz scheint näher an einem fertigen Produkt zu sein, aber in der Praxis ist es auch sehr aufwändig. Denn die Vorschau-Bilder sind letztendlich nur Bilder, und die Titel, Diagramme, Icons und Karten darin sind keine bearbeitbaren Objekte. Das hängt stark von der Qualität der von GPT erstellten Bilder ab. Wenn etwas schief geht, können Sie nur die KI bitten, es zu ändern. Selbst ein Tippfehler kann nicht manuell korrigiert werden.
(Quelle: Grafik von Lei Technology)
Das Verwirrende an Codex For Powerpoint ist also, ob es diesmal nur etwas herstellen kann, das wie eine PowerPoint-Präsentation aussieht, oder ob es tatsächlich Folien in PowerPoint generieren kann. Wir müssen es erst mal testen.
In 5 Minuten fertig, aber keine hohen Erwartungen an die Qualität
Diesmal haben wir Codex for PowerPoint die Aufgabe gegeben, eine PowerPoint-Präsentation über "Lei Technology" zu erstellen.
Dies ist kein besonders schwieriges Thema, aber auch kein einfaches, denn die "Einführung von Lei Technology" erfordert die Suche nach Informationen, die Integration von Daten und das Layoutdesign. Es reicht nicht aus, einfach die Informationen von der offiziellen Website in die Präsentation zu kopieren. Das Ziel ist, dass jemand, der Lei Technology noch nicht kennt, versteht, was es ist, was es macht, welche Technologie-Themen es behandelt, welches Inhaltsangebot es hat und was seine Besonderheiten in der Technologie-Medien- und allgemeinen Technologie-Inhalts-Ökosystem sind.
Um die echte Leistung von Codex zu testen, haben wir zunächst keine langen, professionellen Anweisungen gegeben, sondern einen sehr "anfängerfreundlichen" Text verwendet, wie ihn ein Normalbürger geben würde, wenn er noch keine genauen Ideen hat:
Hilf mir, eine PowerPoint-Präsentation über Lei Technology zu erstellen, die für Leute geeignet ist, die Lei Technology noch nicht kennen. Suche die Informationen selbst im Internet. Erstelle ungefähr ein Dutzend Folien mit reichhaltigen Inhalten. Vermeide es, nur Text zu verwenden. Am besten sind auch Bilder, Daten und Beispiele enthalten. Die Präsentation sollte tatsächlich präsentierbar sein.
Und tatsächlich hat Codex es geschafft. Der gesamte Prozess hat nur etwas mehr als 5 Minuten gedauert.
(Quelle: Grafik von Lei Technology)
Es hat eine 12-seitige PowerPoint-Präsentation erstellt, mit Titel, Struktur und Beispielen. Es hat auch Datenkarten und Infografiken versucht. Beispielsweise wird Lei Technology im Rahmen eines "Technologie-Inhalts-Brands" vorgestellt. Es wird auf das Inhaltsangebot, die Plattform-Verteilung und Branchenmessen wie AWE/MWC verwiesen. Am Ende wird auch eine Präsentations-Script hinzugefügt. Nach Maßstäben der Vollständigkeit würde ich der Präsentation eine Note von 7,5 geben.
Aber bei genauerer Betrachtung gibt es viele Probleme.
Der einfache Anweisungstext hat der KI viel Freiheit gelassen, und sie hat tatsächlich frei herumexperimentiert. Am offensichtlichsten ist, dass der zweite Teil der Präsentation vom Thema abweicht und sich auf "Geschäftliche Kooperationen", "Investitionsmöglichkeiten" und "Markenplatzierungen" konzentriert. Beispielsweise lautet der Titel auf Seite 11: "Die geeignete Kooperation mit Lei Technology ist nicht 'Harte Werbung', sondern die Präsentation des Produkts als Trendbeispiel". Solche Formulierungen wären in einer Geschäftseinführung oder Kooperationsvorschlag in Ordnung, aber in einer "Einführung von Lei Technology" erscheinen sie seltsam. Wir wollten eigentlich, dass jemand, der Lei Technology noch nicht kennt, das Markenkonzept versteht, aber plötzlich wird über die Kooperationsmöglichkeiten gesprochen.
(Quelle: Grafik von Lei Technology)
Auf Seite 11 selbst tritt ein noch direkteres Problem auf. Es gibt eine große Tabelle, aber die Tabelle ist fast leer. GPTs Selbstüberprüfung hat diesen Fehler offenbar nicht erkannt. Das ChatGPT-Plugin auf der rechten Seite hat uns sogar gesagt, dass es eine vollständige Überprüfung durchgeführt und die fehlenden Texte korrigiert hat, aber auf der Seite sind immer noch deutliche Anzeichen von Halbfabrikaten zu sehen.
Aber GPTs Datenintegration ist dennoch gut. Zumindest bei den Branchenbeispielen hat es keine Fehler gemacht und keine KI-Halluzinationen gezeigt, wenn es Zahlen wie "über 40 tiefe Originalinhalte", "über 120.000 Wörter" und "geschätzte 9 Millionen Lesezugriffe im gesamten Netz" angegeben hat.
(Quelle: Grafik von Lei Technology)
Objektiv betrachtet kann Codex for PowerPoint bereits aus einer sehr gesprochenen Anforderung heraus automatisch eine strukturell vollständige, ausreichend viele Seiten umfassende und visuell nicht allzu unansehnliche PowerPoint-Präsentation erstellen. Es hat ein Verständnis dafür, wie eine Präsentation aussehen sollte. Aber es ist noch unsicher, welchem Ziel diese Präsentation eigentlich dienen soll.
Dann haben wir einen detaillierten Anweisungstext verwendet:
Dies ist eine Einführungspräsentation für Personen, die Lei Technology zum ersten Mal kennenlernen. Sie eignet sich für Branchenvorträge, Medienforschung, Fallstudien von Inhaltsbränden oder interne Unternehmensaufklärungen. Sie soll Lei Technology als Technologie-Inhalts-Brand systematisch vorstellen. Die Informationen sollten aus öffentlichen Quellen stammen, wie der offiziellen Website, den Social-Media-Konten, öffentlichen Berichten und Drittseiten. Die Schlüsselfakten sollten auf öffentlich zugänglichen Informationen basieren, und unbestätigte Informationen sollten nicht erfunden werden. Die Präsentation sollte 12 bis 15 Seiten umfassen, wobei jede Seite nur einen Kernpunkt behandelt. Verwenden Sie möglichst Infografiken, Zeitachsen, Matrixdiagramme, Inhaltskarten und Beispiele.
Das Ergebnis zeigt, dass ChatGPT diesmal nicht mehr vom Thema abweicht, sondern sich um die Fragen "Was ist Lei Technology?", "Welche Themen werden behandelt?", "Was ist das Inhaltsangebot?", "Welche Plattformen und Inhaltsformen gibt es?", "Welche repräsentativen Konten und IPs gibt es?" und "Wie sieht das Leserprofil und die Ökosystem-Position aus?" kümmert. D.h., ein detaillierter Anweisungstext ist für die KI effektiv. Er kann die KI davon abhalten, zu viel frei herumzuexperimentieren und näher an das von uns festgelegte Einführungsmaterial heranbringen.
(Quelle: Grafik von Lei Technology)
Aber es tritt ein zweites Problem auf: Diese "Präsentation" sieht zu sehr wie ein Forschungsbericht aus. Die Titelseite sollte einen ersten Eindruck vermitteln und den Zuschauern den Namen "Lei Technology" ins Gedächtnis rufen, anstatt direkt zu sagen, "Was ich in den nächsten drei Punkten analysieren werde". Jemand, der schon Vorträge gehalten hat, weiß, dass solche Dinge vom Vortragenden mündlich erklärt werden und nicht auf der ersten Seite der Präsentation stehen sollten.
(Quelle: Grafik von Lei Technology)
Es gibt auch ähnliche Probleme im Bereich der Optik. Die zweite Version verwendet viele große schwarze Rechtecke, um ein technologisches und professionelles Aussehen zu erzielen, aber das Ergebnis wirkt eher bedrückend. Beispielsweise ist Seite 4 eine Inhaltskarte. Links gibt es ein Koordinatendiagramm, rechts ein schwarzer Informationsblock mit der Aufschrift "Drei Arten von häufigen Fragen". Die Struktur dieser Seite ist eigentlich in Ordnung, was zeigt, dass die KI bereits versteht, Inhalte grafisch darzustellen, anstatt nur Text zu verwenden. Meine Vermutung ist, dass es keine passenden Materialien im Internet gefunden hat oder dass das Laden der Materialien fehlgeschlagen ist.
(Quelle: Grafik von Lei Technology)
Seite 6 behandelt das "1+6+N"-Inhaltsangebot, Seite 7 die Plattformen und Inhaltsformen, Seite 8 die repräsentativen Konten und IPs. Die Richtung dieser Seiten ist genauer als in der ersten Version. Das Problem ist, dass sie eher "einen Rahmen zusammenfassen" als "ein Brand zu präsentieren". Auf den Seiten ist nur Lei Technology zu sehen, aber Namen wie "Dianchetong", "Xiaolei Bibi" und "Luo Chao Channel" fehlen, sowie echte Screenshots von Konten, Rubriken, Artikelüberschriften und Video-Cover.
(Quelle: Grafik von Lei Technology)
Es ist leicht zu sehen, dass ein detaillierterer Anweisungstext die Abweichungen reduzieren kann, aber er macht die Präsentation nicht unbedingt schöner oder fertiger. Er bringt die KI von "freiem Experimentieren" zu "befolgen der Anweisungen", aber es macht auch das gesamte Material enger und sieht eher wie ein Forschungsbericht aus, anstatt Lei Technology wirklich zu präsentieren.
Je mehr man ändert, desto schlechter wird es. Die KI zur Präsentationserstellung muss noch verbessert werden
Nach der "Anfängerversion" und der "Tiefenversion" haben wir noch zwei weitere Runden von Änderungen vorgenommen. Beide Änderungen haben etwa 7 Minuten gedauert, ähnlich wie die erste Version mit dem detaillierten Anweisungstext. Aber das Problem ist, dass GPT immer weniger versteht, was wir ausdrücken wollen.
Bei der ersten Änderung haben wir hauptsächlich auf die Probleme der zweiten Version Bezug genommen: Fügen Sie das Lei Technology-Logo hinzu, reduzieren Sie die großen schwarzen Rechtecke und gestalten Sie das gesamte Design frischer. Lassen Sie die Titelseite nicht mehr mit "Dieser Bericht behandelt drei Dinge" beginnen. F