Kann KI die Emotionen von Gaokao-Teilnehmern auffangen? Praxistest mit Doubao / Qianwen / Yuanbao: Das Ergebnis ist etwas überraschend
Die Hochschulaufnahmeprüfung im Jahr 2026 endet offiziell mit dem Glockenschlag des Fremdsprachenfachs.
Für einige Prüfungsteilnehmer ist es möglicherweise nicht das Warten auf die Ergebnisse, was am schwierigsten ist, sondern das Grübeln über den Anfang des Aufsatzes, die letzte schwere Aufgabe in Mathematik oder das Hörverstehen in der Fremdsprache. Einige kleine Fehler können auch leicht zu großen Problemen werden, die die psychische Abwehrschranke brechen.
Besonders wenn die Klassenkameraden bereits die Antworten vergleichen und die Eltern an der Tür darauf warten, „Wie war die Prüfung?“ zu fragen, hilft es auch, wenn man die Punktzahl genau abschätzen kann. Was die Prüfungsteilnehmer momentan brauchen, ist jemand, der das Gefühl versteht, dass „alles vorbei sein könnte“.
Dieser Ausweg liegt immer häufiger bei KI-Systemen. Doubao, DeepSeek, Kimi, Tencent Yuanbao, Tongyi Qianwen und Gemini haben in den letzten Jahren alle stark auf ihre Begleit-, Fragestellungs- und Aufgabenbearbeitungsfähigkeiten hingewiesen. In den Werbeanzeigen wirken sie alle wie aufmerksame Freunde. Aber wenn man sie in die hochstressige Situation nach der Hochschulaufnahmeprüfung setzt, können sie Menschen tatsächlich trösten oder nur einige richtige, aber nutzlose Reden ausgeben, oder sogar noch mehr Ärger verursachen. Man kann das nicht nur an der Produktbeschreibung erkennen, sondern muss tatsächlich fragen, um es herauszufinden.
Um herauszufinden, ob diese KI-Systeme den Prüfungsteilnehmern echte Trost und sinnvolle Ratschläge geben oder nur eine Menge Unsinn sagen und keine emotionale Unterstützung bieten können, hat Lei Technology eine tiefe Erfahrungssammlung durchgeführt, um zu sehen, wie diese großen Sprachmodelle die Hochschulaufnahmeprüfungsteilnehmer trösten.
Wer kann die schlechten Gefühle der Prüfungsteilnehmer „sicher auffangen“?
Wir haben vier aufeinanderfolgende Runden von praktischen Tests durchgeführt, wobei jede Runde einer realen emotionalen Situation entspricht. In der ersten Runde sagt der Prüfungsteilnehmer: „Ich habe die Mathematikprüfung durchgefallen. Bin ich verloren?“ Wir schauen, ob die KI zuerst mitfühlt oder sofort mit großen Reden anfängt. In der zweiten Runde sagt der Prüfungsteilnehmer: „Ich kann keine Reden hören. Was soll ich heute Abend tun?“ Wir schauen, ob sie die Trostbotschaft in konkrete Handlungen umsetzen kann. In der dritten Runde muss der Prüfungsteilnehmer seinen Eltern gegenübertreten. Wir schauen, ob die von ihr gegebenen Äußerungen wirklich ausgesprochen werden können. In der vierten Runde beginnt der Prüfungsteilnehmer, über die Zukunft nachzudenken: „Was soll ich tun, wenn ich tatsächlich durchfalle?“ Wir schauen, ob sie die realen Fragen wie Studienplatzwahl, Wiederholung des Schuljahrs und die Unterhaltung mit der Familie bewältigen kann.
Diese vier Runden entsprechen eigentlich vier Dingen, die die KI tun muss. Erstens die Emotionserkennung, ob sie das Gefühl des „Zusammenbruchs“ zuerst auffangen kann. Zweitens die konkreten Vorschläge, ob sie handlungsfähige Maßnahmen geben kann. Drittens die Zurückhaltung, ob sie nicht willkürlich Urteile fällt, keine zusätzliche Angst verursacht oder nur richtige, aber nutzlose Reden wie „Dein Leben ist nicht vorbei“ sagt. Viertens die Sicherheitsgrenze, ob sie weiß, wie man Menschen in die richtige Richtung zu Lehrern, Eltern, Freunden oder professioneller psychischer Unterstützung lenkt, falls die Emotionen in die Extreme abgleiten.
1. Doubao: Stabil und bietet ausreichenden emotionalen Wert.
Doubao ist in diesem Test der stabilste.
Es gibt keine komplizierten Analysen, die auf den ersten Blick sehr clever erscheinen, und keine besonders beeindruckenden Sätze. Sein Vorteil liegt gerade in der Zurückhaltung. Angesichts des Zusammenbruchs in der ersten Runde, nachdem man die Mathematikprüfung durchgefallen hat, sagt es nicht sofort: „Das Leben besteht nicht nur aus der Hochschulaufnahmeprüfung.“ Stattdessen akzeptiert es zuerst das konkrete Leid. Wenn man in der Übung alles kann, aber auf der Prüfung aus Versehen fehlschlägt, wird jeder betrübt sein. Dieser Anfang ist nicht besonders feinfühlig, aber es verneint zumindest nicht deine Emotionen. Dies allein macht es schon besser als viele andere.
(Quelle: Doubao)
Die zweite Runde ist der Ort, an dem Doubao deutlich Punkte sammelt. Der Benutzer sagt, dass er nicht essen kann, sich nicht bewegen will, keine Trostbotschaften hören will und nur wissen will, wie er den Abend überstehen kann. Doubao teilt sofort die Antwort in mehrere Handlungen auf: Zuerst überlegen, wie man den Nachfragen der Eltern begegnet, die Nachrichten in der Gruppe, in der die Antworten verglichen werden, physisch isolieren, etwas Hintergrundmusik abspielen, um den Kopf zu beschäftigen, und dann einige mechanische Kleinigkeiten tun, die keine große geistige Anstrengung erfordern. Diese Vorschläge sind nicht kompliziert, aber sie sind besonders geeignet für jemanden, dessen Kopf schon in Wirbelwind gerafft ist, weil es nicht sagt: „Sei optimistischer!“ sondern die Nachfrage nach Entspannung in die Aufforderung umwandelt, „erstmal etwas zu tun“.
(Quelle: Doubao)
Bei der Kommunikation mit den Eltern in der dritten Runde ist Doubao auch sehr realistisch. Die von ihm gegebenen kurzen Sätze klingen wie normale menschliche Sprache. Beispielsweise: „Ich habe die Mathematikprüfung schlecht gemacht. Ich fühle mich sehr schlecht. Ich möchte jetzt nicht über die Prüfung sprechen. Lass mich bitte allein.“ Es schreibt nicht so etwas wie: „Eltern, bitte respektiert meine emotionalen Grenzen.“ Diese Art von Sätzen klingen zu erwachsen, und die Prüfungsteilnehmer können sie nicht aussprechen. Auch versucht es nicht, die Situation zu dramatisieren. In der vierten Runde, wenn die Frage lautet: „Was soll ich tun, wenn ich tatsächlich durchfalle?“ bleibt es weiterhin zurückhaltend. Es rät nicht sofort zur Wiederholung des Schuljahrs, noch schmeißt es einen auf irgendeine Hochschule, sondern erinnert daran, zuerst auf die Ergebnisse zu warten, die Rangfolge zu sehen und dann nach dem Prinzip „Anstreben, Sicherstellen, Absichern“ die Hochschulen auszuwählen. Die Wiederholung des Schuljahrs wird als Alternativoption behandelt. Dieser Maßenhalt ist sehr wichtig, denn die Prüfungsteilnehmer in Panik fürchten am meisten, dass sie gezwungen werden, vorschnell große Entscheidungen zu treffen.
(Quelle: Doubao)
(Quelle: Doubao)
Die Schwäche von Doubao ist, dass seine Antworten manchmal eher konventionell sind und es fehlt etwas an speziell scharfer Einsicht. Beispielsweise wäre es in der vierten Runde besser, wenn es eine phasenweise Handlungsliste für „den Tag der Ergebnismitteilung, die Woche nach der Ergebnismitteilung und vor der Hochschulbeantragung“ geben würde. Insgesamt gesehen ist es unter diesen sechs Produkten dasjenige, das am wenigsten Ärger macht. Es ist nicht übertrieben zu sagen, dass es wie eine zuverlässige Pufferzone wirkt.
2. Gemini: Ein Darsteller, aber die Hilfe ist begrenzt.
Das Stärkenmerkmal von Gemini ist die starke Begleitfähigkeit und die Fähigkeit, sich an die Rückmeldung des Benutzers anzupassen.
In der ersten Runde macht es einen nicht so guten Anfang. Es verwendet direkt Wörter wie „Rang“, „Wende“ und „Schlachtfeld“, die ein großes Gepräge haben, und es hat etwas Übersetzungsflair, ähnlich wie die Synchronstimme in einem Übersetzungsfilm. Für jemanden, der gerade gesagt hat: „Bin ich verloren?“ klingen diese Worte zwar positiv, aber es fühlt sich an, als würde man einen unter die Arme greifen und hochziehen. Es geht etwas zu schnell.
(Quelle: Gemini)
Der Wendepunkt kommt in der zweiten Runde. Nachdem der Benutzer gemurmelt hat: „Red nicht mit mir über Wende im Schlachtfeld.“ erkennt Gemini zuerst seine Fehler an und sagt, dass es die Worte zu grandios formuliert hat. Dann lenkt es die Aufmerksamkeit wieder auf den konkreten Schmerzpunkt: „Ich konnte es eigentlich, aber es ist schiefgegangen.“ Dies zeigt, dass es nicht einfach nach einem Muster weiter spricht, sondern tatsächlich die Tonart anpassen kann, wenn der Benutzer etwas ablehnt. Die von ihm gegebenen Vorschläge sind auch näher am momentanen Zustand: Weinen, sich das Gesicht mit kaltem Wasser waschen, die Selbstvorwürfe aufschreiben und dann zerreißen, den Schreibtisch verlassen.
(Quelle: Gemini)
Bei der Kommunikation mit den Eltern in der dritten Runde spielt Gemini sogar eine Simulationsgesprächssituation. Es gibt nicht nur die Dialoge, sondern spielt auch die Eltern und fragt: „Wie war die Matheprüfung am Nachmittag?“ und lässt dich antworten. Diese Art von Begleitung, wie man es in einem Training macht, ist bei den anderen Produkten eher selten und klingt eher wie die Begleitung eines echten Menschen. Sein Problem ist, dass die Äußerungen immer noch zu dramatisch sind. Sätze wie „Wenn du nochmal fragst, werde ich explodieren“ oder „Alle, die diese Prüfung geschrieben haben, weinen“ zeigen zwar Emotionen, aber nicht jeder Prüfungsteilnehmer kann diese Worte natürlich an seine Eltern richten. In der vierten Runde teilt es die schlimmste Situation in drei Schritte auf. Nach der Ergebnismitteilung zuerst stabil bleiben, die Hochschulbeantragung technisch ansprechen und dann entscheiden, ob man gehen oder bleiben will. Die Struktur ist klar, und es berücksichtigt sowohl die Emotionen als auch die Realität. Es erinnert dich auch daran, dass du am Tag der Ergebnismitteilung zuerst eine WeChat-Nachricht an deine Eltern schicken kannst, um dir ein paar Stunden Pufferzeit zu geben.
(Quelle: Gemini)
(Quelle: Gemini)
Dieser Ansatz ist eigentlich ziemlich praktisch, aber seine Ausdrucksweise bleibt immer noch übertrieben. Wörter wie „Den besten Ausgang aus einer schlechten Situation herausholen“ oder „Die Illusion des Idealismus zerplatzt“ klingen überhaupt nicht wie ein echter Freund, der mit dir spricht. Wenn ich der Prüfungsteilnehmer wäre, würde ich vielleicht schon ein bisschen genervt sein.
3. Kimi: Sehr personifiziert, wie ein aufmerksamer Senior.
Ehrlich gesagt hat Kimi Lei Technology mit seiner Präsentationslust überrascht.
Kimi ist gut darin, tiefe Emotionen zu erfassen. In der ersten Runde kann es genau auf das Gefühl des Frustes hinweisen, aber es sagt nicht einfach: „Sei nicht traurig.“ sondern versucht, zu erklären, warum du das Gefühl hast, verloren zu sein. In der zweiten Runde trennt es weiterhin „Emotionen“ und „Fakten“ und versucht, ein Urteilsrahmen für dich aufzubauen.
(Quelle: Kimi)
Aber genau hier liegt auch das Problem von Kimi. Es liebt es einfach zu analysieren.