Diesjährige Absolventen: Abgrenzung ihrer Arbeiten von KI im Fokus

KI-Plagiatsprüfung an Hochschulen weist Probleme wie Fehlurteile auf und erfordert ein verbessertes Prüfsystem.

Mehrere Experten haben angegeben, dass die KI-Detektion eine unbefriedigende Lösung der Hochschulen unter der Hintergrundlage des unausgewogenen Lehrkraft-zu-Studenten-Verhältnisses und des Fehlens von Betreuung durch Dozenten ist. Derzeit gibt es bei den verschiedenen KI-Detektionsmethoden immer noch Probleme wie unklare Beurteilungskriterien, inkonsistente Prüfungsergebnisse verschiedener Systeme und häufige Fehlurteile. Dies ist eine suboptimale Wahl, und ihre Position als Warnungstool sollte klar definiert werden.

Mit der Annäherung der Abschlusszeit sind „AIGC-Rate (Künstliche-Intelligenz-Generationswahrscheinlichkeit)“ und „KI-Reduktions-Tutorials“ zu beliebten Themen im Internet in Bezug auf Abschlussarbeiten dieses Jahres geworden.

An der Huazhong-Universität für Wissenschaft und Technologie war der Absolvent Wang Tian schockiert zu entdecken, dass mindestens fünf oder sechs seiner Kommilitonen ihre Abschlussarbeiten mit KI-Tools wie Doubao geschrieben hatten, und die vermutete AIGC-Rate in der Prüfungssystem von CNKI war sehr niedrig, sogar nahezu Null. Seine eigene von Hand verfasste Arbeit hatte dagegen bei der ersten Prüfung im internen Prüfungssystem eine KI-Rate von 36 %, was 16 % höher als der von der Universität festgelegte Bereich war und auch weit höher als seine ursprüngliche Schätzung von 5 %.

Cheng Chunfei von der Zhengzhou-Universität hat fast hundert Yuan für die Prüfung ihrer Abschlussarbeit im Lixinzhijiao-Prüfungssystem ausgegeben, um die KI-Rate so niedrig wie möglich zu halten. Cheng Lu von der Sichuan-Universität hat die kostenlosen Prüfungen auf der Plattform genutzt und KI-Reduktionsbefehle verwendet, um den Text zu optimieren, und die KI-Rate auf unter 5 % gebracht.

Dies ist kein zufälliges Phänomen bei einzelnen Personen. Mit der Einbindung der KI-Detektion von Abschlussarbeiten in den Prüfungsvorgang der Hochschulen wird der Arbeitsablauf „erst mit KI schreiben, dann mit KI prüfen und schließlich die KI-Rate reduzieren“ zu einer neuen Norm für viele Studenten beim Einreichen ihrer Arbeiten.

Nach dem Bericht „Einschätzung des KI-Nutzungsverhaltens und der Mentalität von Studierenden im Jahr 2025“, der von der China Youth Daily, der Youth Media von China und der sozialen Plattform Soul App gemeinsam veröffentlicht wurde, wählen 65,9 % der befragten Studenten bei Problemen zunächst die KI als Hilfe. Die KI hat die traditionellen Kanäle als erste Wahl für die Informationsbeschaffung überholt. Die Abhängigkeit der älteren Studenten ist deutlicher. Die tägliche Mehrfachnutzungsrate der Studenten im vierten Studienjahr beträgt 21,2 %, weit höher als die der Erstsemester von 8,0 %. 47,1 % der Studenten geben zu, „ohne KI nicht auszukommen“.

Mehrere Experten haben in den Interviews angegeben, dass die KI-Detektion eine unbefriedigende Lösung der Hochschulen unter der Hintergrundlage des unausgewogenen Lehrkraft-zu-Studenten-Verhältnisses und des Fehlens von Betreuung durch Dozenten ist. Derzeit gibt es bei den verschiedenen KI-Detektionsmethoden immer noch Probleme wie unklare Beurteilungskriterien, inkonsistente Prüfungsergebnisse verschiedener Systeme und häufige Fehlurteile. Dies ist eine suboptimale Wahl, und ihre Position als Warnungstool sollte klar definiert werden.

Su Yu, Professor an der Fakultät für Informatik und Künstliche Intelligenz der Hefei Normal University und Entwickler des intelligenten Hilfssystems „Yijianzhiwen“ für Dissertationen, sagte, dass die Hochschulen ein umfassendes und vernünftiges KI-Detektionssystem aufbauen müssen. Erstens muss eine hierarchische Verwaltung durchgeführt werden, um den Bereich festzulegen, in dem die Studenten KI verwenden dürfen. Zweitens müssen die Verwendungsmethoden und die Detektionstechniken nachvollziehbar und erklärbar sein. Die Studenten können Anlagen zur KI-Nutzung einreichen, um zu erklären, in welchen Teilen der Arbeit sie KI eingesetzt haben. Das Prüfungssystem muss auch die Prüfungslogik und die Standards der KI-Technologie veröffentlichen. Drittens muss ein Beschwerdekanal eröffnet werden. Wenn die Studenten glauben, dass ein bestimmter Textabschnitt fehlurteilt wurde, können sie über ihren Betreuer und die relevanten Abteilungen der Universität eine erneute Prüfung beantragen.

Die Reaktion der Studierenden

Um eine Überprüfung der KI-Detektion zu vermeiden, hat Cheng Chunfei ihre Schreibweise für die Abschlussarbeit angepasst. Für sie, eine Studentin des Englischstudiengangs, ist es ohnehin leichter, dass eine englische Arbeit eine hohe KI-Rate aufweist. Daher nutzt sie die KI nur, um einige Schreibideen zu entwickeln und Literaturquellen zu finden. Anschließend liest sie selbst repräsentative Artikel, Masterarbeiten und Bücher aus dem relevanten Bereich und gestaltet schließlich den Text mit eigenen Worten neu.

Cheng Chunfei sagte, dass diese Vorgehensweise eher darin besteht, die KI zur Ideenfindung zu nutzen, anstatt direkt zu kopieren.

Im Prozess der wiederholten Prüfung und Revision hat sie auch eine Methode zur sekundären Reduktion der KI-Rate entwickelt: Nachdem sie den Prüfungsbericht erhalten hat, ändert sie manuell fragmentierte und ungeschickte Sätze, die nicht den Sprachnormen der Arbeit entsprechen. Für größere Textabschnitte, die vermutet werden, von KI generiert zu sein, nutzt sie große Modelle wie DeepSeek und Doubao, um die Sätze umzuschreiben. Durch die Anpassung von Hinweistexten vereinfacht sie lange Sätze und optimiert den Stil, um die KI-Detektionsrate mit KI zu senken.

Cheng Chunfei sagte: „Zurzeit gibt es auf sozialen Plattformen wie Xiaohongshu und WeChat-Mini-Programmen überall Tutorials mit Hinweistexten, die speziell für die Reduktion der KI-Rate entwickelt wurden.“

Quelle: Xiaohongshu

Viele Studenten versuchen auch, die KI-Überprüfung zu vermeiden, indem sie kleine Stichproben auswählen. Xian Jun, ein Student im vierten Studienjahr an der Renmin-Universität von China, sagte, dass bei der Schreibung von mikroquantitativen und datenanalytischen Arbeiten im Finanzstudium viele Menschen kleine Stichproben wie die von Dorf- und Stadtbanken auswählen. Solche Fälle haben von Natur aus eine niedrige Wiederholungsrate und werden daher schwerlich als von KI generiert eingestuft.

Derzeit gibt es keine einheitlichen Toleranzstandards für KI-generierten Inhalt in Abschlussarbeiten an den verschiedenen Hochschulen. Laut den öffentlichen Informationen der Prüfungsbehörde der Sichuan-Universität darf der KI-Anteil in Abschlussarbeiten der Geisteswissenschaften nicht mehr als 20 % betragen, während der Obergrenze für die naturwissenschaftlichen, technischen und medizinischen Fächer 15 % beträgt.

Cheng Chunfei sagte, dass an ihrer Universität, der Zhengzhou-Universität, die KI-Rate auf 40 % festgelegt wurde. Xian Jun sagte auch, dass die Universität noch keine offizielle Datei herausgegeben hat, aber die Fakultät hat in der Klassen-Gruppe mitgeteilt, dass der KI-Gehalt in der Arbeit auf unter 10 % gehalten werden muss.

Selbst wenn die Studenten alle Vorbereitungen treffen, müssen sie immer noch vor Schwierigkeiten wie der begrenzten Anzahl von Prüfungen im internen System und den hohen Kosten für kostenpflichtige Prüfungen stehen.

Das interne System der Universität, an der Gao Lu studiert, nutzt das Prüfungsmodell von CNKI und bietet nur zwei kostenlose Prüfungen. Ihre Arbeit muss eine KI-Rate von unter 15 % aufweisen. „Die Prüfungskosten für eine 20.000-Wort-Arbeit bei CNKI betragen 40 bis 50 Yuan pro Prüfung.“

Zwei ihrer Mitbewohnerinnen haben jeweils 80 Yuan und 100 Yuan für die Reduktion der KI-Rate und die Prüfung bei VIP and CNKI ausgegeben. Auf den offiziellen Plattformen wie CNKI, Wanfang und VIP werden die Prüfungskosten nach der Anzahl der Wörter berechnet, und der Preis liegt zwischen 2 und 10 Yuan pro Tausend Wörtern. Viele Hochschulen beschaffen auch direkt die Dienste von Drittanbieter-Prüfungsplattformen wie CNKI, VIP und Gezida.

Um Geld zu sparen, nutzen viele Studenten zunächst die kostenlosen Testmöglichkeiten auf den Plattformen. Beispielsweise bieten die Plattformen PaperPass, PaperPure und PaperYY gleichzeitig AIGC-Prüfungen und KI-Reduktionsdienste an und stellen täglich 2 bis 5 kostenlose Testmöglichkeiten zur Verfügung. Die Berichte markieren auch die vermuteten KI-Abschnitte in verschiedenen Farben.

Gao Lu nutzt oft die kostenlosen Prüfungen auf der Plattform, um sich wiederholt selbst zu prüfen, bis das Risiko des Textes unter die akzeptable Grenze fällt, bevor sie die Arbeit an das interne System einreicht. Sie sagte, dass sie festgestellt habe, dass die Prüfungskriterien der Universität weniger streng sind als erwartet. „Solange die Arbeit nicht vollständig von KI generiert wurde, liegt die KI-Rate im Allgemeinen unter dem Standard und beeinträchtigt nicht den weiteren Prüfungsvorgang.“

Die hohen Preise auf den offiziellen Plattformen haben auch die grauen Dienste der billigen KI-Reduktion auf E-Commerce-Plattformen gefördert. Auf Plattformen wie Pinduoduo, Xianyu und Taobao gibt es eine Vielzahl von Prüfungs- und manuellen KI-Reduktionspaketen für Abschlussarbeiten. Beispielsweise variieren die Preise für die Dienstleistungen im Suchergebnis mit dem Schlüsselwort „Gezida“ zwischen 10 und 50 Yuan.

Der Mitbewohner von Xian Jun war einmal auf eine Falle hereingefallen: Bei der ersten KI-Prüfung lag die Rate nahe 30 %. Er hat mehr als 100 Yuan für den hochwertigsten manuellen KI-Reduktionsdienst auf der Plattform ausgegeben. Nach der Revision war der Text nicht nur ungeschickt und unverständlich, sondern auch völlig von der fachlichen Logik abweichend. „Es war einfach nur für die Reduktion der KI-Rate.“ Er musste dann nochmal an den Kundendienst wenden und erneut bezahlen, um die KI-Rate schließlich auf etwa 9 % zu bringen.

Tatsächlich können diese Drittanbieter-Dienste mit unklarer Herkunft auch das Risiko der Privatsphäre-Verletzung der Abschlussarbeiten bergen.

Su Yu sagte, dass eine konforme Prüfungsplattform entsprechende Mechanismen für die Datensicherheit und den Schutz persönlicher Informationen aufweisen muss, einschließlich der sicheren Prüfung beim Hochladen von Dateien, der Kontrolle der Rollenrechte, der Berechtigung zum Herunterladen von Literatur, der automatischen Ablaufzeit von temporären Links und der Entsensitivierung und Sicherung sensibler Informationen. Aber die kleinen Anbieterplattformen ohne offizielle Dienstleistungsqualifikation und unklare Datenschutzklauseln haben ein hohes Risiko. Die von den Studenten hochgeladenen Arbeiten können missbräuchlich gespeichert, missbraucht oder sogar für andere unzulässige Zwecke verwendet werden.

Instabile Systeme

Bei den verschiedenen KI-Prüfungen war Xians größtes Rätsel: Worauf gründet sich das System, um zu bestimmen, dass ein Text von KI generiert wurde?

Su Yu hat diese Frage aus technischer Sicht beantwortet: Der sogenannte „KI-Geschmack“ bezieht sich auf eine Reihe von Merkmalen in der Sprachausdrucksweise von Texten, die von großen Modellen generiert wurden. Wenn ein großes Modell einen Text generiert, prognostiziert es normalerweise den nachfolgenden Inhalt basierend auf dem Kontext. Der ausgegebene Inhalt wird von Faktoren wie Hinweistexten, Trainingsdaten und Generierungsparametern beeinflusst und bildet leicht eine feste, vorlagenhafte Ausdrucksweise. Beispielsweise sind die Sätze formell, aber mechanisch, und die Verbindungswörter werden wiederholt verwendet. Gleichzeitig ist die Natur des großen Modells eine Wahrscheinlichkeitsausgabe, und die generierten Ansichten können leicht Tatsachenfehler oder Illusionen enthalten. Die Dichte der Fachbegriffe im Text ist gleichmäßig verteilt, aber nicht tiefgehend, und die Schlussfolgerungen sind im Allgemeinen vage.

Laut Su Yu beruhen die derzeitigen gängigen KI-Prüfungstools hauptsächlich auf zwei technischen Ansätzen, um den Stil zu beurteilen. Der erste ist die statistische Merkmalsanalyse: Wenn ein KI-generierter Text basierend auf der Wahrscheinlichkeitsverteilung die nachfolgenden Wortelemente prognostiziert und generiert, können einige Texte statistisch eher glatte und regelmäßige Merkmale aufweisen. Einige Prüfungstools verwenden auch die Verwirrung, die Plötzlichkeit und die Textkomplexität als Hilfsmerkmale für die Beurteilung.

Der zweite Ansatz ist das Klassifikatormodell: Die Entwickler verwenden Texte, die von Menschen geschrieben und von KI generiert wurden, als Trainingsdaten, um ein binäres Klassifikationsmodell zu trainieren. Das Modell lernt die feinen Unterschiede zwischen den beiden Texttypen in Bezug auf Semantik, Syntax und Struktur, um neue Texte zu beurteilen.

Aber die technische Logik ist nur eine Seite der Medaille. Die Studenten müssen immer noch mit einem System konfrontiert sein, das voller Unsicherheiten ist.

Wang Tians Arbeit hatte bei der ersten Prüfung im Prüfungssystem der Universität eine KI-Rate von 36 %, was 16 % höher als der von der Universität festgelegte Bereich war und auch weit höher als seine ursprüngliche Schätzung von 5 %. Diese 5 % stammen hauptsächlich davon, dass er einmal KI-Tools verwendet hat, um einen Teil des originären Textes zu optimieren.

Wang Tian sagte gegenüber den Journalisten: „Viele meiner Freunde haben ihre Arbeiten mit Doubao geschrieben. Ich habe sie gefragt, ob sie etwas geändert haben, und sie haben alle nein gesagt. Aber die Prüfungsergebnisse waren sehr niedrig, sogar nahezu Null. Ich habe meine Arbeit sehr sorgfältig geschrieben, aber ich wurde trotzdem mit einem hohen KI-Gehalt belegt. Das ist offensichtlich eine Fehlbeurteilung.“

Um den Prüfungswert zu senken, musste Wang Tian zwei Tage Zeit darauf verwenden, den Text zu ändern. Er musste sogar einen Teil der Arbeitstruktur, der Textverständlichkeit und

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

Die diesjährigen Absolventen sind damit beschäftigt, ihre Arbeiten klar von KI abzugrenzen.

Die Reaktion der Studierenden

Instabile Systeme