Abschlussarbeiten, die von KI abgelehnt wurden, in dieser Abschlusszeit

Jede ausreichend fortschrittliche Technologie ist nicht von Magie zu unterscheiden.

„Es heißt, dass die Prüfung auf AI-Anteil in diesem Jahr strenger ist.“ So sagte der Student A, der sich gerade mit seiner Bachelorarbeit beschäftigt.

Mit der Annäherung der Abschlusszeit müssen immer mehr chinesische Studenten vor der Abgabe ihrer Abschlussarbeiten einen zusätzlichen Test bestehen: den AIGC-Test.

Dieser Test ist noch nicht lange etabliert. Laut öffentlichen Quellen wurde die AIGC-Prüfungsfunktion von CNKI erst 2024 eingeführt. Damals wurde der AIGC-Test nur an wenigen Hochschulen getestet, und die meisten Schulen beobachteten noch abwarten. Bis 2025 hatten mehr als 60 % der Bachelor-Hochschulen und 80 % der Graduiertenausbildungsinstitute den AIGC-Test in den Prüfungsablauf für Abschlussarbeiten integriert.

Es gibt jedoch noch keine einheitlichen Standards. Die Grenzwerte für den „AI-Anteil“ variieren von Schule zu Schule. Laut veröffentlichten Ankündigungen und Medienberichten haben die meisten Schulen den „AI-Anteil“ auf maximal 40 % festgelegt, einige Schulen haben ihn sogar auf 20 % oder sogar 15 % reduziert.

Wenn bei einer Arbeit ein zu hoher AI-Anteil festgestellt wird, wird der Student entweder vom Betreuer aufgefordert, die Arbeit zu verbessern. In schwereren Fällen wird der Student von der Präsentation ausgeschlossen. In einigen Fällen wurde sogar die Abschlusszeit verschoben oder die Abschlussqualifikation entzogen.

Abschlussarbeiten werden dank AI effizienter und einfacher, aber auch komplexer und schwieriger zu bewältigen. In der heutigen Zeit ist dies ein Problem ohne perfekte Lösung.

Wie funktioniert der AIGC-Test?

Laut öffentlichen Ankündigungen von Hochschulen verwenden viele Hochschulen bei der AIGC-Prüfung Systeme von CNKI, VIP, Wanfang oder anderen Drittanbietern. Beispielsweise heißt es in der Ankündigung für die Bachelorarbeiten der Klasse 2025 einer Fakultät der Zhejiang-Universität, dass die Prüfung „mit dem CNKI-System verbunden“ ist. In der Ankündigung für die Bachelorarbeiten der Klasse 2025 der Nanjing University of Finance and Economics wird die Plagiatsüberprüfung mit CNKI und VIP durchgeführt, während der AIGC-Test mit VIP durchgeführt wird und in das Abschlussarbeiten-Management-System integriert ist. Die Universität Nanjing hat in ihrer Ankündigung 2025 die „VIP AIGC-Prüfung“ für Fakultäten geöffnet und eine spezielle Login-Adresse für die Universität bereitgestellt. Das Graduiertenzentrum der Guangdong University of Finance and Economics verlangt in seiner Ankündigung für die Klasse 2025, dass die AIGC-Prüfung separat über den CNKI-AIGC-Prüfungs-Kanal durchgeführt wird.

Abbildung: Offizielle Erklärung der Nanjing University of Finance and Economics zur AIGC-Prüfung von Abschlussarbeiten

Es ist zu beachten, dass einige Hochschulen eigenständige oder in Auftrag gegebene "Abschlussarbeiten-Management-Systeme" als Prozessplattformen haben, die hauptsächlich die Funktionen der Arbeitseingabe, des Prüfzugangs, der Berichtsverteilung, der Betreuereinschätzung und der Versionsverwaltung übernehmen. Die zugrunde liegende Plagiatsüberprüfung und AIGC-Bestimmung werden in den meisten Fällen immer noch von Drittanbietern wie CNKI, VIP und Wanfang durchgeführt. Laut den bisher eingesehenen offiziellen Ankündigungen der Hochschulen übernehmen die Schulen in erster Linie die Rolle der Dienstleistungserwerbung, der Systemintegration, der Prozessverwaltung und der Regelungserstellung.

Bei den Prüfungsmethoden bleiben die öffentlichen Erklärungen der führenden Anbieter jedoch größtenteils auf der Ebene der Produktbeschreibung. CNKI bezeichnet seine Prüfprodukte als „Wissensgestützte AIGC-Prüfungstechnologie“, die auf Literatur-Big Data basiert und AI-generierte Inhalte in chinesischen Texten aus „Sprachmustern“ und „semantischer Logik“ erkennt. VIP erklärt in seiner offiziellen Erklärung, dass es „auf einer selbst entwickelten AI-Prüfungstechnologie basiert“ und Texte, die von Hauptmodellen wie DeepSeek, Tongyi Qianwen, Wenxin Yiyan und Doubao generiert wurden, prüfen kann. Das „Wenchacha“-System von Wanfang verwendet ein „AIGC-Text-Erkennungs-Tiefenlernmodell“ und urteilt anhand der Unterschiede zwischen AI-Texten und menschlichen Ausdrücken in Bezug auf Kohärenz, Logik und Struktur.

Aus den öffentlichen Seiten geht jedoch hervor, dass keine der Anbieter die Merkmalszusammensetzung, die Basis für die Schwellenwerte, die Herkunft der Trainingsdaten, die Fehlentscheidungsrate, die Auslassungsrate oder die Kriterien für unabhängige Drittprüfungen preisgibt. Das bedeutet, dass es für Außenstehende schwierig ist, die genauen Grenzen der Prüfkapazität nur anhand der Anbieterbeschreibungen zu beurteilen, und es ist auch schwierig, die Zuverlässigkeitsunterschiede zwischen verschiedenen Systemen zu überprüfen.

Bei der Qualifizierung der Prüfungsergebnisse positionieren die Anbieter und einige Hochschulen den AIGC-Test in ihren öffentlichen Stellungnahmen größtenteils als „Hilfsreferenz“. Die offizielle VIP-Plattform sagt, dass der AIGC-Test die „Wahrscheinlichkeit, dass Inhaltsabschnitte in einer Arbeit von AI generiert wurden“ misst. Auf der Seite „AI-Anteil-Prüfung“ von Wanfang wird auch darauf hingewiesen, dass der AIGC-Wert nicht mit der Qualität der Arbeit zusammenhängt und das Prüfungsergebnis nur angibt, ob es sich möglicherweise um AI-generierte Inhalte handelt, und nur als Referenz dient und möglicherweise Fehler aufweist. CNKI betont, dass der AIGC-Wert in den Prüfungsergebnissen die Wahrscheinlichkeit angibt, dass ein Artikel von AI generiert wurde, und nicht mit der Artikelqualität zusammenhängt.

Laut Hochschulankündigungen sieht ein typischer Ablauf für die AIGC-Prüfung einer Abschlussarbeit ungefähr so aus: Nachdem der Student die Arbeit fertiggestellt hat, bestätigt der Betreuer die endgültige Version, und dann beginnt der Prüfungsprozess. Der Student oder die Fakultät lädt die Arbeit in das eigene Abschlussarbeiten-Management-System oder die angegebene Prüfplattform hoch, und das System ruft die Drittanbieter-Engine auf, um die Plagiatrate und den AIGC-Anteil zu prüfen. Die Prüfung bezieht sich in der Regel hauptsächlich auf den Haupttext, während Titel, Formeln, Diagramme, Literaturverzeichnisse und andere Nicht-Haupttext-Inhalte in der Regel nicht geprüft werden. Die Anzahl der Prüfungen ist begrenzt, in der Regel gibt es ein bis zwei kostenlose Prüfungen.

Nach Abschluss der Prüfung fordern einige Schulen die Studenten auf, das Prüfbericht herunterzuladen und zusammen mit der endgültigen Version der Arbeit in das System hochzuladen, um von dem Betreuer, der Fakultät oder dem Graduiertenzentrum überprüft zu werden. Wenn die Arbeit vor der Präsentation geändert wird, fordern einige Schulen auch eine erneute Prüfung und betonen, dass die geprüfte Version mit der endgültigen Version übereinstimmen muss, andernfalls kann dies als akademisches Fehlverhalten angesehen werden. Einige Hochschulen fordern auch die Studenten auf, ihre AI-Nutzungsaufzeichnungen einzureichen.

Die Konsequenzen für einen zu hohen AI-Anteil variieren von Schule zu Schule. Eine Gruppe von Hochschulen positioniert die AIGC-Prüfungsergebnisse klar als Hilfsreferenz und betont, dass es sich um eine probabilistische Analyse auf der Grundlage eines Algorithmusmodells handelt, die technische Einschränkungen hat und nur als Hilfsreferenz für die akademische Normativität dient, nicht als Kriterium für die Originalität der Arbeit.

Abbildung: Offizielle Ankündigung des Bachelorstudiums der Universität Nanjing, in der angegeben wird, dass die AIGC-Prüfungsergebnisse nur als Hilfsreferenz für die akademische Normativität dienen

Eine andere Gruppe von Hochschulen setzt klare Schwellenwerte und verwendet die Bewertung dieser Schwellenwerte als Auslöser für Warnungen, Verbesserungen, Verschiebungen der Präsentation oder sogar die Entziehung der Abschlussqualifikation. Beispielsweise regelt die Universität, dass bei Masterarbeiten, bei denen das AIGC-Test-Ergebnis über 40 % liegt, das Graduiertenzentrum das Ergebnis an die Ausbildungsstätte weiterleitet und an den Betreuer und den Studenten eine Warnung sendet, die zur Selbstüberprüfung und -korrektur und zur notwendigen Verbesserung der Arbeit auffordert. Erst nach Zustimmung des Betreuers darf die Präsentation stattfinden.

Die Hefei University of Economics hat den „Anteil an vermeintlich AI-generierten Texten im gesamten Text“ grundsätzlich auf maximal 40 % festgelegt. Wenn dieser Wert überschritten wird, gibt der Betreuer eine Warnung und fordert zur Verbesserung auf. Die Regelungen des Graduiertenzentrums der Heilongjiang University sind noch strenger: Wenn der Anteil an AI-generierten Inhalten zwischen 40 % und 70 % liegt, muss die Arbeit mindestens sechs Monate lang verbessert werden, bevor eine erneute Präsentation beantragt werden kann. Wenn der Anteil über 70 % liegt, wird die Bewerbung um die Abschlussqualifikation entzogen.

Die Wirksamkeit des AIGC-Anteils in den Hochschulregeln ist daher nicht einheitlich. Die traditionelle Plagiatsprüfung hat in der Regel einen klar definierten Grenzwert für die Textkopierrate und Regeln für die Wiederholungsprüfung, während der AIGC-Test in verschiedenen Schulen entweder nur als Hilfsreferenz dienen oder als Grundlage für Verbesserungen, Verschiebungen der Präsentation oder die Entziehung der Abschlussqualifikation verwendet werden kann.

Die Liebe-Hass-Beziehung zu „AI-Forschung“

In der AI-Zeit, wie soll die Hochschulausbildung mit AI umgehen? Xiong Yuxuan, ein Assistentprofessor am Institut für Künstliche Intelligenz und Pädagogik der Zentralchina Normal University, sagte: „In unserem täglichen Unterricht und in der Forschung begegnen wir auch Studenten, die AI-Tools verwenden. Ich bin nicht gegen die Verwendung von AI durch Studenten, sondern unterstütze sogar die häufige Nutzung von AI in der täglichen Arbeit. Aber beim Schreiben einer Arbeit sollte man mit AI vernünftig zusammenarbeiten und AI kritisch nutzen, anstatt blind zu kopieren.“

Aber wie viel AI-Nutzung ist vernünftig? Derzeit gibt es noch keine einheitliche Norm.

Ein Algorithmusingenieur für Large Language Models sagte: „Der AIGC-Test prüft, ob ein Text statistische Merkmale von maschinell generierten Texten aufweist. Der am häufigsten verwendete Indikator ist die 'Perplexity': Menschen schreiben oft sprunghaft, zögern und verwenden persönliche Ausdrücke, was lokal instabil ist. Modelle generieren hingegen homogenere, glattere und wahrscheinlicherere Texte. Der Prüfer trainiert ein Klassifizierungsmodell, um die Unterschiede in der Satzlängenverteilung, der Wortvielfalt und der Verwendung von Übergangswörtern zu lernen. Einige Systeme pflegen auch eine dynamisch aktualisierte 'AI-Merkmalswortliste'. Wenn beispielsweise häufige Übergangsphrasen wie 'Zusammenfassend lässt sich sagen' oder 'Es ist unbestreitbar' häufiger auftauchen, steigt die Wahrscheinlichkeit, dass der Text als AI-generiert erkannt wird, deutlich an.“

Dieser Ansatz kann nur beurteilen, „wie ähnlich“ ein Text AI-generiert aussieht, aber nicht beweisen, „ob“ er es tatsächlich ist.

Eine Studie der Stanford University, die 2023 in der Zeitschrift Patterns veröffentlicht wurde, lieferte bisher die stärksten Beweise: Das Forschungsteam bewertete die Schreibarbeiten von Nicht-Muttersprachlern mit sieben führenden GPT-Prüfprogrammen. Das Ergebnis war, dass mehr als die Hälfte der TOEFL-Aufsätze fälschlicherweise als „AI-generiert“ eingestuft wurden, mit einer durchschnittlichen Fehlalarmrate von 61,22 %.

Extremer noch: Von 91 TOEFL-Aufsätzen wurden 18 von allen sieben Prüfprogrammen als AI-generiert eingestuft, und 89 wurden von mindestens einem Programms als solches markiert. Bei den Aufsätzen von US-amerikanischen achten Klässlern gab es hingegen fast keine Fehlurteile. Die Forscher erklären, dass die von allen Prüfprogrammen fehlklassifizierten Aufsätze eine deutlich niedrigere Perplexity hatten, was bedeutet, dass die Prüfprogramme möglicherweise Autoren mit eingeschränkter Sprachausdrucksfähigkeit bestrafen.

Abbildung: Auch wenn die Texte von Menschen geschrieben wurden, wurden die TOEFL-Aufsätze von Nicht-Muttersprachlern von sieben Prüfprogrammen mit einer Rate von 48 % - 76 % fälschlicherweise als „AI-generiert“ eingestuft, weit höher als die 0 % - 12 % der Aufsätze von US-amerikanischen Schülern. Quelle: Liang et al., Patterns, 2023.

„Derzeit ist der AIGC-Test nur eine vorübergehende Maßnahme, um die Studenten davon abzuhalten, AI-Ergebnisse zu kopieren. Aber die Methode ist definitiv nicht perfekt.“ sagte ein Professor einer führenden Universität.

Diese „vorübergehende Maßnahme“ bringt den Studenten reale Probleme mit sich. Aus den Rückmeldungen mehrerer Bachelor- und Master-Absolventen sowie Studenten im Masterstudium geht hervor, dass AI tief in das Schreiben von Abschlussarbeiten, das Vorstellen von Kursen und die Forschungstrainingen integriert ist. Sie sind sich einig, dass AI nicht die Arbeit ersetzen sollte, aber dass es in bestimmten Phasen nützlich sein kann.

Ein Master-Absolvent sagte, er würde AI nutzen, um „seinen Gedankenstrang zu ordnen“, um chaotische Ideen in einen logischen Rahmen zu bringen, und er würde auch AI nutzen, um seine mündlichen Ausdrücke zu verfeinern, damit sie eher den akademischen Normen entsprechen.

Ein anderer Bachelor-Absolvent beschreibt AI als die „Ausführungsseite“ in der Forschung: Der Student klärt zuerst das Forschungsproblem, gibt klare Anweisungen, liest dann die von AI generierten Codes oder Verarbeitungsergebnisse einzeln durch und überprüft sie, und entscheidet schließlich über den nächsten Schritt. In seiner Ansicht kann AI an der Ausführung beteiligt

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

In dieser Abschlusszeit jene Abschlussarbeiten, die von KI abgelehnt wurden

Wie funktioniert der AIGC-Test?

Die Liebe-Hass-Beziehung zu „AI-Forschung“