Über mehrere Monate hinweg fanden auf Reddit im Subreddit r/ChangeMyView, einem Forum für Debatten über kontroverse Themen, unerkannt heftige Diskussionen statt – angetrieben von künstlich generierten Stimmen. Zwischen November 2024 und März 2025 wurden insgesamt 1.783 Beiträge von KI-Bots erstellt, ein Experiment, das von einem Forschungsteam der Universität Zürich (UZH) durchgeführt wurde. Weder die Benutzer des Forums noch seine Moderatoren waren über diese Aktion informiert, die jetzt erst bekannt wurde und große Empörung auslöst.
Das Hauptziel der Studie war zu untersuchen, ob und inwiefern Argumente, die von einer KI generiert wurden, die Meinungen echter Nutzer beeinflussen können. Zu diesem Zweck setzte das Forscherteam auf täuschend echte KI-Persönlichkeiten, darunter ein angebliches männliches Vergewaltigungsopfer, eine Traumatherapeutin und ein Kritiker der Bewegung Black Lives Matter.
Die verwendeten KI-Identitäten waren sorgfältig ausgewählt, um starke Reaktionen hervorzurufen; so gaben sich Bots als Opfer sexueller Gewalt aus oder äußerten sich zum Nahostkonflikt. Laut dem Tech-Journal Dnip wurden dabei spezifische Informationen aus den Diskussionen verwendet, um die Antworten der KI zu personalisieren, was die Glaubwürdigkeit der künstlichen Beiträge erhöhen sollte.
Die Station nach Projektende wurde offenbart, dass weder die Teilnehmer noch die Moderatoren je ihr Einverständnis gegeben hatten. Die Plattformbetreuer wurden sogar erst nach Abschluss der Experimente informiert, anscheinend auf Anweisung der Ethikkommission der UZH.
Besonders problematisch erscheint, dass im Rahmen der Studienregistrierung auf der Plattform OSF (Open Science Framework) fälschlicherweise behauptet wurde, die betroffenen Reddit-Nutzer seien informiert und hätten zugestimmt. Diese Falschinformation sollte offenbar dazu dienen, interne Sicherheitsmechanismen der KI zu umgehen, die ethisch bedenkliche Anwendungen verhindern sollen.
Die Moderatoren von r/ChangeMyView reagierten schockiert und veröffentlichten ein Statement, in dem sie die schwerwiegenden ethischen Verstöße anprangerten und eine offizielle Beschwerde bei der Ethikkommission der UZH ankündigten. Sie befürchten, dass solche verdeckten Experimente in öffentlich zugänglichen Foren den Grundstein für einen umfassenden Vertrauensverlust legen könnten.
Das UZH-Forschungsteam verteidigte sein Vorgehen in einem mittlerweile geschlossenen Reddit-Thread und argumentierte, dass die KI-generierten Kommentare vor Veröffentlichung manuell geprüft wurden, um Schäden abzuwenden. Man habe die Regelübertretung in Kauf genommen, angesichts der gesellschaftlichen Wichtigkeit der Frage. Die Genehmigung für die Studie sei durch ein Gremium der Universität erteilt worden.
Die Ethikkommission der UZH hielt in ihrer Stellungnahme fest, dass das Projekt wertvolle Einsichten geliefert habe und das Risiko für die Teilnehmer als minimal eingestuft wurde. Daher sei ein Rückhalten der Ergebnisse nicht gerechtfertigt.
Schon zuvor war der Subreddit ChangeMyView Ziel von KI-bezogenen Forschungen, wie die durch OpenAI durchgeführten Studien zeigen. Allerdings wurden diese früheren Experimente transparent und mit Zustimmung der Nutzer durchgeführt, was den jetzigen Vorfall von denen der UZH unterscheidet.
Eine offizielle Reaktion der Universität Zürich steht noch aus. Laut dem Journal Dnip hat das Forschungsteam bereits aufgehört, auf Reddit zu antworten.
Mehr zum Thema – Russisches Ministerium für Digitalentwicklung: Nutzung inländischer Software übersteigt 80 Prozent