Bildzeile
Forschung
Prof. Meske mit Best Paper Award auf ICAART ausgezeichnet
In dieser Arbeit werden KI-Modelle auf ihre Fähigkeiten irreführende Erklärungen erstellen und erkennen zu können untersucht. In der empirischen Evaluation wurden Textklassifizierungen und über GradCAM erstellte sowie veränderte Erklärungen untersucht. Zudem wurden mit 200 Probanden der Effekt von täuschenden Erklärungen evaluiert. Die Erkenntnisse bestätigen, dass täuschende Erklärungen Menschen tatsächlich trügen können. Machine Learning Methoden können eingesetzt werden, um geringfügige Täuschungsversuche mit einer Genauigkeit von 80% zu erkennen.
Veröffentlicht
Von
Lehrstuhl für Soziotechnisches Systemdesign und Künstliche Intelligenz