Konferenzpapier zur Schwarmintelligenz in Large Language Models auf der ECIS 2026 vorgestellt – Soziotechnisches Systemdesign und Künstliche Intelligenz

Bildzeile

Forschung

Konferenzpapier zur Schwarmintelligenz in Large Language Models auf der ECIS 2026 präsentiert

Justin Brenne stellte auf der 34th European Conference on Information Systems (ECIS) in Mailand ein Completed Research Paper (CRP) zur Aggregation von Large Language Model-Ausgaben im Kontext künstlicher Schwarmintelligenz vor.

Im Rahmen der 34th European Conference on Information Systems (ECIS, VHB: A) in Mailand präsentierte Justin Brenne gemeinsam mit Prof. Christian Meske aktuelle Forschungsergebnisse zum Thema künstliche Schwarmintelligenz in Large Language Models.

Schwarmintelligenz beschreibt das Phänomen, durch das Gruppen kollektiv genauere Urteile treffen als ihre einzelnen Mitglieder und ist seit Francis Galtons berühmtem Ochsenwiegeversuch aus dem Jahr 1906 vielfach empirisch belegt. In der Praxis stoßen menschliche Schwärme jedoch an strukturelle Grenzen: Koordinationsaufwand, Kosten, Zeitdruck und Anfälligkeit für soziale Einflüsse schränken ihre Anwendbarkeit erheblich ein. Large Language Models (LLMs) bieten hier eine vielversprechende Alternative; sie sind skalierbar, kostengünstig sowie wiederholt abfragbar.

Im Rahmen eines kontrollierten Experiments wurden 960 Prompts manuell durchgeführt und ausgewertet. Drei proprietäre Modelle (GPT-5, Gemini 2.5 Pro und Claude Sonnet 4.5) wurden dabei auf verschiedene Schätzaufgaben angewendet. Untersucht wurden zwei Aggregationsmodi: Intra-Modell-Aggregation (wiederholtes Abfragen desselben Modells) sowie Inter-Modell-Aggregation (Pooling aller drei Modelle).

Die Ergebnisse zeigen, dass die Aggregation von LLM-Ausgaben konsistent zu einer Fehlerreduktion führt. Gleichzeitig zeigte sich, dass mehr Modelle nicht zwingend zu besseren Punktschätzungen führen, wohl aber die Unsicherheitsabdeckung verbessern: Im Inter-Modell-Modus wurde der wahre Wert bei allen Aufgaben innerhalb des gemittelten Konfidenzintervalls erfasst; ein Ergebnis, das keiner der einzelnen Modellmodi erreichte. Darüber hinaus deuten signifikante positive Korrelationen zwischen der relativen Breite der selbstberichteten Konfidenzintervalle und dem tatsächlichen Schätzfehler auf eine Form künstlicher Metakognition hin: LLMs scheinen zu „wissen“, wenn sie unsicher sind.

Die Studie diskutiert Implikationen für Forschung und Praxis und schlägt unter anderem aufgabenabhängige Einsatzstrategien sowie gestufte Entscheidungssysteme vor, in denen die Breite der Konfidenzintervalle den Eskalationsgrad, von automatisierter Ausführung über menschliche Überprüfung bis hin zu Expertenkommissionen, steuert.

Das Completed Research Paper wurde in den Proceedings der ECIS 2026 veröffentlicht und ist hier abrufbar.

Aktuelles

Übersicht

Veröffentlicht

Von

Lehrstuhl für Soziotechnisches Systemdesign und Künstliche Intelligenz