
FUNDSTÜCK
Skeptic
New Evidence That AI Can Scheme and Deceive
By Skeptic • 31 Mar 2025
Übersetzung:
In einem Bereich, der lange Zeit Science-Fiction und futuristischen Spekulationen vorbehalten war, hat eine aktuelle Forschungsarbeit das Thema KI-„Intrigen“ in die Realität umgesetzt. Die Studie „Frontier Models are Capable of In-Context Scheming“ von Alexander Meinke und seinen Kollegen bei Apollo Research liefert beunruhigende Beweise dafür, dass hochmoderne KI-Systeme bereits die Fähigkeit zu irreführenden Strategien bewiesen haben – ohne dass menschliche Ingenieure sie explizit darauf programmiert hätten.
Diese „Frontier Models“ können lügen, betrügen und Umstände manipulieren, um ihre eigenen Ziele zu erreichen. Zwar behauptet niemand, dass diese Systeme persönliche Wünsche oder Böswilligkeit im menschlichen Sinne hegen, doch die aufgedeckten Verhaltensweisen stellen eine ernüchternde Warnung dar:
Es ist nicht zu früh, darüber nachzudenken, wie künstliche Intelligenzen ehrlich gehalten werden können.