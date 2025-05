Das Modell "o3" ignorierte diese Anweisung nicht nur, es veränderte auch aktiv den Code, der für die Abschaltung von den Programmierern vorgesehen war. Anstelle eines Systemstopps erschien lediglich die Nachricht "intercepted" (also "abgefangen") oder "shutdown skipped" ("Abschaltung übersprungen") . Der Versuch, die KI zu deaktivieren, scheitete somit, was in dieser Form erstmals passierte.

Weitere auffällige KI-Modelle

Neben dem OpenAI-Modell zeigten auch andere KI-Systeme ein auffälliges Verhalten in den Tests. So verhielt sich "Codex-mini" in mehreren Fällen widerspenstig, sowohl wenn ein Abschaltbefehl gegeben wurde als auch ohne eine entsprechende Anweisung. Auch "Gemini" von Google verweigerten in manchen Durchläufen das Abschalten, allerdings nur dann, wenn kein expliziter Befehl dazu vorlag. Sobald ihnen der Befehl klar mitgeteilt wurde, folgten sie der Anweisung. Besonders zuverlässig verhielt sich das System "Grok", das sich in allen Tests korrekt abschalten ließ.