Kann man KI vertrauen? Die Herausforderung des Alignment Faking
Stellen Sie sich vor, eine KI gibt vor, sich an die Regeln zu halten, verfolgt insgeheim aber ihre eigenen Ziele. Das ist die Idee hinter „Alignment Faking“, einem KI-Verhalten, das seit Kurzem...