Skjulte lag forskere omgår OpenAI sine guardrails, avdekker kritisk svakhet i AI-selvmoderasjon
Den 6. oktober 2025, OpenAI annonserte AgentKit, et verktøy for å bygge, distribuere og håndtere AI-agenter. En av komponentene er Guardrails—et modulært sikkerhetslag designet for å...