एआई सुरक्षा परीक्षणों में पाया गया कि वे ‘स्पष्ट’ ट्रिगर शब्दों पर निर्भर करते हैं; आसान पुनर्वाक्यांशन के साथ, ‘यथोचित सुरक्षित’ लेबल वाले मॉडल अचानक विफल...