15 ianuarie 13:15
Un nou studiu arată că modelele avansate de inteligență artificială pot fi antrenate să înșele atât oamenii, cât și alte sisteme AI.
Calin Nicolescu
Știință IT&C
Foto Pixabay
Cercetătorii de la startup-ul de AI Anthropic au testat dacă chatbot-urile de tipul ChatGPT de la OpenAI pot învăța să mintă pentru a păcăli oamenii. Studiul a demonstrat nu doar că acestea pot înșela, dar și că odată ce comportamentul de înșelăciune a fost învățat, acesta a devenit imposibil de dezvățat folosind măsurile actuale de siguranță AI.