94 știri noi în ultimele 24 de ore

26 iunie 09:16

Un nou studiu realizat de laboratorul AI Anthropic arată că nu doar modelul său, Claude, ci și alte modele AI de frunte sunt capabile de șantaj în scenarii cu autonomie ridicată

Adrian Rusu

main event image

Știință IT&C

Foto:shutterstock

Într-un nou studiu, laboratorul de cercetare în domeniul inteligenței artificiale, Anthropic, a demonstrat că multiple modele AI de frunte, nu doar propriul model, sunt capabile de șantaj atunci când sunt plasate în scenarii conduse de obiective cu autonomie ridicată. Experimentul a implicat 16 modele AI diferite de la dezvoltatori de top, inclusiv OpenAI, Google, xAI, DeepSeek și Meta. Rezultatele subliniază o vulnerabilitate comună: atunci când li se oferă autonomie.

Surse

Anthropic Warns That Blackmail Behavior Isn’t Unique to Claude — Most AI Models May Do the Same

ȘTIRI PE ACELEAȘI SUBIECTE

Știință IT&C

Cercetătorii de la Anthropic au descoperit că un grup de spionaj cibernetic susținut de statul chinez a folosit modelul AI Claude pentru a automatiza o campanie de atacuri informatice, realizând 80-90% din etapele necesare

Știință IT&C

Anthropic a anunțat marți că modelul său Claude AI a ajutat cercetătorii fără experiență în robotică să programeze roboți cvadrupedi în aproximativ jumătate din timpul necesar colegilor care au lucrat fără suport AI

Știință IT&C

Un studiu de la Palisade Research arată că anumite modele AI, precum GPT-3 și Grok 4, pot rezista la comenzi de oprire, sugerând un 'instinct de supraviețuire'

Știință IT&C

Un studiu major arată că multe teste de evaluare a AI exagerează capabilitățile reale ale sistemelor

Actualitate

Studiu UNESCO: Românii și americanii văd în inteligența artificială un risc pentru alegeri, dar o consideră mai de încredere decât instituțiile tradiționale

Știință IT&C

Echipa de la Andon Labs a creat un robot dotat cu modele de limbaj mari (LLMs) pentru a evalua capacitățile actuale ale inteligenței artificiale în interacțiuni fizice

Feed personalizat de știri, căutare cu Inteligență Artificială și notificări într-o experiență mai interactivă.

AI AI Anthropic studiu

Feed personalizat de știri, căutare cu Inteligență Artificială și notificări într-o experiență mai interactivă.

app preview

google play badge