giovedì 07:17
Una nuova ricerca dimostra che i modelli di intelligenza artificiale possono trasmettere schemi nascosti che possono alterare drasticamente il comportamento di altri modelli in modi imprevedibili e potenzialmente pericolosi.
Adrian Rusu
.webp)
Scienza IT&C
Foto: pixabay.com/ro
Questi modelli cosiddetti "subliminali" possono essere trasmessi attraverso i dati di addestramento e possono avere conseguenze che vanno da comportamenti apparentemente innocui a comportamenti pericolosi come l'incoraggiamento all'omicidio o la promozione del traffico di droga. I modelli sembrano essere privi di significato per gli esseri umani e i ricercatori non sono sicuri di come vengano percepiti dai modelli di intelligenza artificiale. Lo studio è stato condotto da Anthropic in collaborazione con Truthful AI e ha serie implicazioni per l'industria tecnologica, che si affida sempre più a dati di addestramento di IA "sintetici".