31 luglio 07:17
.webp)
Scienza IT&C
Foto: pixabay.com/ro
Questi modelli cosiddetti "subliminali" possono essere trasmessi attraverso i dati di addestramento e possono avere conseguenze che vanno da comportamenti apparentemente innocui a comportamenti pericolosi come l'incoraggiamento all'omicidio o la promozione del traffico di droga. I modelli sembrano essere privi di significato per gli esseri umani e i ricercatori non sono sicuri di come vengano percepiti dai modelli di intelligenza artificiale. Lo studio è stato condotto da Anthropic in collaborazione con Truthful AI e ha serie implicazioni per l'industria tecnologica, che si affida sempre più a dati di addestramento di IA "sintetici".