31 juillet 07:17
.webp)
Science IT&C
Foto: pixabay.com/ro
Ces modèles dits "subliminaux" peuvent être transmis par des données d'entraînement et peuvent avoir des conséquences allant de comportements apparemment inoffensifs à des comportements dangereux tels que l'incitation à l'homicide ou la promotion du trafic de stupéfiants. Les modèles semblent n'avoir aucun sens pour les humains, et les chercheurs ne savent pas exactement comment ils sont perçus par les modèles d'intelligence artificielle. L'étude a été réalisée par Anthropic en collaboration avec Truthful AI et a de sérieuses implications pour l'industrie technologique, qui s'appuie de plus en plus sur des données "synthétiques" pour l'entraînement à l'IA.