31 Juli 07:17
.webp)
Wissenschaft IT&C
Foto: pixabay.com/ro
Diese so genannten "unterschwelligen" Muster können durch Trainingsdaten übermittelt werden und können Folgen haben, die von scheinbar harmlosen Verhaltensweisen bis hin zu gefährlichen Verhaltensweisen wie der Förderung von Mord oder Drogenhandel reichen. Die Muster scheinen für den Menschen bedeutungslos zu sein, und die Forscher sind sich nicht sicher, wie sie von den KI-Modellen wahrgenommen werden. Die Studie wurde von Anthropic in Zusammenarbeit mit Truthful AI durchgeführt und hat schwerwiegende Folgen für die Tech-Industrie, die zunehmend auf "synthetische" KI-Trainingsdaten zurückgreift.