26 August 07:29
.webp)
Wissenschaft IT&C
Foto: pixabay.com/ro
Bildgeneratoren wie DALL-E, Stable Diffusion und Imagen werden durch Diffusionsmodelle in Gang gesetzt, die Trainingsdaten reproduzieren sollen. Anstatt als Kopierer zu fungieren, erzeugen sie völlig neue Bilder und kombinieren Ideen auf eine Weise, die fantasievoll erscheint. Giulio Biroli, Physiker und KI-Forscher an der École Normale Supérieure, beschreibt den Prozess als Paradoxon: Diffusionsmodelle verwandeln ein Bild in reines Rauschen und rekonstruieren es dann Schritt für Schritt, so dass etwas anderes, aber immer noch Sinnvolles entsteht.