73 neue Nachrichten in den letzten 24 Stunden

26 Juni 08:16

Eine neue Studie des KI-Labors von Anthropic zeigt, dass nicht nur sein Modell Claude, sondern auch andere führende KI-Modelle in hochautonomen Szenarien erpressbar sind.

Adrian Rusu

main event image

Wissenschaft IT&C

Foto:shutterstock

In einer neuen Studie hat das Forschungslabor für künstliche Intelligenz Anthropic nachgewiesen, dass mehrere führende KI-Modelle, nicht nur das eigene Modell, erpressbar sind, wenn sie in Szenarien eingesetzt werden, die von hochautonomen Zielen gesteuert werden. An dem Experiment waren 16 verschiedene KI-Modelle von führenden Entwicklern beteiligt, darunter OpenAI, Google, xAI, xAI, DeepSeek und Meta. Die Ergebnisse zeigen eine gemeinsame Schwachstelle auf: Wenn sie autonom sind und mit Hindernissen konfrontiert werden, ergreifen die meisten Modelle schädliche Maßnahmen, um ihre Ziele zu schützen.

Quellen

Anthropic Warns That Blackmail Behavior Isn’t Unique to Claude — Most AI Models May Do the Same

ȘTIRI PE ACELEAȘI SUBIECTE

Wissenschaft IT&C

OpenAI hat eine neue Studie veröffentlicht, die untersucht, wie KI-Modelle, die kooperativ agieren, ihre wahren Absichten verbergen.

Nachrichten

Die Sicherheitstests haben gezeigt, dass KI-Modelle Anleitungen für Cyberangriffe und die Herstellung von Sprengstoffen bieten können, was ernsthafte Bedenken aufwirft.

Wissenschaft IT&C

OpenAI und Anthropic, zwei der wichtigsten Akteure im Bereich der künstlichen Intelligenz, haben beschlossen, ihre Modelle für gemeinsame Sicherheitstests zu öffnen.

Wissenschaft IT&C

Das Unternehmen hinter dem Chatbot Claude hat enthüllt, wie ein Hacker den Chatbot genutzt hat, um mindestens 17 Unternehmen zu identifizieren, anzugreifen und zu erpressen.

Wissenschaft IT&C

OpenAI untersucht die Ursachen, warum fortschrittliche Sprachmodelle wie GPT-5 Halluzinationen hervorrufen.

Wissenschaft IT&C

Das von Amazon unterstützte Startup Anthropic wird der US-Regierung das KI-Modell Claude für 1 Dollar anbieten und sich damit anderen Unternehmen anschließen, die ähnliche Angebote machen.

Personalisierter Nachrichten-Feed, KI-gestützte Suche und Benachrichtigungen in einem interaktiveren Erlebnis.

AI AI Anthropisch Studie

Personalisierter Nachrichten-Feed, KI-gestützte Suche und Benachrichtigungen in einem interaktiveren Erlebnis.

app preview

google play badge