Eine umfassende Studie zeigt, dass viele Tests zur Bewertung von KI die tatsächlichen Fähigkeiten der Systeme übertreiben.

Adrian Rusu

IT&C-Wissen

Foto: pixabay.com

Eine Studie des Internet Institute der Universität Oxford, in Zusammenarbeit mit über dreißig Institutionen, analysiert 445 Benchmarks, die zur Bewertung von Künstlicher Intelligenz (KI) verwendet werden. Die Forscher betonen, dass viele dieser Tests keine wissenschaftliche Strenge aufweisen und die Fähigkeiten, die sie zu bewerten vorgeben, nicht korrekt messen.

Zum Beispiel definieren einige Benchmarks die bewerteten Kompetenzen nicht klar, während andere Daten aus früheren Tests wiederverwenden, was die Zuverlässigkeit der Ergebnisse beeinträchtigt. Adam Mahdi, einer der Hauptautoren, warnt, dass diese Mängel die Wahrnehmung des Fortschritts der KI verzerren können. Die Studie schlägt acht Empfehlungen zur Schaffung transparenterer und vertrauenswürdigerer Benchmarks vor, einschließlich einer klaren Definition des Zwecks jedes Tests und der Verwendung repräsentativerer Aufgabenstellungen.

Quellen

Control F5

New Study Finds AI Abilities Are Often Overstated Because of Flawed Tests

Personalisierter Nachrichten-Feed, KI-gestützte Suche und Benachrichtigungen in einem interaktiveren Erlebnis.

KI Test Bewertung

Eine umfassende Studie zeigt, dass viele Tests zur Bewertung von KI die tatsächlichen Fähigkeiten der Systeme übertreiben.

Quellen

Informat Diaspora

Die Rumänen in der Diaspora haben zwischen 2013 und 2025 60 Milliarden Euro nach Rumänien geschickt, eine bedeutende Summe, die den Wert des Nationalen Wiederaufbau- und Resilienzplans übersteigt.

Empfehlungen der Redaktion

USR validiert die Vorschläge für die Regierung: Radu Miruță Vizepremier und Minister für Verteidigung und Irineu Darău Minister für Wirtschaft, Digitalisierung, Unternehmertum und Tourismus

Ilie Bolojan erklärt nach dem Dokumentarfilm Recorder, dass das Misstrauen in die Justiz legitim ist und kündigt an, dass die Vorschläge für die Gesetze der Justiz bis Januar abgeschlossen sein werden.

Emmanuel Macron glaubt, dass die Europäer die Gespräche mit Putin wieder aufnehmen sollten, um die Friedensverhandlungen in der Ukraine zu erleichtern.

Premier Ilie Bolojan: ,,Die Anzahl der Parlamentarier könnte um etwa 50 reduziert werden. Man kann 500 Parlamentarier haben, man kann 300 haben, die Qualität der Parlamentarier ist sehr wichtig.''

Die Erhöhung der Verbrauchsteuern und der Mehrwertsteuer auf Kraftstoffe, beginnend am 1. Januar 2026, wird zu einer geschätzten Verteuerung von 0,3 Lei/Liter führen.

Die Zahl der Grippefälle ist in Rumänien signifikant gestiegen und hat sich innerhalb einer Woche fast verdoppelt, gemäß den Daten des Nationalen Instituts für öffentliche Gesundheit (INSP)

Podcast. Nicu Ilie, Revistacultura.ro: entgegen dem allgemeinen Eindruck zeigen die Zahlen, dass in Rumänien mehr gelesen wird als vor 20 Jahren.

Die Demokraten im amerikanischen Kongress haben 68 neue Fotos aus der Akte Jeffrey Epstein veröffentlicht und die Trump-Regierung aufgefordert, die entsprechenden Dokumente offenzulegen.