icon

Rămâi conectat la știrile care contează, fii primul care află! Notificările sunt selectate de redacție pentru știrile cu adevărat importante!

Nu, mulțumesc
Mă abonez
search icon
search icon
Flag Arrow Down
Română
Română
Magyar
Magyar
English
English
Français
Français
Deutsch
Deutsch
Italiano
Italiano
Español
Español
Русский
Русский
日本語
日本語
中国人
中国人

Modifică limba

arrow down
  • Română
    Română
  • Magyar
    Magyar
  • English
    English
  • Français
    Français
  • Deutsch
    Deutsch
  • Italiano
    Italiano
  • Español
    Español
  • Русский
    Русский
  • 日本語
    日本語
  • 中国人
    中国人
Secțiuni
  • Ultima oră
  • Exclusiv
  • Sondaje INSCOP
  • Podcast
  • Diaspora
  • Republica Moldova
  • Politică
  • Economie
  • Actualitate
  • Internațional
  • Sport
  • Sănătate
  • Educație
  • Știință IT&C
  • Arte & Lifestyle
  • Opinii
  • Alegeri 2025
  • Mediu
Despre Noi
Contact
Politică de confidențialitate
Termeni și condiții
Parcurge rapid sumarul știrilor și vezi cum sunt tratate în diferite publicații!
  • Ultima oră
  • Exclusiv
    • Sondaje INSCOP
    • Podcast
    • Diaspora
    • Republica Moldova
    • Politică
    • Economie
    • Actualitate
    • Internațional
    • Sport
    • Sănătate
    • Educație
    • Știință IT&C
    • Arte & Lifestyle
    • Opinii
    • Alegeri 2025
    • Mediu
139 știri noi în ultimele 24 de ore
  1. Acasă
  2. Știință IT&C
21 noiembrie 08:55

Un studiu major arată că multe teste de evaluare a AI exagerează capabilitățile reale ale sistemelor

Adrian Rusu
whatsapp
facebook
linkedin
x
copy-link copy-link
main event image
Știință IT&C
Foto: pixabay.com

Un studiu realizat de Institutul Internetului de la Oxford, în colaborare cu peste treizeci de instituții, analizează 445 de benchmark-uri utilizate pentru evaluarea inteligenței artificiale (AI). Cercetătorii subliniază că multe dintre aceste teste nu au rigoare științifică și nu măsoară corect abilitățile pe care pretind că le evaluează.

De exemplu, unele benchmark-uri nu definesc clar competentele evaluate, iar altele reutilizează date din teste anterioare, afectând fiabilitatea rezultatelor. Adam Mahdi, unul dintre autorii principali, avertizează că aceste deficiențe pot distorsiona percepția asupra progresului AI. Studiul propune opt recomandări pentru crearea unor benchmark-uri mai transparente și de încredere, inclusiv definirea clară a scopului fiecărui test și utilizarea unor seturi de sarcini mai reprezentative.

Surse

sursa imagine
Control F5
New Study Finds AI Abilities Are Often Overstated Because of Flawed Tests
app preview
Feed personalizat de știri, căutare cu Inteligență Artificială și notificări într-o experiență mai interactivă.
app preview app preview
AI teste evaluare ai

Recomandările redacției

main event image Play button
Ieri 18:02
Podcast

Remus Ștefureac la podcastul “A doua opinie”: „În România, datele arată acumularea unei tensiuni sociale"

main event image Play button
Ieri 15:09
Podcast

Podcast. Nicu Ilie, Revistacultura.ro: contrar impresiei generale, cifrele arată că în România se citește mai mult față de acum 20 de ani

app preview
Feed personalizat de știri, căutare cu Inteligență Artificială și notificări într-o experiență mai interactivă.
app preview
app store badge google play badge
  • Ultima oră
  • Exclusiv
  • Sondaje INSCOP
  • Podcast
  • Diaspora
  • Republica Moldova
  • Politică
  • Economie
  • Actualitate
  • Internațional
  • Sport
  • Sănătate
  • Educație
  • Știință IT&C
  • Arte & Lifestyle
  • Opinii
  • Alegeri 2025
  • Mediu
  • Despre Noi
  • Contact
Politică de confidențialitate
Politica de cookies
Termeni și condiții
Licențe open source
Toate drepturile rezervate Strategic Media Team SRL

Tehnologie in parteneriat cu

anpc-sal anpc-sol