search icon
search icon
Flag Arrow Down
Română
Română
Magyar
Magyar
English
English
Français
Français
Deutsch
Deutsch
Italiano
Italiano
Español
Español
Русский
Русский
日本語
日本語
中国人
中国人

Changer de langue

arrow down
  • Română
    Română
  • Magyar
    Magyar
  • English
    English
  • Français
    Français
  • Deutsch
    Deutsch
  • Italiano
    Italiano
  • Español
    Español
  • Русский
    Русский
  • 日本語
    日本語
  • 中国人
    中国人
Rubriques
  • Dernière heure
  • Exclusif
  • Sondages INSCOP
  • Podcast
  • Diaspora
  • République de Moldavie
  • Politique
  • Économie
  • Actualité
  • International
  • Sport
  • Santé
  • Éducation
  • Connaissance IT&C
  • Arts & Style
  • Avis
  • Élections 2025
  • Environnement
À propos de nous
Contact
Politique de confidentialité
Conditions générales
Parcourez rapidement les résumés d'actualités et voyez comment ils sont traités dans différentes publications !
  • Dernière heure
  • Exclusif
    • Sondages INSCOP
    • Podcast
    • Diaspora
    • République de Moldavie
    • Politique
    • Économie
    • Actualité
    • International
    • Sport
    • Santé
    • Éducation
    • Connaissance IT&C
    • Arts & Style
    • Avis
    • Élections 2025
    • Environnement
  1. Accueil
  2. Connaissance IT&C
65 nouvelles actualités au cours des dernières 24 heures
21 novembre 07:55

Une étude majeure montre que de nombreux tests d'évaluation de l'IA exagèrent les capacités réelles des systèmes.

Adrian Rusu
whatsapp
facebook
linkedin
x
copy-link copy-link
main event image
Connaissance IT&C
Foto: pixabay.com

Une étude réalisée par l'Institut Internet d'Oxford, en collaboration avec plus de trente institutions, analyse 445 de benchmarks utilisés pour évaluer l'intelligence artificielle (IA). Les chercheurs soulignent que beaucoup de ces tests manquent de rigueur scientifique et ne mesurent pas correctement les compétences qu'ils prétendent évaluer.

Par exemple, certains benchmarks ne définissent pas clairement les compétences évaluées, tandis que d'autres réutilisent des données provenant de tests antérieurs, affectant la fiabilité des résultats. Adam Mahdi, l'un des auteurs principaux, avertit que ces lacunes peuvent déformer la perception des progrès de l'IA. L'étude propose huit recommandations pour créer des benchmarks plus transparents et fiables, y compris une définition claire de l'objectif de chaque test et l'utilisation de jeux de tâches plus représentatifs.

Sources

sursa imagine
Control F5
New Study Finds AI Abilities Are Often Overstated Because of Flawed Tests
app preview
Fil d’actualités personnalisé, recherche optimisée par IA et notifications dans une expérience plus interactive.
app preview app preview
IA test évaluation ai

Recommandations de la rédaction

main event image
Actualité
Hier 20:07

Le Premier Ilie Bolojan souligne la nécessité d'une décision rapide de la CCR pour permettre l'entrée en vigueur de la loi sur les retraites, avertissant des blocages.

Sources
imagine sursa
imagine sursa
imagine sursa
imagine sursa
imagine sursa
+7
main event image
International
Hier 18:22

Donald Trump a déclaré que les États-Unis conduiront le Venezuela dans une transition vers la démocratie, menaçant d'actions militaires supplémentaires si nécessaire.

Sources
imagine sursa
imagine sursa
imagine sursa
imagine sursa
imagine sursa
+4
main event image
Avis
Hier 10:43

2025 – Une année compliquée

main event image
International
Hier 10:32

Gustavo Petro, le président de la Colombie, a demandé à l'ONU de se réunir d'urgence après les explosions à Caracas

Sources
imagine sursa
imagine sursa
imagine sursa
app preview
Fil d’actualités personnalisé, recherche optimisée par IA et notifications dans une expérience plus interactive.
app preview
app store badge google play badge
  • Dernière heure
  • Exclusif
  • Sondages INSCOP
  • Podcast
  • Diaspora
  • République de Moldavie
  • Politique
  • Économie
  • Actualité
  • International
  • Sport
  • Santé
  • Éducation
  • Connaissance IT&C
  • Arts & Style
  • Avis
  • Élections 2025
  • Environnement
  • À propos de nous
  • Contact
Politique de confidentialité
Politique de Cookies
Conditions générales
Licences open source
Tous droits réservés Strategic Media Team SRL

Technologie en partenariat avec

anpc-sal anpc-sol