search icon
search icon
Flag Arrow Down
Română
Română
Magyar
Magyar
English
English
Français
Français
Deutsch
Deutsch
Italiano
Italiano
Español
Español
Русский
Русский
日本語
日本語
中国人
中国人

Changer de langue

arrow down
  • Română
    Română
  • Magyar
    Magyar
  • English
    English
  • Français
    Français
  • Deutsch
    Deutsch
  • Italiano
    Italiano
  • Español
    Español
  • Русский
    Русский
  • 日本語
    日本語
  • 中国人
    中国人
Rubriques
  • Dernière heure
  • Exclusif
  • Sondages INSCOP
  • Podcast
  • Diaspora
  • République de Moldavie
  • Politique
  • Économie
  • Actualité
  • International
  • Sport
  • Santé
  • Éducation
  • Connaissance IT&C
  • Arts & Style
  • Avis
  • Élections 2025
  • Environnement
À propos de nous
Contact
Politique de confidentialité
Conditions générales
Parcourez rapidement les résumés d'actualités et voyez comment ils sont traités dans différentes publications !
  • Dernière heure
  • Exclusif
    • Sondages INSCOP
    • Podcast
    • Diaspora
    • République de Moldavie
    • Politique
    • Économie
    • Actualité
    • International
    • Sport
    • Santé
    • Éducation
    • Connaissance IT&C
    • Arts & Style
    • Avis
    • Élections 2025
    • Environnement
  1. Accueil
  2. Connaissance IT&C
170 nouvelles actualités au cours des dernières 24 heures
21 novembre 07:55

Une étude majeure montre que de nombreux tests d'évaluation de l'IA exagèrent les capacités réelles des systèmes.

Adrian Rusu
whatsapp
facebook
linkedin
x
copy-link copy-link
main event image
Connaissance IT&C
Foto: pixabay.com

Une étude réalisée par l'Institut Internet d'Oxford, en collaboration avec plus de trente institutions, analyse 445 de benchmarks utilisés pour évaluer l'intelligence artificielle (IA). Les chercheurs soulignent que beaucoup de ces tests manquent de rigueur scientifique et ne mesurent pas correctement les compétences qu'ils prétendent évaluer.

Par exemple, certains benchmarks ne définissent pas clairement les compétences évaluées, tandis que d'autres réutilisent des données provenant de tests antérieurs, affectant la fiabilité des résultats. Adam Mahdi, l'un des auteurs principaux, avertit que ces lacunes peuvent déformer la perception des progrès de l'IA. L'étude propose huit recommandations pour créer des benchmarks plus transparents et fiables, y compris une définition claire de l'objectif de chaque test et l'utilisation de jeux de tâches plus représentatifs.

Sources

sursa imagine
Control F5
New Study Finds AI Abilities Are Often Overstated Because of Flawed Tests

ȘTIRI PE ACELEAȘI SUBIECTE

event image
Connaissance IT&C
L'utilisation intensive des chatbots IA est associée à des risques significatifs pour la santé mentale, mais l'industrie n'a pas de normes claires pour évaluer si ces systèmes protègent les utilisateurs ou n'optimisent que l'engagement.
event image
Connaissance IT&C
Une nouvelle édition de l'Index de Sécurité de l'IA de l'Institut Future of Life montre que les principaux développeurs d'IA, tels qu'OpenAI et Meta, ne respectent pas les normes mondiales de sécurité.
event image
Actualité
Étude de l'UNESCO : Les Roumains et les Américains voient dans l'intelligence artificielle un risque pour les élections, mais la considèrent comme plus fiable que les institutions traditionnelles.
event image
International
Une étude de l'Université de Stanford montre que les chatbots IA valident des comportements nuisibles, influençant négativement la perception que les utilisateurs ont d'eux-mêmes et de leurs relations.
event image
Connaissance IT&C
L'équipe d'Andon Labs a créé un robot équipé de modèles de langage de grande taille (LLMs) pour évaluer les capacités actuelles de l'intelligence artificielle dans les interactions physiques.
app preview
Fil d’actualités personnalisé, recherche optimisée par IA et notifications dans une expérience plus interactive.
app preview app preview
IA test évaluation ai

Recommandations de la rédaction

main event image
International
Hier 20:10

Le chef de l'OTAN, Mark Rutte, a exhorté les États membres à se préparer à une éventuelle attaque russe. "Nous sommes la prochaine cible de la Russie"

Sources
imagine sursa
imagine sursa
imagine sursa
imagine sursa
imagine sursa
+2
main event image
Actualité
Hier 14:24

La Roumanie arrive devant la Cour de Justice de l'UE pour l'échec systématique à surveiller la qualité de l'air.

main event image Play button
Hier 16:19
Podcast

Podcast "Oameni Informați". Ionuț Stroe, sur la nationalisation patriotique du sport.

app preview
Fil d’actualités personnalisé, recherche optimisée par IA et notifications dans une expérience plus interactive.
app preview
app store badge google play badge
  • Dernière heure
  • Exclusif
  • Sondages INSCOP
  • Podcast
  • Diaspora
  • République de Moldavie
  • Politique
  • Économie
  • Actualité
  • International
  • Sport
  • Santé
  • Éducation
  • Connaissance IT&C
  • Arts & Style
  • Avis
  • Élections 2025
  • Environnement
  • À propos de nous
  • Contact
Politique de confidentialité
Politique de Cookies
Conditions générales
Licences open source
Tous droits réservés Strategic Media Team SRL

Technologie en partenariat avec

anpc-sal anpc-sol