search icon
search icon
Flag Arrow Down
Română
Română
Magyar
Magyar
English
English
Français
Français
Deutsch
Deutsch
Italiano
Italiano
Español
Español
Русский
Русский
日本語
日本語
中国人
中国人

言語を変更

arrow down
  • Română
    Română
  • Magyar
    Magyar
  • English
    English
  • Français
    Français
  • Deutsch
    Deutsch
  • Italiano
    Italiano
  • Español
    Español
  • Русский
    Русский
  • 日本語
    日本語
  • 中国人
    中国人
セクション
  • 最新ニュース
  • 独占
  • INSCOP調査
  • ポッドキャスト
  • ディアスポラ
  • モルドバ共和国
  • 政治
  • 経済
  • 現実
  • 国際
  • スポーツ
  • 健康
  • 教育
  • IT&Cの知識
  • アート & ライフスタイル
  • 意見
  • 2025年の選挙
  • 環境
私たちについて
お問い合わせ
プライバシーポリシー
利用規約
ニュースダイジェストを素早くスクロールして、さまざまな出版物でどのように取り上げられているかを確認してください。
  • 最新ニュース
  • 独占
    • INSCOP調査
    • ポッドキャスト
    • ディアスポラ
    • モルドバ共和国
    • 政治
    • 経済
    • 現実
    • 国際
    • スポーツ
    • 健康
    • 教育
    • IT&Cの知識
    • アート & ライフスタイル
    • 意見
    • 2025年の選挙
    • 環境
  1. ホーム
  2. IT&Cの知識
過去24時間以内に新しいニュースが185件あります
21 11月 15:55

大規模な研究は、多くのAI評価テストがシステムの実際の能力を誇張していることを示しています。

Adrian Rusu
whatsapp
facebook
linkedin
x
copy-link copy-link
main event image
IT&Cの知識
Foto: pixabay.com

オックスフォードインターネット研究所が30以上の機関と協力して実施した研究では、人工知能(AI)の評価に使用される445のベンチマークを分析しています。研究者たちは、これらのテストの多くが科学的な厳密さを欠いており、評価すると主張する能力を正しく測定していないことを強調しています。

例えば、一部のベンチマークは評価される能力を明確に定義しておらず、他のものは以前のテストからデータを再利用しており、結果の信頼性に影響を与えています。主要著者の一人であるアダム・マフディは、これらの欠陥がAIの進歩に対する認識を歪める可能性があると警告しています。この研究は、各テストの目的を明確に定義し、より代表的なタスクセットを使用することを含む、より透明で信頼できるベンチマークを作成するための8つの推奨事項を提案しています。

ソース

sursa imagine
Control F5
New Study Finds AI Abilities Are Often Overstated Because of Flawed Tests
app preview
AI検索機能付きのパーソナライズされたニュースフィードと通知で、よりインタラクティブな体験を。
app preview app preview
AI テスト 評価する
app preview
AI検索機能付きのパーソナライズされたニュースフィードと通知で、よりインタラクティブな体験を。
app preview
app store badge google play badge
  • 最新ニュース
  • 独占
  • INSCOP調査
  • ポッドキャスト
  • ディアスポラ
  • モルドバ共和国
  • 政治
  • 経済
  • 現実
  • 国際
  • スポーツ
  • 健康
  • 教育
  • IT&Cの知識
  • アート & ライフスタイル
  • 意見
  • 2025年の選挙
  • 環境
  • 私たちについて
  • お問い合わせ
プライバシーポリシー
クッキーポリシー
利用規約
オープンソースライセンス
すべての権利は Strategic Media Team SRL により保有されています

パートナーシップ技術

anpc-sal anpc-sol