search icon
search icon
Flag Arrow Down
Română
Română
Magyar
Magyar
English
English
Français
Français
Deutsch
Deutsch
Italiano
Italiano
Español
Español
Русский
Русский
日本語
日本語
中国人
中国人

言語を変更

arrow down
  • Română
    Română
  • Magyar
    Magyar
  • English
    English
  • Français
    Français
  • Deutsch
    Deutsch
  • Italiano
    Italiano
  • Español
    Español
  • Русский
    Русский
  • 日本語
    日本語
  • 中国人
    中国人
セクション
  • 最新ニュース
  • 独占
  • INSCOP調査
  • ポッドキャスト
  • ディアスポラ
  • モルドバ共和国
  • 政治
  • 経済
  • 現実
  • 国際
  • スポーツ
  • 健康
  • 教育
  • IT&Cの知識
  • アート & ライフスタイル
  • 意見
  • 2025年の選挙
  • 環境
私たちについて
お問い合わせ
プライバシーポリシー
利用規約
ニュースダイジェストを素早くスクロールして、さまざまな出版物でどのように取り上げられているかを確認してください。
  • 最新ニュース
  • 独占
    • INSCOP調査
    • ポッドキャスト
    • ディアスポラ
    • モルドバ共和国
    • 政治
    • 経済
    • 現実
    • 国際
    • スポーツ
    • 健康
    • 教育
    • IT&Cの知識
    • アート & ライフスタイル
    • 意見
    • 2025年の選挙
    • 環境
  1. ホーム
  2. IT&Cの知識
過去24時間以内に新しいニュースが110件あります
21 11月 15:55

大規模な研究は、多くのAI評価テストがシステムの実際の能力を誇張していることを示しています。

Adrian Rusu
whatsapp
facebook
linkedin
x
copy-link copy-link
main event image
IT&Cの知識
Foto: pixabay.com

オックスフォードインターネット研究所が30以上の機関と協力して実施した研究では、人工知能(AI)の評価に使用される445のベンチマークを分析しています。研究者たちは、これらのテストの多くが科学的な厳密さを欠いており、評価すると主張する能力を正しく測定していないことを強調しています。

例えば、一部のベンチマークは評価される能力を明確に定義しておらず、他のものは以前のテストからデータを再利用しており、結果の信頼性に影響を与えています。主要著者の一人であるアダム・マフディは、これらの欠陥がAIの進歩に対する認識を歪める可能性があると警告しています。この研究は、各テストの目的を明確に定義し、より代表的なタスクセットを使用することを含む、より透明で信頼できるベンチマークを作成するための8つの推奨事項を提案しています。

ソース

sursa imagine
Control F5
New Study Finds AI Abilities Are Often Overstated Because of Flawed Tests

ȘTIRI PE ACELEAȘI SUBIECTE

event image
IT&Cの知識
AIチャットボットの集中的な使用は、メンタルヘルスに対して重大なリスクと関連していますが、業界にはこれらのシステムがユーザーを保護しているか、単にエンゲージメントを最適化しているかを評価するための明確な基準がありません。
event image
IT&Cの知識
未来の生命研究所のAI安全性インデックスの新しい版は、OpenAIやMetaなどの主要なAI開発者が、グローバルな安全基準を遵守していないことを示しています。
event image
現実
UNESCOの研究:ルーマニア人とアメリカ人は人工知能を選挙のリスクと見なしているが、伝統的な機関よりも信頼できると考えている。
event image
国際
スタンフォード大学の研究によると、AIチャットボットは有害な行動を正当化し、ユーザーの自己認識や人間関係に悪影響を与えることが示されています。
event image
IT&Cの知識
アンドンラボのチームは、物理的なインタラクションにおける人工知能の現在の能力を評価するために、大規模言語モデル(LLM)を搭載したロボットを作成しました。
app preview
AI検索機能付きのパーソナライズされたニュースフィードと通知で、よりインタラクティブな体験を。
app preview app preview
AI テスト 評価する

編集者のおすすめ

main event image
意見
2時間前

エミル・フレゼアヌ: 今日、学位にはどんな意味があるのでしょうか?

main event image
国際
3時間前

デンマークの防衛情報サービスは、アメリカが経済力を利用して同盟国に意志を押し付け、軍事力で脅迫していると非難しています。

ソース
imagine sursa
imagine sursa
main event image
独占
3時間前
独占コンテンツ

ITニュースレビュー by Control F5 Software: AIチャットボットは不正確な情報を使用して政治的意見に影響を与えることができます

main event image Play button
昨日 22:30
ポッドキャスト

ポッドキャスト: Dialogurile informat.ro - ジレンマ

main event image
現実
4時間前

12月13日から、RCA保険がない場合の罰則が適用され、罰金は1,000レイから2,000レイの間で、自転車や電動スクーターにも適用されます。

ソース
imagine sursa
imagine sursa
app preview
AI検索機能付きのパーソナライズされたニュースフィードと通知で、よりインタラクティブな体験を。
app preview
app store badge google play badge
  • 最新ニュース
  • 独占
  • INSCOP調査
  • ポッドキャスト
  • ディアスポラ
  • モルドバ共和国
  • 政治
  • 経済
  • 現実
  • 国際
  • スポーツ
  • 健康
  • 教育
  • IT&Cの知識
  • アート & ライフスタイル
  • 意見
  • 2025年の選挙
  • 環境
  • 私たちについて
  • お問い合わせ
プライバシーポリシー
クッキーポリシー
利用規約
オープンソースライセンス
すべての権利は Strategic Media Team SRL により保有されています

パートナーシップ技術

anpc-sal anpc-sol