
OpenAI表示GPT-5现在与人类专家在关键职业中竞争
OpenAI发布了一项名为GDPval的新测试结果,该测试旨在评估人工智能模型在经济价值任务中的表现,与人类专业人士进行比较。该研究涵盖了44个新兴行业的职业,包括健康、金融、新闻和生产。GPT-5在超过40%的案例中被认为与领域专家相当,甚至更好,而Anthropic的Claude Opus 4.1则获得了更高的49%的分数。
尽管测试仅限于书面报告,并未涵盖现实世界中的所有任务,但结果显示出快速的进展。仅在15个月前,GPT-4o在类似比较中仅获得了13.7%的分数。OpenAI表示,这些改进可能使员工能够将日常任务转移给AI,并专注于更高价值的活动,尽管公司强调人工智能尚未准备好全面取代人类在整个职业中的角色。
欧洲央行通过新创新平台加速数字欧元的发展
欧洲中央银行(ECB)发布了其数字欧元创新平台第一阶段的结论,强调数字货币在实践中的运作方式。第一轮测试集中在日常支付上,从个人之间的转账到在线购物。结果显示,数字欧元可以集成到现有的银行和商业系统中,提供更快、更安全的交易。
基于这些结果,欧洲央行宣布了第二阶段的实验。这将探索更先进的功能,如离线支付和跨境交易。目标是使数字欧元成为一种可靠、高效且广泛接受的支付形式,同时保持财务隐私和稳定性。
Spotify更新AI音乐规则以提高透明度并减少垃圾邮件
Spotify更新了其关于AI的政策,以澄清人工智能在音乐制作中的使用方式,并打击垃圾邮件上传。该流媒体巨头将采用一种名为DDEX的行业标准,要求唱片公司和分销商披露是否使用了AI进行人声、乐器或后期制作。因此,听众将更好地理解AI在一首曲子中的角色,而不会过于简化过程。
该公司还推出了一种新的反垃圾邮件过滤器,以检测和降级欺诈或低质量的音乐,同时禁止未经授权的声音克隆和深度伪造。随着AI生成的音乐在流媒体平台上的快速增长,Spotify表示支持AI的真实和创造性使用,但希望阻止恶意行为者滥用系统。
微软将Anthropic的AI集成到Copilot中
微软已将Anthropic的AI模型集成到其Copilot助手中,超越了对OpenAI的依赖。从现在开始,商业用户可以选择OpenAI模型或Anthropic的Claude Opus 4.1和Claude Sonnet 4。这一举措反映了微软多样化AI生态系统的战略,并减少对单一合作伙伴的依赖。
这两个Claude模型具有不同的角色:Opus 4.1专注于复杂推理、编程和建筑设计,而Sonnet 4更适合常规开发、大数据集任务和内容生成。这种灵活性旨在为企业提供更适合的AI支持,融入微软的产品套件中。
OpenAI推出ChatGPT Pulse以提供个性化的早间简报
OpenAI推出了ChatGPT Pulse,这是一项新功能,可以在夜间生成个性化报告,并在早晨交付给用户。这些每日简报包括新闻、个人日程和精选推荐——从体育更新到家庭度假计划。Pulse旨在使ChatGPT更像一个主动的助手,而不是一个被动的聊天机器人。
最初面向每月200美元的Pro订阅用户,Pulse与Gmail和Google日历等应用程序集成,以突出重要消息和事件。OpenAI强调,Pulse并不旨在鼓励无尽的滚动,就像社交媒体应用程序那样,而是提供一组集中且有用的信息,每个早晨都能提供。随着时间的推移,公司希望将Pulse扩展到更多用户,并添加高级功能,如预订或电子邮件撰写。
注意“工作垃圾”:低质量AI结果的隐性成本
BetterUp Labs和斯坦福社交媒体实验室的研究人员创造了“工作垃圾”这一术语,用于描述看似良好的AI生成内容,但实际上没有真实价值。这种结果往往迫使同事们大量重做或修正工作,造成低效而非生产力。一项调查显示,40%的美国员工在过去一个月内收到了低质量的AI生成内容。
研究警告称,工作垃圾导致许多公司在AI投资上的盈利能力下降。为了防止这一问题,领导者被鼓励制定关于AI使用的明确规则,并促进经过深思熟虑的、有意图的应用,而不是无控制的自动化。
YouTube Music测试AI主持人以提供琐事和评论
YouTube Music正在测试AI主持人,提供与您正在收听的曲目相关的琐事、故事和评论。该功能旨在提供更互动和引人入胜的体验,类似于两年前推出的Spotify的AI DJ。
该实验通过YouTube Labs进行,这是一个面向所有用户的新AI功能中心,尽管最初只有美国的有限用户可以测试。它还增加了先前的测试,如对话式广播和AI驱动的搜索。YouTube表示,目标是探索AI如何丰富音乐发现,而不会让用户感到不堪重负。
Anthropic计划将国际劳动力增加三倍以应对Claude AI的需求
Anthropic宣布计划将国际劳动力增加三倍,并在今年将其应用AI团队扩大五倍,受到全球对其Claude模型的需求推动。近80%的Claude使用来自美国以外,尤其是在韩国、澳大利亚和新加坡的采用率特别高。
在谷歌和亚马逊的支持下,Anthropic的估值达到1830亿美元,其企业客户基础在短短两年内从不到1000个增加到超过30万个。年经常性收入从2025年初的10亿美元增长到8月的超过50亿美元。为了支持这一增长,公司将在都柏林、伦敦、苏黎世和其首个亚洲办事处东京开设新办公室。
MRI软件通过出售或IPO目标估值达到100亿美元
私募股权公司TA Associates、Harvest Partners和GI Partners正在考虑对美国公司MRI Software的潜在出售或上市(IPO),该公司是房地产管理软件的提供商。预计该交易将在未来12个月内进行,可能会将公司估值达到高达100亿美元,包括债务。高盛正在为该过程提供咨询,因为MRI吸引了房地产和技术买家的兴趣。
MRI每年产生近10亿美元的收入和约4亿美元的EBITDA,保持10%的稳定增长,超过一半的收入来自美国以外。出售将为现有股东带来重大退出,GI Partners预计将获得九倍的回报,而TA Associates则将获得七倍的初始投资回报。
黑客盗取了8000名伦敦幼儿园儿童的数据
黑客盗取了8000名儿童在Kido International运营的伦敦幼儿园的个人信息。该组织被称为Radiant,在暗网发布了被盗数据的样本——包括姓名、照片、住址和家庭联系方式——以证明其泄露。他们威胁称,如果他们的要求未得到满足,将发布其他数千个包含儿童和员工数据的文件。
英国当局,包括大都会警察网络犯罪单位,正在调查此事件,但尚未进行逮捕。黑客声称他们位于俄罗斯,但没有明确证据。此次攻击突显了针对脆弱机构的勒索软件团伙日益严重的危险,提出了严重的数据安全和儿童保护问题。
思科推出软件以通过云连接量子计算机
思科宣布了一款新软件,可以将来自不同制造商的量子计算机连接到一个量子云中,促进实用应用的开发。该工具分析计算问题,将其分解为更小的部分,并在不同类型的量子机器上分配——无论它们使用何种技术。
与此同时,微软、谷歌和IBM专注于构建自己的量子计算机,思科则定位为一个连接器。除了其新的量子网络芯片外,该公司还希望简化开发人员的访问,掩盖不同量子硬件方法之间的复杂性。
Meta推出“Vibes”——一个由AI驱动的创意视频流
Meta推出了一项名为Vibes的新功能,这是一个专门用于生成短视频的AI驱动流。用户可以从零开始创建视频,重新混合现有剪辑,或通过视觉效果和音乐丰富内容。这些创作可以直接在Vibes流中分享,或在Instagram和Facebook Stories或Reels中重新发布。
此次发布是Meta加速其平台上AI发展的战略的一部分。通过提供更易于访问和互动的视频创作工具,该公司希望激发创造力,并与TikTok和其他短视频平台竞争。
欧盟准备对Meta提出指控,因未能打击非法内容
Meta面临来自欧盟的指控文件,因其未能充分控制Facebook和Instagram上的非法内容。根据彭博社的报道,欧盟委员会的初步结论显示,这些平台没有适当的机制让用户报告有害的帖子。
根据数字服务法案(DSA),科技巨头必须实施更严格的措施来打击非法和有害内容。如果指控得到证实,Meta可能面临高达其全球年收入6%的罚款。该公司还因未能打击虚假信息和误导性广告而受到调查,尤其是在2024年欧洲选举之前。
微软将AI应用商店统一为一个商业市场
微软将其针对开发者的Azure AI工具市场和面向商业的AI应用和代理市场合并为一个名为Microsoft Marketplace的中心。该发布首先在美国启动,并将在未来几个月内全球扩展。
新市场面向企业买家,提供与微软产品和计费系统的简单集成。与面向消费者的应用商店不同,微软不会从销售中收取佣金,但会收取发布费用。所有应用程序必须通过严格的安全和合规性检查,以确保在企业环境中安全使用。
因大规模数据泄露,病毒式通话录音应用Neon关闭
Neon是一款病毒式应用,允许用户录制通话并通过将录音出售给AI公司获利,因重大安全漏洞而突然关闭。该漏洞允许任何人访问其他用户的电话号码、转录和音频文件,造成严重的隐私问题。
尽管在一天内吸引了75,000次下载并迅速攀升至Apple排行榜,但该应用的服务器并未得到适当的安全保护。创始人在被TechCrunch警告后关闭了Neon,但未告知用户事件的严重性。目前尚不清楚该应用是否会恢复,或Apple和Google是否会介入。
Threads测试“标签”工具以实现更个性化的推送
Instagram正在为Threads开发一项功能,允许用户“标记”一个帐户,以指示他们希望在推送中看到更多或更少的内容。这个想法是让人们对算法的运作方式有更直接的控制,类似于Elon Musk最近为X宣布的通过其AI助手Grok的功能。
该工具仍处于原型阶段,允许用户实时调整他们在Threads上的体验,而无需通过设置进行调整。这反映了Meta更广泛的努力,旨在在清理推送内容的方式上提供更多透明度和灵活性,因为用户和监管机构都要求对社交媒体算法有更多控制。
谷歌推出Mixboard,一款用于情绪板的AI应用
谷歌推出了Mixboard,一款新应用,允许用户使用人工智能生成和编辑情绪板。与Pinterest不同,用户必须手动搜索和添加图像,Mixboard允许从文本提示开始,AI将其转换为主题面板。用户可以使用谷歌的Nano Banana图像编辑模型编辑、组合或重新生成视觉效果。
该应用作为公共测试版在美国通过Google Labs提供,旨在用于头脑风暴项目,如室内设计、活动规划或创意拼贴。Mixboard还增加了基于图像的文本生成,开启了新的创意可能性。该应用符合Z世代对数字拼贴的兴趣,类似的工具在TikTok上已经变得病毒式传播。
微软Photos将自动分类收据和文档
微软正在测试Windows 11的Photos应用的AI更新,该更新自动将某些类型的图像分类到文件夹中。该功能将自动分类收据、屏幕截图、身份证件和手写笔记,无需用户手动组织。
AI可以根据内容识别和分类图像,即使文本是用不同于英语的语言书写的。例如,匈牙利护照的照片将被放入“身份证件”文件夹。尽管目前选项有限,微软可能会扩展功能,以实现更个性化的分类,例如宠物照片或假期照片。
Meta在英国推出有争议的“支付或同意”广告模式
Meta在英国实施其“支付或同意”广告模式,迫使Facebook和Instagram用户接受个性化广告或支付无广告订阅费。费用从£2.99/月起,但由于应用商店的费用,在iOS和Android上上涨至£3.99。每个额外帐户需额外收费,用户必须在所有帐户上做出相同的选择。
该模式此前被欧盟监管机构拒绝,因其被批评为提供“二元选择”。英国的费用显著低于欧洲,后者的订阅费用起价为9.99欧元/月。这一措施突显了Meta与监管机构之间持续的斗争,关于其如何为平台融资,同时又保护用户隐私。
Nvidia将Audio2Face AI开源,用于逼真的语音动画
Nvidia免费向开发者提供其Audio2Face工具,允许从音频输入直接生成逼真的面部动画。该工具将语音的声学特征映射到嘴唇运动和面部表情,使数字角色在游戏、应用和直播中更接近现实。
开发者已经在如Chernobylite 2和Alien: Rogue Incursion等标题中使用了Audio2Face。除了模型和SDK,Nvidia还发布了训练框架,使用户能够根据不同的用例进行调整。通过开源,该公司希望扩大在游戏、虚拟制作和元宇宙中的应用。
微软测试微流体冷却以提高芯片和数据中心的效率
微软正在实验微流体冷却,这是一种通过直接在芯片上刻蚀的微小通道引导冷却液的技术,灵感来自自然的血管模式。测试表明,这种方法可以比现有的冷却板系统高效三倍地消除热量,将GPU温度降低65%。
如果该方法得到扩展,可能会使以AI为中心的数据中心在能源效率上更具优势,并允许芯片在不超负荷的情况下以更高的功率运行。通过管理需求高峰而无需额外的服务器,该技术承诺带来成本节约和可持续性收益——尽管微软警告称,这仍处于早期阶段。
谷歌DeepMind的Gemini机器人现在可以在网络上搜索以解决任务
谷歌DeepMind通过Gemini Robotics 1.5和Gemini Robotics-ER 1.5增强了其机器人AI,使机器人能够规划复杂任务并使用网络搜索以获得定制解决方案。机器人现在可以根据天气预报打包行李、分开衣物或根据当地规则分类可回收物品。
该系统结合了对现实世界的感知与在线信息。机器人还可以相互“学习”,在不同类型的硬件之间转移技能,包括人形机器人。开发者将能够通过谷歌AI Studio中的Gemini API访问这些模型。
英国的反欺诈AI工具回收了5亿英镑,并将全球授权
一项新的AI欺诈检测系统帮助英国政府在过去一年中回收了近5亿英镑的公共资金,标志着反欺诈团队在单年内回收的最大金额。超过三分之一的资金来自与Covid-19疫情相关的欺诈,其余来自非法的地方税申请和非法的社会住房转租。该系统在部门之间关联数据,并阻止可疑活动,例如试图在偿还之前解散的Bounce Back贷款公司。
该工具名为欺诈风险评估加速器,由内阁办公室开发,旨在防止疫情期间大规模欺诈的重演。它扫描新的政府政策和程序,以在被利用之前发现漏洞。部长们表示,回收的资金将用于资助教师、助理和警察的招聘。
英国现在计划在国际上授权该工具,美国、澳大利亚、加拿大和新西兰是首批将采用该工具的国家。然而,这一决定可能会引发民权团体的批评,这些团体已经对在反欺诈中使用AI表示不满。来自国际特赦组织等组织的报告警告称,这类系统可能会基于年龄、残疾或国籍等标准进行歧视。
谷歌通过新MCP服务器开放真实数据的大门以供AI使用
谷歌使AI系统更容易访问真实和可靠的信息。该公司推出了数据公共模型上下文协议(MCP)服务器,允许开发者、数据科学家和AI代理通过自然语言访问经过验证的统计数据——这一举措可能会改变AI模型的训练和优化方式。
Databricks承诺与OpenAI投资1亿美元,同时两家最大的科技初创公司联合力量
全球两家最有价值的初创公司——Databricks和OpenAI——在AI竞赛中巩固了合作关系。
周四,Databricks宣布将在数年内花费1亿美元与OpenAI合作,将GPT-5和其他模型直接集成到其数据分析平台中。这一举措使Databricks的客户能够更简单地将OpenAI技术应用于他们的企业数据,而无需复杂的配置、法律障碍或之前减缓采用的安全问题。
“这是一个游戏规则的改变,”Databricks首席执行官Ali Ghodsi表示。“现在,任何Databricks用户都可以在界面中一键运行OpenAI模型——价格与直接向OpenAI的价格相当。”
Meta在Facebook和Messenger上全球扩展青少年账户
Meta正在全球范围内扩展其青少年账户功能,之前该功能仅在美国、英国、澳大利亚和加拿大的青少年中可用。这些以安全为中心的账户最早在去年秋季在Instagram上推出,配备了内置保护和家长控制。
这一扩展是在立法者施加更大压力的背景下进行的,他们指责大型社交平台未能为年轻用户提供足够的保护。
机器人技术的先驱警告:“人形机器人泡沫”不会持久
Rodney Brooks,世界上最受尊敬的机器人专家之一,对投资者在机器人初创公司中投入数十亿美元发出明确警告:“把钱扔出窗外。”
Brooks是iRobot的联合创始人,并在MIT教授了数十年,他对特斯拉和Figure等公司持深刻怀疑态度,这些公司认为展示人形机器人工作的视频可以展示其灵活性。在一篇新文章中,他将这种方法驳斥为“纯粹的幻想”。
谷歌:90%的科技员工现在在工作中使用AI
根据谷歌的一项新研究,人工智能迅速成为科技行业几乎普遍的工具。
这项研究由谷歌的DORA部门进行,基于来自全球5000名专业人士的反馈,显示90%的科技员工在工作中使用AI——比去年增长了14%。许多人依赖AI来完成诸如编写或优化代码等任务。
这种快速的采用发生在关于AI对工作和经济影响的更广泛辩论背景下。此外,Anthropic的首席执行官Dario Amodei警告称,AI可能导致失业率上升。其他行业领导者则淡化了这些担忧,但有证据表明,软件工程领域的入门级职位变得更加难以获得,尤其是在科技行业裁员潮的背景下。