网易首页 > 网易科技 > 网易科技 > 正文

一周AI大事:GPT-5.1"情商"大升级,AI教父"离家出走"

0
分享至

一、重磅工具:“空间智能”正式上线,AI开始自己造世界

新闻:World Labs发布世界模型Marble。这个生成式AI世界模型允许用户根据文本、图像、视频和3D布局等多种输入,生成可持续交互的3D环境。这些模型基于渲染场景中的高斯溅射特征生成3D世界,能在用户探索时保持一致性。


World Labs一直在开发能够突破空间智能边界的世界模型,其理念基于该公司创始人李飞飞所提出的“空间智能是AI下一个前沿”。空间智能是AI理解物理世界的基础,支持创建和编辑交互式AI世界;这项技术有望成为一种基础性的AI模型技术,既能服务于视频和图像的生成式AI模型,也能支持机器人和自动驾驶汽车等与物理世界交互的AI模型。


锐评:这是要造出《黑客帝国》母体的节奏。

二、AI技术与产品发布:从会说话到会“说人话”,个性成GPT-5.1新亮点

1. 新闻:本周OpenAI发布GPT-5.1。作为GPT-5的更新版,GPT-5.1旨在实现更“富有人情味”的交互体验。它提供两种主要模式:GPT-5.1 Instant (即时模式),用于快速、热情、遵循指令的聊天;以及GPT-5.1 Thinking(思考模式),用于更持久的多步骤推理。即时模式能提供快速、友好的回答,而思考模式则会在处理复杂任务时自动放慢速度。而在“自动”模式下,ChatGPT会自动将用户任务分配给最合适的模式。


GPT-5.1还包含一套更丰富的个性预设(默认、专业、友好、坦诚、古怪、高效、书呆子气、尖酸刻薄),让用户可以通过设置微调回复的语气。GPT-5.1的发布公告并未提及新模型的推理或基准测试能力有何具体提升,而旧版GPT-5模型将会保留数月时间。

评测指出,GPT-5.1感觉更“温暖”、更具个性化,解决了此前GPT-5缺乏个性的问题,在交互式聊天中对指令的响应和遵循能力也有所改善。TechRadar的日常使用评测称GPT-5.1“能力更强且更可控”。Digital Trends则表示:“我更喜欢用Gemini,但GPT-5.1更新可能会让ChatGPT成为你真正想用的AI助手。”

OpenAI还扩展了ChatGPT的协作功能,允许多人与同一个AI对话。GPT-5.1中的这项功能主要针对项目工作、规划和学习小组的需求,允许用户邀请朋友加入进行中的ChatGPT对话,并看到AI结合上下文回复每个人的消息。

锐评:GPT情商拉满,终于学会“好好说话”了。

2. 新闻:百度发布ERNIE-4.5-VL-28B-A3B-Thinking,这是一个基于混合专家(MoE)架构的新型多模态推理模型。其总参数量为280亿,但每个token仅激活30亿参数。ERNIE-4.5-VL-28B-A3B-Thinking能够处理图表理解、视频理解、视觉定位和工具增强的图像搜索等视觉推理任务。在MathVista和其他VQA(视觉问答)套件等基准测试中,它的表现与Gemini 2.5 Pro和GPT-5.1相当,但模型规模要小得多。ERNIE-4.5-VL-28B-A3B-Thinking基于Apache 2.0开源许可协议,其文档、演示以及权重已同步上线Hugging Face。


锐评:百度这波“以小博大”,证明“浓缩就是精华”,顺手还给开源了。

3. 新闻:ElevenLabs推出Scribe v2 Realtime,这是该公司最新的用于实时转录的低延迟语音转文本模型。Scribe v2 Realtime能以低于150毫秒的延迟转录语音,目标应用场景包括语音助手、会议助手和实时字幕,并支持90多种语言。ElevenLabs为使用其API的用户和开发者提供了产品页面和技术文档。

锐评:话音未落,已转录成文。

4. 新闻:谷歌更新Android和iOS平台上的Gemini Live,提供更具适应性和表现力的语音功能。用户现在可以调整语速,听到更细微的语调和节奏变化,还可以要求AI用不同角色的口音来讲故事。新版应用还改进了AI对语言学习和练习对话的支持。此外,Gemini Live API中新增的本地音频模型降低了延迟,提升了语音优先应用的性能。

锐评:除了不像人会喘气,啥音都会。

5. 新闻:谷歌在其搜索的AI模式以及Gemini应用中推出了一整套AI购物工具。对话式购物功能可以从包含约500亿个产品列表的图谱中提取信息;“智能结账”功能可跟踪价格,并在商品价格降至用户设定阈值以下时通过Google Pay自动下单;“让Google致电”的智能体功能可代替用户致电本地商店,查询库存和促销信息。

锐评:这下网购花钱更快了。

6. 新闻:Terminal-Bench基准测试已更新至2.0版。Terminal-Bench是一个开源基准测试,包含89个实际终端任务,用于评估AI智能体在真实Shell环境中的操作能力。Terminal-Bench团队还发布了基于容器的标准框架Harbor,可以让不同智能体在相同任务上进行可复现的评估。Terminal-Bench的公开排行榜会跟踪各智能体在终端AI自动化任务上的表现。

锐评:智能体考试也越来越难,还要比拼敲命令行。

7. 新闻:总部位于巴黎的H Company公司发布新一代多模态模型Holo Two,旨在推动跨平台的计算机使用智能体。Holo Two模型有40亿、80亿和300亿-A3B MoE三种规模,均是经过调优的视觉语言模型,用于在真实GUI(图形用户界面)中进行定位、导航和任务执行。这些模型使智能体能够“查看”屏幕,并通过点击和按键来控制屏幕;它们可以在网页、桌面以及移动端运行。Holo Two模型现已开放权重并上线Hugging Face平台。

锐评:能看屏幕、能点按钮、能跑GUI,这不是把坐办公室的活全包了嘛。

8. 新闻:新发布的Robyn是前医生Jenny Shao创建的一款富有同理心的AI伴侣。作为一款iOS应用,Robyn的定位并非替代心理医生,而是一个高情商的伙伴。它能记住用户的详细信息,具备长期跟踪模式,可以提供关于压力、情感依恋风格和习惯方面的见解,同时为了确保安全还内置了防护措施和危机响应流程。

锐评:明明白白你的心,渴望一份真感情。

9. 新闻:Gemini 3和Nano Banana 2即将发布。Gemini 3预览版现已在LMArena上线,代号为“riftrunner”。谷歌新一代AI图像模型Nano Banana 2也已以预览形式出现在Gemini应用内。Nano Banana 2在角度和视点方面具备更强的类相机控制,改进了文本渲染能力,并采用多步骤的“规划、生成、评估、修复”工作流,在呈现最终结果前会反复自我修正图像。

锐评:还会反复纠错,AI出图这是要卷到用户满意为止。

三、AI研究动态:小模型打出大智慧,多语言多环境AI纷纷出炉

1. 新闻:Meta推出语音识别系统Omnilingual ASR,能支持超过1600种语言和方言。Meta表示,Omnilingual ASR是“被设计成一个社区驱动的框架”,其中包含一套用于自动语音识别 (ASR) 的新型开源AI模型和一个涵盖350种冷门小语种的转录语音数据集。这些AI模型的参数量从3.5亿到70亿不等,均基于Meta的wav2vec 2.0架构开发。Meta在论文《Omnilingual ASR:支持1600多种语言的开源多语言语音识别》中公布了他们的研究成果。

锐评:能不能听懂我们的温州话?

2. 新闻:微博AI发布VibeThinker-1.5B,并在论文《小模型,大逻辑:多样性驱动优化在VibeThinker-1.5B中激发大模型推理能力》一文中对其进行了介绍。VibeThinker-1.5B是一个15亿参数的推理模型,针对数学和逻辑任务进行了优化,在数学推理基准测试中的得分超过许多大模型。这款AI模型采用多样性驱动的优化策略,能从规模更小的网络中激发出大模型风格的推理行为。

锐评:证明参数不是一切,大模型被啪啪打脸。

3. 新闻:谷歌DeepMind推出基于Gemini的智能体SIMA 2,它可在3D虚拟世界和商业游戏中运行,通过感知屏幕和控制键盘鼠标来执行任务。据描述,新版比SIMA 1更通用且自我改进能力更强,能够处理先前没见过的环境和更复杂的任务。目前SIMA 2仍是一个研究性AI模型,但被DeepMind视为迈向通用智能体、可在丰富模拟环境中通过交互进行学习的重要一步。

锐评:SIMA 2靠“看屏幕、敲键鼠”就能通关,人类玩家的“高光时刻”不多了。

四、AI商业与政策:淘金热度不减,连杨立昆也坐不住了?

1. 新闻:Anthropic宣布将在未来十年向美国AI基础设施投资500亿美元,在得克萨斯州和纽约州建立AI数据中心,以满足30多万商业客户对Claude日益增长的需求。这些项目预计将创造约800个永久性工作岗位和2400个建筑工作岗位,也符合美国保持先进计算领域领导地位的AI战略。

锐评:哪是训练Claude,这分明是在用钞票给AI筑巢。

2. 新闻:Meta首席AI科学家杨立昆(Yann LeCun)计划离开Meta,创办自己的公司。他的离职反映出Meta AI团队的人事动荡;但这也可能是机遇,或将催生出一个更注重研究的AI实验室,追求的成果完全不同于那些专注于大语言模型的AI公司。


锐评:小扎的钞能力不好用了?

3. 新闻:AI原生代码编辑器开发商Cursor宣布完成23亿美元D轮融资,估值达到293亿美元。该公司现已用其热门产品Cursor给自己命名,据称2025年营收增长了100倍,并表示年化营收突破10亿美元大关,客户包括数百万开发者和许多全球顶尖的工程组织。考虑到Cursor惊人的营收增幅,高达290亿美元的估值也就不足为奇了。

锐评:AI时代最赚钱的不是造AI,而是给造AI的“码农”造工具。

4. 新闻:欧洲数据保护监察局 (EDPS) 发布AI风险管理指导文件,为欧盟机构提供在数据保护法框架下如何管理AI系统风险的实用指南。这份名为《AI系统风险管理指南》的文件概述了在公共部门部署AI时进行风险评估、文档记录和人工监督的步骤,并将指导意见与《通用数据保护条例》的义务和欧盟最新的《AI法案》对齐。

锐评:模型还没跑起来,文件倒出了不少。

五、AI观点与文章:狂飙之后,该谁来付“电费”

新闻:彭博社专栏作家警告称,随着超大规模云服务商纷纷锁定数据中心所需的大量能源供应,AI“电力争夺”正与能源可负担性发生冲突。如果AI电力需求上涨冲击到能源价格,可能会引发公众的强烈反对和监管介入。

这种担忧并非首次出现,但政策制定者和企业需要解决谁来为AI能源需求背后的基础设施买单的问题。否则公众反对建设AI数据中心的声音将会越来越大。

锐评:再不解决“电费谁出”的问题,小心公众拔插头。(辰辰)

相关推荐
热点推荐
郑永年:一味唱衰美国,甚至认为中国很快可以取代美国是害国主义

郑永年:一味唱衰美国,甚至认为中国很快可以取代美国是害国主义

朔方瞭望
2025-11-09 09:52:14
单日4金!憋了7天,浙江游泳队终于在最后一天爆发

单日4金!憋了7天,浙江游泳队终于在最后一天爆发

都市快报橙柿互动
2025-11-17 23:00:55
全运会为何没奖牌榜?辽宁队没落,北方省队崛起,雇佣军团引争议

全运会为何没奖牌榜?辽宁队没落,北方省队崛起,雇佣军团引争议

体育大学僧
2025-11-17 12:20:06
人财两空!茂名美女汪陆平癌症去世,仅36岁,孩子零花钱都拿不出

人财两空!茂名美女汪陆平癌症去世,仅36岁,孩子零花钱都拿不出

裕丰娱间说
2025-11-17 12:52:49
我国有上千万人做肺部CT!院士:做一次肺部CT,或管五年无碍

我国有上千万人做肺部CT!院士:做一次肺部CT,或管五年无碍

荷兰豆爱健康
2025-11-10 12:41:57
22分逆转5连胜!新鹰王上位特雷杨露馅 难怪老鹰不愿给4年2.29亿

22分逆转5连胜!新鹰王上位特雷杨露馅 难怪老鹰不愿给4年2.29亿

锅子篮球
2025-11-17 20:20:53
韩国最大在野党党党首:李在明结束出访回国必将面临特别检察追责

韩国最大在野党党党首:李在明结束出访回国必将面临特别检察追责

AI商业论
2025-11-17 14:44:45
有用户反馈苹果iPhone 17 Pro Max用湿巾清洁后机身涂层被擦除

有用户反馈苹果iPhone 17 Pro Max用湿巾清洁后机身涂层被擦除

IT之家
2025-11-16 10:17:07
曾医生日常容颜,没有美颜的样子才是真实的

曾医生日常容颜,没有美颜的样子才是真实的

诗意世界
2025-11-12 20:52:54
网红博主登山坠崖身亡,两天前怒怼网友,评论区留言一语成谶

网红博主登山坠崖身亡,两天前怒怼网友,评论区留言一语成谶

央小北
2025-11-17 16:02:39
禁止中国通讯设备后,德国总理首次表态:中美6G设备都不会选择

禁止中国通讯设备后,德国总理首次表态:中美6G设备都不会选择

乐天闲聊
2025-11-17 11:04:11
关于杨兰兰,终于破解出几条她的关键信息

关于杨兰兰,终于破解出几条她的关键信息

热点菌本君
2025-10-01 17:24:05
晚上十点前睡觉错了?医生提醒:过了70岁,睡觉要尽量做到这4点

晚上十点前睡觉错了?医生提醒:过了70岁,睡觉要尽量做到这4点

小舟谈历史
2025-10-20 09:27:20
日本卫星意外拍到我国机场,专家胆寒了:希望中国别走出这一步!

日本卫星意外拍到我国机场,专家胆寒了:希望中国别走出这一步!

章幃户外
2025-11-17 22:29:47
震惊篮坛!CBA最新规定:每节10分钟+第五节,真会玩,球迷不干了

震惊篮坛!CBA最新规定:每节10分钟+第五节,真会玩,球迷不干了

球童无忌
2025-11-17 19:00:33
只需3分钟,学会一个“性爱”小技巧,让妻子快乐一整晚

只需3分钟,学会一个“性爱”小技巧,让妻子快乐一整晚

精彩分享快乐
2025-11-17 00:05:03
高市早苗任议员时,曾质问时任首相村山富市:凭什么代表日本承认错误?村山富市坚持:错了就是错了!

高市早苗任议员时,曾质问时任首相村山富市:凭什么代表日本承认错误?村山富市坚持:错了就是错了!

每日经济新闻
2025-11-16 22:13:13
部分日本电影突然撤档,发行人员:下午临时接到通知!高市早苗要搞新动作?多方表态:反对!

部分日本电影突然撤档,发行人员:下午临时接到通知!高市早苗要搞新动作?多方表态:反对!

每日经济新闻
2025-11-17 17:55:10
什么时间血液最黏稠?两个时间多喝水,或有助稀释血液,疏通血管

什么时间血液最黏稠?两个时间多喝水,或有助稀释血液,疏通血管

医学原创故事会
2025-11-10 23:50:03
酒店“开房”大数据曝光:已婚女性,都在偷偷开房……

酒店“开房”大数据曝光:已婚女性,都在偷偷开房……

热心市民小黄
2025-11-05 12:17:17
2025-11-18 02:27:00

科技要闻

京东外卖要“独立” 刘强东还宣战“点评”

头条要闻

韩国向日本表示强烈抗议 中方表态

头条要闻

韩国向日本表示强烈抗议 中方表态

体育要闻

当家球星受伤后,球迷乐翻了天?

娱乐要闻

金鸡奖是“照妖镜”,揭露人情冷暖?

财经要闻

高市早苗的算计,将让日本割肉5000亿

汽车要闻

新增CDC后变化大吗? 试驾特斯拉model Y L

态度原创

本地
手机
教育
公开课
军事航空

本地新闻

这档古早综艺,怎么就成了年轻人的哆啦A梦?

手机要闻

华为第一款Pro Max!华为Mate 80 Pro Max四色官图公布

教育要闻

课后延时服务引发诸多矛盾,该考虑取消了!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

韩国提议举行朝韩军事会谈

无障碍浏览 进入关怀版
×