网易首页 > 网易科技 > 网易科技 > 正文

一周AI大事:GPT-5.1"情商"大升级,AI教父"离家出走"

0
分享至

一、重磅工具:“空间智能”正式上线,AI开始自己造世界

新闻:World Labs发布世界模型Marble。这个生成式AI世界模型允许用户根据文本、图像、视频和3D布局等多种输入,生成可持续交互的3D环境。这些模型基于渲染场景中的高斯溅射特征生成3D世界,能在用户探索时保持一致性。


World Labs一直在开发能够突破空间智能边界的世界模型,其理念基于该公司创始人李飞飞所提出的“空间智能是AI下一个前沿”。空间智能是AI理解物理世界的基础,支持创建和编辑交互式AI世界;这项技术有望成为一种基础性的AI模型技术,既能服务于视频和图像的生成式AI模型,也能支持机器人和自动驾驶汽车等与物理世界交互的AI模型。


锐评:这是要造出《黑客帝国》母体的节奏。

二、AI技术与产品发布:从会说话到会“说人话”,个性成GPT-5.1新亮点

1. 新闻:本周OpenAI发布GPT-5.1。作为GPT-5的更新版,GPT-5.1旨在实现更“富有人情味”的交互体验。它提供两种主要模式:GPT-5.1 Instant (即时模式),用于快速、热情、遵循指令的聊天;以及GPT-5.1 Thinking(思考模式),用于更持久的多步骤推理。即时模式能提供快速、友好的回答,而思考模式则会在处理复杂任务时自动放慢速度。而在“自动”模式下,ChatGPT会自动将用户任务分配给最合适的模式。


GPT-5.1还包含一套更丰富的个性预设(默认、专业、友好、坦诚、古怪、高效、书呆子气、尖酸刻薄),让用户可以通过设置微调回复的语气。GPT-5.1的发布公告并未提及新模型的推理或基准测试能力有何具体提升,而旧版GPT-5模型将会保留数月时间。

评测指出,GPT-5.1感觉更“温暖”、更具个性化,解决了此前GPT-5缺乏个性的问题,在交互式聊天中对指令的响应和遵循能力也有所改善。TechRadar的日常使用评测称GPT-5.1“能力更强且更可控”。Digital Trends则表示:“我更喜欢用Gemini,但GPT-5.1更新可能会让ChatGPT成为你真正想用的AI助手。”

OpenAI还扩展了ChatGPT的协作功能,允许多人与同一个AI对话。GPT-5.1中的这项功能主要针对项目工作、规划和学习小组的需求,允许用户邀请朋友加入进行中的ChatGPT对话,并看到AI结合上下文回复每个人的消息。

锐评:GPT情商拉满,终于学会“好好说话”了。

2. 新闻:百度发布ERNIE-4.5-VL-28B-A3B-Thinking,这是一个基于混合专家(MoE)架构的新型多模态推理模型。其总参数量为280亿,但每个token仅激活30亿参数。ERNIE-4.5-VL-28B-A3B-Thinking能够处理图表理解、视频理解、视觉定位和工具增强的图像搜索等视觉推理任务。在MathVista和其他VQA(视觉问答)套件等基准测试中,它的表现与Gemini 2.5 Pro和GPT-5.1相当,但模型规模要小得多。ERNIE-4.5-VL-28B-A3B-Thinking基于Apache 2.0开源许可协议,其文档、演示以及权重已同步上线Hugging Face。


锐评:百度这波“以小博大”,证明“浓缩就是精华”,顺手还给开源了。

3. 新闻:ElevenLabs推出Scribe v2 Realtime,这是该公司最新的用于实时转录的低延迟语音转文本模型。Scribe v2 Realtime能以低于150毫秒的延迟转录语音,目标应用场景包括语音助手、会议助手和实时字幕,并支持90多种语言。ElevenLabs为使用其API的用户和开发者提供了产品页面和技术文档。

锐评:话音未落,已转录成文。

4. 新闻:谷歌更新Android和iOS平台上的Gemini Live,提供更具适应性和表现力的语音功能。用户现在可以调整语速,听到更细微的语调和节奏变化,还可以要求AI用不同角色的口音来讲故事。新版应用还改进了AI对语言学习和练习对话的支持。此外,Gemini Live API中新增的本地音频模型降低了延迟,提升了语音优先应用的性能。

锐评:除了不像人会喘气,啥音都会。

5. 新闻:谷歌在其搜索的AI模式以及Gemini应用中推出了一整套AI购物工具。对话式购物功能可以从包含约500亿个产品列表的图谱中提取信息;“智能结账”功能可跟踪价格,并在商品价格降至用户设定阈值以下时通过Google Pay自动下单;“让Google致电”的智能体功能可代替用户致电本地商店,查询库存和促销信息。

锐评:这下网购花钱更快了。

6. 新闻:Terminal-Bench基准测试已更新至2.0版。Terminal-Bench是一个开源基准测试,包含89个实际终端任务,用于评估AI智能体在真实Shell环境中的操作能力。Terminal-Bench团队还发布了基于容器的标准框架Harbor,可以让不同智能体在相同任务上进行可复现的评估。Terminal-Bench的公开排行榜会跟踪各智能体在终端AI自动化任务上的表现。

锐评:智能体考试也越来越难,还要比拼敲命令行。

7. 新闻:总部位于巴黎的H Company公司发布新一代多模态模型Holo Two,旨在推动跨平台的计算机使用智能体。Holo Two模型有40亿、80亿和300亿-A3B MoE三种规模,均是经过调优的视觉语言模型,用于在真实GUI(图形用户界面)中进行定位、导航和任务执行。这些模型使智能体能够“查看”屏幕,并通过点击和按键来控制屏幕;它们可以在网页、桌面以及移动端运行。Holo Two模型现已开放权重并上线Hugging Face平台。

锐评:能看屏幕、能点按钮、能跑GUI,这不是把坐办公室的活全包了嘛。

8. 新闻:新发布的Robyn是前医生Jenny Shao创建的一款富有同理心的AI伴侣。作为一款iOS应用,Robyn的定位并非替代心理医生,而是一个高情商的伙伴。它能记住用户的详细信息,具备长期跟踪模式,可以提供关于压力、情感依恋风格和习惯方面的见解,同时为了确保安全还内置了防护措施和危机响应流程。

锐评:明明白白你的心,渴望一份真感情。

9. 新闻:Gemini 3和Nano Banana 2即将发布。Gemini 3预览版现已在LMArena上线,代号为“riftrunner”。谷歌新一代AI图像模型Nano Banana 2也已以预览形式出现在Gemini应用内。Nano Banana 2在角度和视点方面具备更强的类相机控制,改进了文本渲染能力,并采用多步骤的“规划、生成、评估、修复”工作流,在呈现最终结果前会反复自我修正图像。

锐评:还会反复纠错,AI出图这是要卷到用户满意为止。

三、AI研究动态:小模型打出大智慧,多语言多环境AI纷纷出炉

1. 新闻:Meta推出语音识别系统Omnilingual ASR,能支持超过1600种语言和方言。Meta表示,Omnilingual ASR是“被设计成一个社区驱动的框架”,其中包含一套用于自动语音识别 (ASR) 的新型开源AI模型和一个涵盖350种冷门小语种的转录语音数据集。这些AI模型的参数量从3.5亿到70亿不等,均基于Meta的wav2vec 2.0架构开发。Meta在论文《Omnilingual ASR:支持1600多种语言的开源多语言语音识别》中公布了他们的研究成果。

锐评:能不能听懂我们的温州话?

2. 新闻:微博AI发布VibeThinker-1.5B,并在论文《小模型,大逻辑:多样性驱动优化在VibeThinker-1.5B中激发大模型推理能力》一文中对其进行了介绍。VibeThinker-1.5B是一个15亿参数的推理模型,针对数学和逻辑任务进行了优化,在数学推理基准测试中的得分超过许多大模型。这款AI模型采用多样性驱动的优化策略,能从规模更小的网络中激发出大模型风格的推理行为。

锐评:证明参数不是一切,大模型被啪啪打脸。

3. 新闻:谷歌DeepMind推出基于Gemini的智能体SIMA 2,它可在3D虚拟世界和商业游戏中运行,通过感知屏幕和控制键盘鼠标来执行任务。据描述,新版比SIMA 1更通用且自我改进能力更强,能够处理先前没见过的环境和更复杂的任务。目前SIMA 2仍是一个研究性AI模型,但被DeepMind视为迈向通用智能体、可在丰富模拟环境中通过交互进行学习的重要一步。

锐评:SIMA 2靠“看屏幕、敲键鼠”就能通关,人类玩家的“高光时刻”不多了。

四、AI商业与政策:淘金热度不减,连杨立昆也坐不住了?

1. 新闻:Anthropic宣布将在未来十年向美国AI基础设施投资500亿美元,在得克萨斯州和纽约州建立AI数据中心,以满足30多万商业客户对Claude日益增长的需求。这些项目预计将创造约800个永久性工作岗位和2400个建筑工作岗位,也符合美国保持先进计算领域领导地位的AI战略。

锐评:哪是训练Claude,这分明是在用钞票给AI筑巢。

2. 新闻:Meta首席AI科学家杨立昆(Yann LeCun)计划离开Meta,创办自己的公司。他的离职反映出Meta AI团队的人事动荡;但这也可能是机遇,或将催生出一个更注重研究的AI实验室,追求的成果完全不同于那些专注于大语言模型的AI公司。


锐评:小扎的钞能力不好用了?

3. 新闻:AI原生代码编辑器开发商Cursor宣布完成23亿美元D轮融资,估值达到293亿美元。该公司现已用其热门产品Cursor给自己命名,据称2025年营收增长了100倍,并表示年化营收突破10亿美元大关,客户包括数百万开发者和许多全球顶尖的工程组织。考虑到Cursor惊人的营收增幅,高达290亿美元的估值也就不足为奇了。

锐评:AI时代最赚钱的不是造AI,而是给造AI的“码农”造工具。

4. 新闻:欧洲数据保护监察局 (EDPS) 发布AI风险管理指导文件,为欧盟机构提供在数据保护法框架下如何管理AI系统风险的实用指南。这份名为《AI系统风险管理指南》的文件概述了在公共部门部署AI时进行风险评估、文档记录和人工监督的步骤,并将指导意见与《通用数据保护条例》的义务和欧盟最新的《AI法案》对齐。

锐评:模型还没跑起来,文件倒出了不少。

五、AI观点与文章:狂飙之后,该谁来付“电费”

新闻:彭博社专栏作家警告称,随着超大规模云服务商纷纷锁定数据中心所需的大量能源供应,AI“电力争夺”正与能源可负担性发生冲突。如果AI电力需求上涨冲击到能源价格,可能会引发公众的强烈反对和监管介入。

这种担忧并非首次出现,但政策制定者和企业需要解决谁来为AI能源需求背后的基础设施买单的问题。否则公众反对建设AI数据中心的声音将会越来越大。

锐评:再不解决“电费谁出”的问题,小心公众拔插头。(辰辰)

相关推荐
热点推荐
安东尼-戴维斯太胖了!美记:多支球队嫌弃他太胖,缺乏机动性!

安东尼-戴维斯太胖了!美记:多支球队嫌弃他太胖,缺乏机动性!

爱体育
2025-11-16 20:42:30
早就想打!日媒首次爆料:中国双航母出动时日军战机已做战斗准备

早就想打!日媒首次爆料:中国双航母出动时日军战机已做战斗准备

诗意世界
2025-08-21 13:13:50
沙俄最想割,但是却一直没割走的一块土地,你们知道是哪里吗

沙俄最想割,但是却一直没割走的一块土地,你们知道是哪里吗

凡人侃史
2025-11-15 23:13:23
安徽姑娘,狂揽6金!被网友盛赞为“金牌收割机”

安徽姑娘,狂揽6金!被网友盛赞为“金牌收割机”

安徽发布
2025-11-16 20:03:50
沈伯洋逃出台湾,国民党拒绝救人,郑丽文已通告全岛,蒋万安笑了

沈伯洋逃出台湾,国民党拒绝救人,郑丽文已通告全岛,蒋万安笑了

墨兰史书
2025-11-17 05:10:03
在孟加拉国,我不是在旅游,我是在见证什么叫真正的人口压力

在孟加拉国,我不是在旅游,我是在见证什么叫真正的人口压力

诗意世界
2025-11-05 18:18:26
印度网友“重大发现”,印度航母可改装美国电磁弹射,这能靠谱?

印度网友“重大发现”,印度航母可改装美国电磁弹射,这能靠谱?

罗富强说
2025-11-17 10:17:54
四川阿坝红旗特大桥垮塌无伤亡,提前发现险情的巡逻人员被赞“立大功”,官方回应是否会奖励

四川阿坝红旗特大桥垮塌无伤亡,提前发现险情的巡逻人员被赞“立大功”,官方回应是否会奖励

极目新闻
2025-11-11 19:50:37
军事家:如果爆发战争,只有这几个省份相对安全!广东在内

军事家:如果爆发战争,只有这几个省份相对安全!广东在内

优趣纪史记
2025-10-31 16:33:00
速览!11月14国务院常务会敲定5件民生大事,每一件都与你相关

速览!11月14国务院常务会敲定5件民生大事,每一件都与你相关

生活魔术专家
2025-11-16 15:07:10
苹果加它煮,冬季不咳嗽!简单有效又好喝,香甜顺滑,健脾又养胃

苹果加它煮,冬季不咳嗽!简单有效又好喝,香甜顺滑,健脾又养胃

秀厨娘
2025-11-15 19:17:18
一夜负债200亿?电动车巨头轰然倒塌:终于活成贾跃亭信徒

一夜负债200亿?电动车巨头轰然倒塌:终于活成贾跃亭信徒

生活新鲜市
2025-11-16 15:30:25
这,就是樊振东“无解”的原因?

这,就是樊振东“无解”的原因?

新民晚报
2025-11-17 09:12:10
郭某刚案笔录披露:邻居证词透露关键信息,黑暗中申某良别无选择

郭某刚案笔录披露:邻居证词透露关键信息,黑暗中申某良别无选择

阿纂看事
2025-11-17 09:19:15
日本民众集会要求高市道歉下台

日本民众集会要求高市道歉下台

中国日报
2025-11-17 10:27:11
安东尼奥胆子真大!高洪波和里皮都没做到的事情,如今他却做到了

安东尼奥胆子真大!高洪波和里皮都没做到的事情,如今他却做到了

每一次点击
2025-11-16 15:29:56
高市早苗这一闹,日本彻底被中国架上了火炕

高市早苗这一闹,日本彻底被中国架上了火炕

云石
2025-11-17 09:00:08
999元,华为Mate80 定金突然曝光,很炸裂啊

999元,华为Mate80 定金突然曝光,很炸裂啊

科技堡垒
2025-11-16 11:37:11
美大使通知中方,交出港口,否则后果自负,中国对美大豆采购停滞

美大使通知中方,交出港口,否则后果自负,中国对美大豆采购停滞

时时有聊
2025-11-16 14:01:03
孙颖莎输给王曼昱,不是心态问题,是一点点技战术的撕破口

孙颖莎输给王曼昱,不是心态问题,是一点点技战术的撕破口

阿諬体育评论
2025-11-17 09:53:26
2025-11-17 11:08:49

科技要闻

营销话术反噬信任,雷军不该只是一怒了之

头条要闻

媒体:中国又一电磁弹射舰试航 可对日本形成合围之势

头条要闻

媒体:中国又一电磁弹射舰试航 可对日本形成合围之势

体育要闻

3年没踢球,他想完成“史上最难”的复出

娱乐要闻

二次封后的宋佳凭什么狂妄?

财经要闻

6666元包教包会!"杀人蜂"养殖已成灰产

汽车要闻

搭载鸿蒙座舱 新款天籁将于广州车展上市

态度原创

教育
本地
健康
时尚
公开课

教育要闻

新西兰留学生每周可打工25小时了,但需提交这项申请!

本地新闻

沈阳都市圈“冷资源”点燃“热联动” “组团”北上“圈粉”哈尔滨

血液科专家揭秘白血病七大误区

中年女人的开挂指南,避开花衣服和紧身衣,把优雅感焊在身上

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版
×