网易首页 > 网易号 > 正文 申请入驻

一周AI大事:GPT-5.1"情商"大升级,AI教父"离家出走"

0
分享至

来源:市场资讯

(来源:网易科技报道)

一、重磅工具:“空间智能”正式上线,AI开始自己造世界

新闻:World Labs发布世界模型Marble。这个生成式AI世界模型允许用户根据文本、图像、视频和3D布局等多种输入,生成可持续交互的3D环境。这些模型基于渲染场景中的高斯溅射特征生成3D世界,能在用户探索时保持一致性。


World Labs一直在开发能够突破空间智能边界的世界模型,其理念基于该公司创始人李飞飞所提出的“空间智能是AI下一个前沿”。空间智能是AI理解物理世界的基础,支持创建和编辑交互式AI世界;这项技术有望成为一种基础性的AI模型技术,既能服务于视频和图像的生成式AI模型,也能支持机器人和自动驾驶汽车等与物理世界交互的AI模型。


锐评:这是要造出《黑客帝国》母体的节奏。

二、AI技术与产品发布:从会说话到会“说人话”,个性成GPT-5.1新亮点

1. 新闻:本周OpenAI发布GPT-5.1。作为GPT-5的更新版,GPT-5.1旨在实现更“富有人情味”的交互体验。它提供两种主要模式:GPT-5.1 Instant (即时模式),用于快速、热情、遵循指令的聊天;以及GPT-5.1 Thinking(思考模式),用于更持久的多步骤推理。即时模式能提供快速、友好的回答,而思考模式则会在处理复杂任务时自动放慢速度。而在“自动”模式下,ChatGPT会自动将用户任务分配给最合适的模式。


GPT-5.1还包含一套更丰富的个性预设(默认、专业、友好、坦诚、古怪、高效、书呆子气、尖酸刻薄),让用户可以通过设置微调回复的语气。GPT-5.1的发布公告并未提及新模型的推理或基准测试能力有何具体提升,而旧版GPT-5模型将会保留数月时间。

评测指出,GPT-5.1感觉更“温暖”、更具个性化,解决了此前GPT-5缺乏个性的问题,在交互式聊天中对指令的响应和遵循能力也有所改善。TechRadar的日常使用评测称GPT-5.1“能力更强且更可控”。Digital Trends则表示:“我更喜欢用Gemini,但GPT-5.1更新可能会让ChatGPT成为你真正想用的AI助手。”

OpenAI还扩展了ChatGPT的协作功能,允许多人与同一个AI对话。GPT-5.1中的这项功能主要针对项目工作、规划和学习小组的需求,允许用户邀请朋友加入进行中的ChatGPT对话,并看到AI结合上下文回复每个人的消息。

锐评:GPT情商拉满,终于学会“好好说话”了。

2. 新闻:百度发布ERNIE-4.5-VL-28B-A3B-Thinking,这是一个基于混合专家(MoE)架构的新型多模态推理模型。其总参数量为280亿,但每个token仅激活30亿参数。ERNIE-4.5-VL-28B-A3B-Thinking能够处理图表理解、视频理解、视觉定位和工具增强的图像搜索等视觉推理任务。在MathVista和其他VQA(视觉问答)套件等基准测试中,它的表现与Gemini 2.5 Pro和GPT-5.1相当,但模型规模要小得多。ERNIE-4.5-VL-28B-A3B-Thinking基于Apache 2.0开源许可协议,其文档、演示以及权重已同步上线Hugging Face。


锐评:百度这波“以小博大”,证明“浓缩就是精华”,顺手还给开源了。

3. 新闻:ElevenLabs推出Scribe v2 Realtime,这是该公司最新的用于实时转录的低延迟语音转文本模型。Scribe v2 Realtime能以低于150毫秒的延迟转录语音,目标应用场景包括语音助手、会议助手和实时字幕,并支持90多种语言。ElevenLabs为使用其API的用户和开发者提供了产品页面和技术文档。

锐评:话音未落,已转录成文。

4. 新闻:谷歌更新Android和iOS平台上的Gemini Live,提供更具适应性和表现力的语音功能。用户现在可以调整语速,听到更细微的语调和节奏变化,还可以要求AI用不同角色的口音来讲故事。新版应用还改进了AI对语言学习和练习对话的支持。此外,Gemini Live API中新增的本地音频模型降低了延迟,提升了语音优先应用的性能。

锐评:除了不像人会喘气,啥音都会。

5. 新闻:谷歌在其搜索的AI模式以及Gemini应用中推出了一整套AI购物工具。对话式购物功能可以从包含约500亿个产品列表的图谱中提取信息;“智能结账”功能可跟踪价格,并在商品价格降至用户设定阈值以下时通过Google Pay自动下单;“让Google致电”的智能体功能可代替用户致电本地商店,查询库存和促销信息。

锐评:这下网购花钱更快了。

6. 新闻:Terminal-Bench基准测试已更新至2.0版。Terminal-Bench是一个开源基准测试,包含89个实际终端任务,用于评估AI智能体在真实Shell环境中的操作能力。Terminal-Bench团队还发布了基于容器的标准框架Harbor,可以让不同智能体在相同任务上进行可复现的评估。Terminal-Bench的公开排行榜会跟踪各智能体在终端AI自动化任务上的表现。

锐评:智能体考试也越来越难,还要比拼敲命令行。

7. 新闻:总部位于巴黎的H Company公司发布新一代多模态模型Holo Two,旨在推动跨平台的计算机使用智能体。Holo Two模型有40亿、80亿和300亿-A3B MoE三种规模,均是经过调优的视觉语言模型,用于在真实GUI(图形用户界面)中进行定位、导航和任务执行。这些模型使智能体能够“查看”屏幕,并通过点击和按键来控制屏幕;它们可以在网页、桌面以及移动端运行。Holo Two模型现已开放权重并上线Hugging Face平台。

锐评:能看屏幕、能点按钮、能跑GUI,这不是把坐办公室的活全包了嘛。

8. 新闻:新发布的Robyn是前医生Jenny Shao创建的一款富有同理心的AI伴侣。作为一款iOS应用,Robyn的定位并非替代心理医生,而是一个高情商的伙伴。它能记住用户的详细信息,具备长期跟踪模式,可以提供关于压力、情感依恋风格和习惯方面的见解,同时为了确保安全还内置了防护措施和危机响应流程。

锐评:明明白白你的心,渴望一份真感情。

9. 新闻:Gemini 3和Nano Banana 2即将发布。Gemini 3预览版现已在LMArena上线,代号为“riftrunner”。谷歌新一代AI图像模型Nano Banana 2也已以预览形式出现在Gemini应用内。Nano Banana 2在角度和视点方面具备更强的类相机控制,改进了文本渲染能力,并采用多步骤的“规划、生成、评估、修复”工作流,在呈现最终结果前会反复自我修正图像。

锐评:还会反复纠错,AI出图这是要卷到用户满意为止。

三、AI研究动态:小模型打出大智慧,多语言多环境AI纷纷出炉

1. 新闻:Meta推出语音识别系统Omnilingual ASR,能支持超过1600种语言和方言。Meta表示,Omnilingual ASR是“被设计成一个社区驱动的框架”,其中包含一套用于自动语音识别 (ASR) 的新型开源AI模型和一个涵盖350种冷门小语种的转录语音数据集。这些AI模型的参数量从3.5亿到70亿不等,均基于Meta的wav2vec 2.0架构开发。Meta在论文《Omnilingual ASR:支持1600多种语言的开源多语言语音识别》中公布了他们的研究成果。

锐评:能不能听懂我们的温州话?

2. 新闻:微博AI发布VibeThinker-1.5B,并在论文《小模型,大逻辑:多样性驱动优化在VibeThinker-1.5B中激发大模型推理能力》一文中对其进行了介绍。VibeThinker-1.5B是一个15亿参数的推理模型,针对数学和逻辑任务进行了优化,在数学推理基准测试中的得分超过许多大模型。这款AI模型采用多样性驱动的优化策略,能从规模更小的网络中激发出大模型风格的推理行为。

锐评:证明参数不是一切,大模型被啪啪打脸。

3. 新闻:谷歌DeepMind推出基于Gemini的智能体SIMA 2,它可在3D虚拟世界和商业游戏中运行,通过感知屏幕和控制键盘鼠标来执行任务。据描述,新版比SIMA 1更通用且自我改进能力更强,能够处理先前没见过的环境和更复杂的任务。目前SIMA 2仍是一个研究性AI模型,但被DeepMind视为迈向通用智能体、可在丰富模拟环境中通过交互进行学习的重要一步。

锐评:SIMA 2靠“看屏幕、敲键鼠”就能通关,人类玩家的“高光时刻”不多了。

四、AI商业与政策:淘金热度不减,连杨立昆也坐不住了?

1. 新闻:Anthropic宣布将在未来十年向美国AI基础设施投资500亿美元,在得克萨斯州和纽约州建立AI数据中心,以满足30多万商业客户对Claude日益增长的需求。这些项目预计将创造约800个永久性工作岗位和2400个建筑工作岗位,也符合美国保持先进计算领域领导地位的AI战略。

锐评:哪是训练Claude,这分明是在用钞票给AI筑巢。

2. 新闻:Meta首席AI科学家杨立昆(Yann LeCun)计划离开Meta,创办自己的公司。他的离职反映出Meta AI团队的人事动荡;但这也可能是机遇,或将催生出一个更注重研究的AI实验室,追求的成果完全不同于那些专注于大语言模型的AI公司。


锐评:小扎的钞能力不好用了?

3. 新闻:AI原生代码编辑器开发商Cursor宣布完成23亿美元D轮融资,估值达到293亿美元。该公司现已用其热门产品Cursor给自己命名,据称2025年营收增长了100倍,并表示年化营收突破10亿美元大关,客户包括数百万开发者和许多全球顶尖的工程组织。考虑到Cursor惊人的营收增幅,高达290亿美元的估值也就不足为奇了。

锐评:AI时代最赚钱的不是造AI,而是给造AI的“码农”造工具。

4. 新闻:欧洲数据保护监察局 (EDPS) 发布AI风险管理指导文件,为欧盟机构提供在数据保护法框架下如何管理AI系统风险的实用指南。这份名为《AI系统风险管理指南》的文件概述了在公共部门部署AI时进行风险评估、文档记录和人工监督的步骤,并将指导意见与《通用数据保护条例》的义务和欧盟最新的《AI法案》对齐。

锐评:模型还没跑起来,文件倒出了不少。

五、AI观点与文章:狂飙之后,该谁来付“电费”

新闻:彭博社专栏作家警告称,随着超大规模云服务商纷纷锁定数据中心所需的大量能源供应,AI“电力争夺”正与能源可负担性发生冲突。如果AI电力需求上涨冲击到能源价格,可能会引发公众的强烈反对和监管介入。

这种担忧并非首次出现,但政策制定者和企业需要解决谁来为AI能源需求背后的基础设施买单的问题。否则公众反对建设AI数据中心的声音将会越来越大。

锐评:再不解决“电费谁出”的问题,小心公众拔插头。(辰辰)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
日本外务省拒绝中方所有要求且不会向中方道歉

日本外务省拒绝中方所有要求且不会向中方道歉

环球热点快评
2025-11-18 23:44:16
温柔又时尚还很有正式感的灰色职业装穿搭

温柔又时尚还很有正式感的灰色职业装穿搭

牛弹琴123456
2025-11-17 19:35:09
鸡排哥找不回自己,派头十足令人讨厌

鸡排哥找不回自己,派头十足令人讨厌

陈意小可爱
2025-11-18 03:01:41
聪明人都有什么特征?网友:一个人开车开的好,绝对不傻

聪明人都有什么特征?网友:一个人开车开的好,绝对不傻

夜深爱杂谈
2025-11-17 21:16:58
34+32!神级大交易!谢谢你,杜兰特!

34+32!神级大交易!谢谢你,杜兰特!

篮球实战宝典
2025-11-18 15:26:21
全运会乒乓:女团全国冠军2-3出局!王曼昱爆发连赢蒯曼、钱天一

全运会乒乓:女团全国冠军2-3出局!王曼昱爆发连赢蒯曼、钱天一

全言作品
2025-11-18 12:48:28
儿子5岁离婚!厦门这夜,陈思诚和佟丽娅高调认爱,比复婚更体面

儿子5岁离婚!厦门这夜,陈思诚和佟丽娅高调认爱,比复婚更体面

正经的烧杯1
2025-11-18 17:24:53
第一财经不愧沪上媒体的脊梁

第一财经不愧沪上媒体的脊梁

新浪财经
2025-11-17 13:51:58
埋伏主力作奇兵,山东女排女教练用怪战术3-0上海女排,闯进决赛

埋伏主力作奇兵,山东女排女教练用怪战术3-0上海女排,闯进决赛

真理是我亲戚
2025-11-18 21:24:16
亚洲杯预选赛:1-2,中国香港遭世界第155逆转,首败+丢榜首宝座

亚洲杯预选赛:1-2,中国香港遭世界第155逆转,首败+丢榜首宝座

侧身凌空斩
2025-11-18 21:57:20
11月18日俄乌:高达1357亿欧元的乌克兰融资方案

11月18日俄乌:高达1357亿欧元的乌克兰融资方案

山河路口
2025-11-18 15:44:42
西安百姓怒了:市监局沦为方红卫权力余毒重灾区!

西安百姓怒了:市监局沦为方红卫权力余毒重灾区!

老萧杂说
2025-11-18 20:00:31
封杀四年,49岁赵薇突传消息,因胃癌去世传闻5个月前就真相大白

封杀四年,49岁赵薇突传消息,因胃癌去世传闻5个月前就真相大白

书雁飞史oh
2025-11-08 21:11:50
A股:刚刚,十二部门联合印发,释放一个信号,周三将迎新的变化

A股:刚刚,十二部门联合印发,释放一个信号,周三将迎新的变化

云鹏叙事
2025-11-19 00:00:03
张含韵的奶欲更勾人,36岁依旧童颜,身材却饱满成熟韵味满满

张含韵的奶欲更勾人,36岁依旧童颜,身材却饱满成熟韵味满满

TVB的四小花
2025-11-18 03:15:15
埃本·拜尔斯:喝下1400瓶核辐射水,身体瓦解,30年后骨头还发热

埃本·拜尔斯:喝下1400瓶核辐射水,身体瓦解,30年后骨头还发热

心中的麦田
2025-11-17 20:42:51
西伯利亚有多可怕?零下73度,千斤存粮百罐腌菜,砍柴一个月才行

西伯利亚有多可怕?零下73度,千斤存粮百罐腌菜,砍柴一个月才行

霁寒飘雪
2025-11-04 09:19:58
燕梳楼:如果日本驱逐薛剑,就是向中国宣战!

燕梳楼:如果日本驱逐薛剑,就是向中国宣战!

燕梳楼频道
2025-11-13 12:44:36
美女美图7239期

美女美图7239期

情感大头说说
2025-11-18 01:04:25
4000吨“沉睡氢弹”被击中,北约火速大撤退,乌:都怪俄干的好事

4000吨“沉睡氢弹”被击中,北约火速大撤退,乌:都怪俄干的好事

南宫一二
2025-11-18 14:41:53
2025-11-19 02:07:00
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
1422196文章数 4559关注度
往期回顾 全部

科技要闻

谷歌CEO警告:若AI泡沫破裂,没公司能幸免

头条要闻

孟加拉国前总理哈西娜被判死刑 中方回应

头条要闻

孟加拉国前总理哈西娜被判死刑 中方回应

体育要闻

结束最后一次对决,陈梦和朱雨玲笑着相拥

娱乐要闻

宋佳夺影后动了谁的奶酪

财经要闻

中美机器人爆发了一场论战

汽车要闻

硬核配置旗舰气场 岚图泰山售37.99万起

态度原创

数码
亲子
本地
时尚
公开课

数码要闻

华为MatePad系列平板“PC多屏协同”功能正式回归

亲子要闻

最能干活的那批人回来了 孟婆汤的质量越来越差了

本地新闻

这档古早综艺,怎么就成了年轻人的哆啦A梦?

秋天穿衣暂时没灵感?赶紧看看这27套穿搭,舒适自然又大方

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版