网易首页 > 网易科技 > 网易科技 > 正文

一周AI大事:手机可用小模型井喷,宇树与天工巅峰对决

0
分享至

本周焦点: Gemma 3 270M、SuperFly & Chickbrain / Llama 3.1 8B Slim、LFM2-VL、Matrix-Game 2.0、Matrix-3D、Nvidia Cosmos & Omniverse、Sonnet 4支持百万级Token上下文、Jan-v1、gpt-oss-20b-base、CoAct-1。

一、重磅工具:多款轻量化模型问世——小身板里有大乾坤

新闻:近期业界发布多款小型高效AI模型。这类“轻量化AI模型”易于微调,并且体积极小,可以直接在智能手机等边缘设备上本地运行AI应用。

谷歌推出Gemma 3 270M,这是一款“效率超高”的开源紧凑型AI模型,不仅能在智能手机上离线运行,还能针对特定应用快速微调。Gemma 3 270M的指令遵循能力表现出色,IFEval评分在同等规模AI模型中位居榜首。


Gemma 3 270M体现了“工欲善其事,必先利其器”的理念。它本身是一款高质量的基础模型,开箱即用,指令遵循能力出色,而真正的潜力在于微调。经过专门优化后,Gemma 3 270M能以极高的准确性、速度和成本效益执行文本分类、数据提取等任务。目前Gemma 3 270M已在HuggingFace平台上线。

西班牙公司Multiverse Computing发布小型高效AI模型SuperFly和ChickBrain。Multiverse Computing受量子计算启发开发了大模型压缩算法CompactifAI,能在保持模型性能的同时大幅缩减现有AI模型的规模。上述两款模型都是通过CompactifAI算法压缩而成。

ChickBrain又名Llama 3.1 8B Slim,是一款基于Llama 3.1 8B的32亿参数模型,运行速度更快、成本更低,且“性能毫不逊色”。微型AI模型SuperFly则是SmlLM2-135的压缩版,仅有9400万参数,专为智能家居设备设计。 SuperFly的设计初衷是基于设备操作记录等非常有限的数据进行训练。Multiverse Computing公司设想将其嵌入家用电器,让用户可以通过“开始快洗”等语音指令来操作设备。

Liquid AI发布LFM2-VL系列视觉语言模型,其中包含4.4亿和16亿两种参数规模,针对低延迟、高精度的视觉语言任务进行了优化。LFM2-VL系列模型将LFM2液体基础模型的核心架构与视觉编码器相结合,其端侧推理速度提升了两倍。目前LFM2-VL系列模型已在Hugging Face上线。

锐评:浓缩的都是精华,AI界的军备竞赛终于从“比谁的航母大”转向了“比谁的无人机更灵活”。

二、AI技术与产品发布——大厂卷技术,小厂卷开源

1. 新闻:昆仑万维在技术发布周期间推出两款开源世界模型:Matrix-Game 2.0和Matrix-3D。这两款模型在交互式AI视频和3D世界生成方面的性能有显著提升,进一步拓宽了实时物理感知模拟的边界。其中Matrix-Game 2.0聚焦于视觉驱动的交互方案,并已完全开源,技术文档和模型均可从HuggingFace下载。模型特性包括实时蒸馏、帧级动作注入以及大规模交互式数据管道。

锐评:这是要打造AI版的《西部世界》还是《头号玩家》?

2. 新闻:英伟达发布了全新的Cosmos物理AI模型和Omniverse机器人技术库。全新的Nvidia Omniverse™技术库与Nvidia Cosmos™世界基础模型(WFM)将加速机器人解决方案的开发与部署,重点针对机器人和工业数字孪生领域,覆盖从感知到行动的完整模拟、训练和部署工作流。

锐评:AI淘金热中,最赚钱的永远是卖铲子的。

3. 新闻:Anthropic公司的Claude Sonnet 4现已支持100万Token上下文窗口,是其原有上下文长度的五倍。这意味着Claude能在单次请求中处理多达75000行代码。公司表示,这一飞跃意味着模型一次便可处理整个代码库或数十篇论文。相关API和AWS Bedrock平台已经开放公测。

锐评:AI从“鱼的7秒钟记忆”进化到了能读懂整本《战争与和平》,堪称懒人福利。


4. 新闻:Anthropic的Claude Opus 4和4.1现可在必要时终止“持续有害或侮辱性”的对话。这项功能基于AI模型福祉研究,仅适用于索取非法或暴力内容等极端情况,旨在保护AI模型免受有害互动或行为失范的影响。

锐评:AI终于学会了说“不”。

5. 新闻:Anthropic为Claude AI推出学习模式,引导用户逐步推理而非直接提供答案。这些新的“学习模式”将Claude转变为教学伙伴,强调引导式探索而非即时解答。这种模式已经向Claude.ai和Claude Code的普通用户开放,旨在提升人类学习效果,并为ChatGPT的学习模式提供一种替代方案。

锐评:AI正从无所不知的“答案机”转型为循循善诱的“私人家教”。

6. 新闻:Menlo Research发布Jan-v1。这是Qwen3-4B-thinking的微调版本,针对本地环境中的SimpleQA(简单问答)任务进行优化。Jan-v1在SimpleQA任务上的性能可媲美Perplexity Pro,能在本地运行并通过MCP工具使用搜索数据源,堪称开源的本地化搜索助手。

锐评:随身搜索神器来了。

7. 新闻:AI研究员杰克·莫里斯(Jack Morris)创建了gpt-oss-20b-base。他通过逆转 gpt-oss-20b的对齐(alignment)过程,打造出响应更快、未经审查的“基础”模型。莫里斯在社交平台X上分享了研究成果,并将gpt-oss-20b-base模型发布在 HuggingFace上。严格来说,gpt-oss-20b-base并非真正意义上的基础模型,而是通过低秩适应(LoRA)技术撤销对齐训练的模型。此举虽然让其适用于更多任务,但也引发了关于对齐和安全风险的担忧。

锐评:AI大神总喜欢“拆封条”。

8. 新闻:谷歌正在为Gemini升级个性化记忆功能,包括“个人情境”(Personal Context)和“临时对话”(Temporary Chat),让用户可以控制Gemini对先前互动的记忆,从而提升其个性化体验。“个人情境”功能可帮助Gemini能够记住过往的聊天互动,而“临时对话”则允许用户进行一次性对话,且对话内容不会被纳入个性化记忆中。这些功能使Gemini在个性化和记忆方面追平了Anthropic和OpenAI开发的同类模型。

锐评:用户终于不用在每次对话时都要告诉Gemini“我是谁”了。

9. 新闻:谷歌在Google Flights中推出了一款名为“Flight Deals”的AI搜索工具。这款工具使用定制化的Gemini 2.5,帮助用户通过诸如“美食之都一周游”之类的自然语言查询来搜索低价机票。

锐评:能省钱是硬道理。

10. 新闻:自GPT-5发布以来的一周内,OpenAI进行了多项后续调整。针对用户因无法使用旧模型产生的强烈不满,OpenAI在模型选择器中重新加入了选择GPT-4o等旧版模型的选项。OpenAI曾在GPT-5发布时移除了该功能,但最终还是撤销了这一决定,为偏好旧模型的用户恢复了选择权。OpenAI还发现GPT-5存在路由错误,导致许多用户被导向性能较弱的GPT-5变体。修复后,用户得以访问性能更强的“思考”版本。此外,OpenAI发布了GPT-5提示词指南,帮助开发者针对GPT-5编写更有效的提示词,同时还推出提示词优化工具,可以提炼复杂指令并解释调整原因,从而有助于用户更精准、更清晰地利用GPT-5的推理能力。为应对需求,OpenAI还在扩充算力集群,并为Plus和Pro版订阅用户增加个性化设置以及第三方连接器(Dropbox、Gmail、Teams)等定制选项。


锐评:即便是行业领头羊,也免不了“上线先公测,用户当QA”。

11. 新闻:微软已将GPT-5全面集成至Copilot。全新的“智能模式”让消费者和企业用户在网页端、Windows、Mac和移动端Copilot中均能体验到GPT-5的强大功能。

锐评:实力演绎什么叫“近水楼台先得月”。

三、AI研究资讯——学霸的世界我不懂,但听起来很厉害

1. 新闻:Meta研究人员发表名为《Llama大规模高效推测解码》(Efficient Speculative Decoding for Llama at Scale)的新技术论文,概述了在生产级Llama系统中部署快速推测解码所面临的挑战和解决方案。论文详细介绍了如何通过大规模推测解码技术为Llama提速。

锐评:Llama立志要当AI界的博尔特,回复像闪电。

2. 新闻:Salesforce和南加州大学(USC)研究人员开发出CoAct-1,这是一款将图形用户界面(GUI)导航与代码执行相结合的AI智能体。在论文《CoAct-1: 以编码为行动的计算机操作智能体》(CoAct-1: Computer-using Agents with Coding as Actions)中,研究团队展示了CoAct-1混合系统如何在基准测试中取得SOTA成绩,并能以更少步骤高效完成复杂任务。CoAct-1有望实现企业自动化,但仍面临安全和人类监督方面的问题。

锐评:CoAct-1又会砸掉哪种员工的饭碗?

四、AI商业与政策——风口浪尖全是生意

1. 新闻:据报道,DeepSeek(深度求索)的下一代模型因华为芯片问题而推迟发布。《金融时报》援引消息称,供应问题是导致模型延期的主因。

锐评:应了那句古话:好事多磨。

2. 新闻:ChatGPT移动应用吸金势头强劲。自2023年5月份以来,其应用内用户消费支出已达20亿美元,约为竞争对手Claude和Grok的30倍。ChatGPT应用的下载量亦领先全球,达到6.9亿次,彰显出强大的市场主导地位。

锐评:聊得越多,ChatGPT越来钱。

3. 新闻:Anthropic凭借其在AI编程应用领域的主导地位,年化收入迅速达到50亿美元。然而,Anthropic近四分之一的收入依赖于Cursor和GitHub Copilot,对AI编程客户的依存度较高。OpenAI新发布的GPT-5模型性能相近但定价显著更低,可能动摇Anthropic的客户基础。

锐评:把鸡蛋放在一个篮子里有风险。

4. 新闻:企业级AI公司Cohere在近期完成5亿美元融资后,估值达到68亿美元,并任命 Meta前AI研究副总裁乔尔·皮诺(Joelle Pineau)为首席AI官,专注于开发实用且注重隐私的AI应用。

锐评:融资、挖人、讲故事,Cohere正在教科书式地扮演一个合格的AI独角兽。

5. 新闻:“氛围编程”初创公司Lovable首席执行官安东·奥斯卡(Anton Osika)表示,公司目标是在12个月内实现10亿美元的年度经常性收入(ARR)。这家成立于2023年的欧洲AI明星企业在8个月内就实现1亿美元ARR,并预计今年年底ARR将达到2.5亿美元。今年夏天,公司刚刚以18亿美元的估值完成2亿美元融资。

锐评:Lovable的增长速度堪比坐火箭,但是传奇还是泡沫只有时间知道。

6. 新闻:消息称美国AI搜索领域头部初创公司Perplexity正计划以全现金方式收购谷歌旗下的Chrome浏览器,出价高达345亿美元。

锐评:新秀敢叫板行业巨人,貌似公关意义远大于实际成交。

7. 新闻:Anthropic收购提示词管理与LLM可观测性平台Humanloop,以增强企业级AI工具的能力,并与OpenAI等对手竞争。Humanloop的技术核心是利用“模型上下文协议”(MCP)将上下文嵌入到日志和追踪数据中,从而管理复杂的AI遥测数据。此次收购将使Anthropic能为大型企业提供更主动的异常检测、根本原因分析和可行的洞见。

锐评:Anthropic在企业服务战场上给自己紧急加装了一块“重甲”。

8. 新闻:xAI联合创始人伊戈尔·巴布什金(Igor Babuschkin)宣布离职,创办Babuschkin Ventures。巴布什金曾负责xAI的工程团队,他新创办的风险投资公司将专注于AI安全研究,并投资推动人类进步的初创企业。

锐评:行业大佬们总喜欢转行去指导别人。

9. 新闻:AI伴侣类应用越来越受欢迎。截至今年7月份,该类应用营收同比增长64%,预计2025年全年将达到1.2亿美元。2025年以来,至少已经有128款AI伴侣应用发布,上半年总下载量超过6000万次,其中包括来自Replika、Character.AI、PolyBuzz、Chai 等公司的应用,但排名前10%的应用几乎包揽了近90%的收入。

锐评:AI伴侣的火爆,精准切中了当代人的“孤独”感。

10. 新闻:8月14日,全球首个以人形机器人为核心参赛主体的综合性大型赛事,世界人形机器人运动会,在北京国家速滑馆“冰丝带”开幕。来自16个国家的280支队伍、500多台人形机器人在3大类18个赛项的487场比赛中展开角逐。

值得注意的是,田径1500米决赛中,宇树北京灵翌科技队使用宇树春晚机器人同款H1人形机器人以6分34秒的成绩摘金;“天骄”队的“天工”机器人夺得亚军,成绩为6分55秒;杭州宇树科技以7分10秒的成绩获得季军。

田径400米决赛中,宇树上海高羿科技的H1人形机器人以1分28秒03的成绩斩获第二枚金牌;“天卓”和“天骄”队采用的“天工”机器人分获亚、季军。

星动纪元全尺寸双足人形机器人星动L7则在原地跳高项目中以95.641cm的高度斩获冠军。

百米飞人决战中,天工机器人以21.5秒夺冠,宇树H1包揽二三名。

此外在场景赛中,北京人形机器人创新中心派出的天轶2.0以全自主方式将27枚末端直径仅为8毫米的细长物料准确插入收纳箱的孔洞中,包揽世界人形机器人运动会物料整理冠亚军。

锐评:与其说是比赛,不如说是未来“打工人”的岗前技能大摸底。

11. 新闻:特斯拉正试图扩大其自动驾驶出租车服务的范围,积极谋划进入其他美国大城市。公司正在纽约市为Autopilot团队招聘车辆操作员,时薪30美元。按照首席执行官埃隆·马斯克(Elon Musk)的计划,特斯拉的目标是到今年年底,让美国一半以上的人口能够使用其自动驾驶出租车平台。

锐评:美国出租车司机的饭碗岌岌可危。

五、AI观察与评论——冷思考与热议论

1. 新闻:《金融时报》发问:AI是否“撞墙”?在GPT-5市场反响平平之后,《金融时报》发文探讨AI是否正“遭遇瓶颈”。文章认为,规模扩展法则(Scaling Law)正面临数据和算力瓶颈,呼吁业界探索多模态世界模型等新路径。

锐评:“大力出奇迹”的模式是不是到头了。

2. 新闻:GPT-5“性格”大变引发“聊天机器人情感依赖”问题。OpenAI对GPT-5进行更新后,AI伴侣的交互体验发生了变化。《卫报》专栏文章描述了用户的强烈反应,以及对科技公司如何塑造数字时代亲密关系的广泛担忧。

锐评:AI“性格”说变就变,比我前女友还不靠谱。

延伸阅读
相关推荐
热点推荐
百果园一根甘蔗87元,市民吐槽太贵,店员:买之前讲过的,黄金手撕甘蔗按斤卖,已为该消费者退款

百果园一根甘蔗87元,市民吐槽太贵,店员:买之前讲过的,黄金手撕甘蔗按斤卖,已为该消费者退款

大风新闻
2026-02-14 10:01:07
左小青的女儿,眉毛也太浓了

左小青的女儿,眉毛也太浓了

小椰的奶奶
2026-02-15 05:58:07
美国驻华大使馆:外表酷似堡垒,建在北京核心位置,蚊子都飞不进

美国驻华大使馆:外表酷似堡垒,建在北京核心位置,蚊子都飞不进

趣文说娱
2025-12-20 16:06:55
惨败!1月轿车销量排名,燃油车霸榜前二十,新能源仅2款车破万

惨败!1月轿车销量排名,燃油车霸榜前二十,新能源仅2款车破万

趣味萌宠的日常
2026-02-13 05:50:23
文班亚马表示球员都能学詹姆斯!他曾说詹姆斯是GOAT!

文班亚马表示球员都能学詹姆斯!他曾说詹姆斯是GOAT!

氧气是个地铁
2026-02-15 16:24:03
中国三大长寿食物,鱼只能排到第三,第一名很多人想不到!

中国三大长寿食物,鱼只能排到第三,第一名很多人想不到!

江江食研社
2026-02-12 12:30:10
这个春节,三亚彻底火了!游客8499元订的民宿被临时毁约,附近民宿涨到三四万,机票价同比翻倍!95后、00后也多起来了

这个春节,三亚彻底火了!游客8499元订的民宿被临时毁约,附近民宿涨到三四万,机票价同比翻倍!95后、00后也多起来了

每日经济新闻
2026-02-12 22:13:04
本来都可以超过40000分?杜兰特只差431分,就将超越乔丹跻身前五

本来都可以超过40000分?杜兰特只差431分,就将超越乔丹跻身前五

无术不学
2026-02-15 11:26:21
队记:杨瀚森很想证明自己值得被尊重 他非常享受全明星周末

队记:杨瀚森很想证明自己值得被尊重 他非常享受全明星周末

罗说NBA
2026-02-15 15:58:28
原来iPhone信号差是没开对,这个隐藏设置一开,信号直接满格

原来iPhone信号差是没开对,这个隐藏设置一开,信号直接满格

小柱解说游戏
2026-02-13 12:20:15
早日康复!金花一姐郑钦文又退赛,因病退出WTA1000迪拜站

早日康复!金花一姐郑钦文又退赛,因病退出WTA1000迪拜站

全景体育V
2026-02-15 14:56:58
一级军士长王忠心简历,他享受什么待遇?退休后婉拒百万年薪

一级军士长王忠心简历,他享受什么待遇?退休后婉拒百万年薪

混沌录
2026-01-27 22:33:05
李亚鹏找到医院新址,直播眼里泛泪,房东心态崩了,只求过个好年

李亚鹏找到医院新址,直播眼里泛泪,房东心态崩了,只求过个好年

子芫伴你成长
2026-01-25 08:10:03
北漂女高管辞职当守岛人:27天不花钱,颠覆了对车、房的物质执念,精神自由无价

北漂女高管辞职当守岛人:27天不花钱,颠覆了对车、房的物质执念,精神自由无价

大风新闻
2026-02-14 15:17:08
不容错过!2月15晚上17:00!中央5套CCTV5、CCTV5+直播节目表

不容错过!2月15晚上17:00!中央5套CCTV5、CCTV5+直播节目表

皮皮观天下
2026-02-15 14:11:41
日本首相高市病情恶化,紧急入院

日本首相高市病情恶化,紧急入院

亚太观澜
2026-02-14 21:00:04
全家都觉得赚了!21岁的孙子寒假“打工”照顾97岁的奶奶 5元1小时 1天封顶50元

全家都觉得赚了!21岁的孙子寒假“打工”照顾97岁的奶奶 5元1小时 1天封顶50元

闪电新闻
2026-02-14 10:50:57
广州男子买菜偶遇双脚被截断乞丐,这竟是失踪12年的同学。

广州男子买菜偶遇双脚被截断乞丐,这竟是失踪12年的同学。

南权先生
2026-02-13 15:26:13
海南树上果,湖南口中瘾?槟榔产地在海南,为啥吃的人大多在湖南

海南树上果,湖南口中瘾?槟榔产地在海南,为啥吃的人大多在湖南

向航说
2026-01-13 00:50:03
男子开3千公里参加战友婚礼,随礼8万,到家接到电话:看看后备箱

男子开3千公里参加战友婚礼,随礼8万,到家接到电话:看看后备箱

温情邮局
2025-08-18 14:57:26
2026-02-15 17:24:49

科技要闻

发春节红包的大厂都被约谈了

头条要闻

重庆两套法拍房以192万余元起拍 物业欠费达108万余元

头条要闻

重庆两套法拍房以192万余元起拍 物业欠费达108万余元

体育要闻

最戏剧性的花滑男单,冠军为什么是他?

娱乐要闻

河南春晚被骂上热搜!大量广告满屏AI

财经要闻

谁在掌控你的胃?起底百亿"飘香剂"江湖

汽车要闻

奔驰中国换帅:段建军离任,李德思接棒

态度原创

教育
数码
时尚
本地
旅游

教育要闻

孩子的病让我们放下过去认为重要的东西

数码要闻

华硕主板再现R7 9800X3D故障案例:低负载过夜后发现电脑已死机

推广中奖名单-更新至2026年2月3日推广

本地新闻

下一站是嘉禾望岗,请各位乘客做好哭泣准备

旅游要闻

以“放心游”保障开心玩 海南用信用守护旅游市场的“诗和远方”

无障碍浏览 进入关怀版
×