网易首页 > 网易科技 > 网易科技 > 正文

一周AI大事:手机可用小模型井喷,宇树与天工巅峰对决

0
分享至

本周焦点: Gemma 3 270M、SuperFly & Chickbrain / Llama 3.1 8B Slim、LFM2-VL、Matrix-Game 2.0、Matrix-3D、Nvidia Cosmos & Omniverse、Sonnet 4支持百万级Token上下文、Jan-v1、gpt-oss-20b-base、CoAct-1。

一、重磅工具:多款轻量化模型问世——小身板里有大乾坤

新闻:近期业界发布多款小型高效AI模型。这类“轻量化AI模型”易于微调,并且体积极小,可以直接在智能手机等边缘设备上本地运行AI应用。

谷歌推出Gemma 3 270M,这是一款“效率超高”的开源紧凑型AI模型,不仅能在智能手机上离线运行,还能针对特定应用快速微调。Gemma 3 270M的指令遵循能力表现出色,IFEval评分在同等规模AI模型中位居榜首。


Gemma 3 270M体现了“工欲善其事,必先利其器”的理念。它本身是一款高质量的基础模型,开箱即用,指令遵循能力出色,而真正的潜力在于微调。经过专门优化后,Gemma 3 270M能以极高的准确性、速度和成本效益执行文本分类、数据提取等任务。目前Gemma 3 270M已在HuggingFace平台上线。

西班牙公司Multiverse Computing发布小型高效AI模型SuperFly和ChickBrain。Multiverse Computing受量子计算启发开发了大模型压缩算法CompactifAI,能在保持模型性能的同时大幅缩减现有AI模型的规模。上述两款模型都是通过CompactifAI算法压缩而成。

ChickBrain又名Llama 3.1 8B Slim,是一款基于Llama 3.1 8B的32亿参数模型,运行速度更快、成本更低,且“性能毫不逊色”。微型AI模型SuperFly则是SmlLM2-135的压缩版,仅有9400万参数,专为智能家居设备设计。 SuperFly的设计初衷是基于设备操作记录等非常有限的数据进行训练。Multiverse Computing公司设想将其嵌入家用电器,让用户可以通过“开始快洗”等语音指令来操作设备。

Liquid AI发布LFM2-VL系列视觉语言模型,其中包含4.4亿和16亿两种参数规模,针对低延迟、高精度的视觉语言任务进行了优化。LFM2-VL系列模型将LFM2液体基础模型的核心架构与视觉编码器相结合,其端侧推理速度提升了两倍。目前LFM2-VL系列模型已在Hugging Face上线。

锐评:浓缩的都是精华,AI界的军备竞赛终于从“比谁的航母大”转向了“比谁的无人机更灵活”。

二、AI技术与产品发布——大厂卷技术,小厂卷开源

1. 新闻:昆仑万维在技术发布周期间推出两款开源世界模型:Matrix-Game 2.0和Matrix-3D。这两款模型在交互式AI视频和3D世界生成方面的性能有显著提升,进一步拓宽了实时物理感知模拟的边界。其中Matrix-Game 2.0聚焦于视觉驱动的交互方案,并已完全开源,技术文档和模型均可从HuggingFace下载。模型特性包括实时蒸馏、帧级动作注入以及大规模交互式数据管道。

锐评:这是要打造AI版的《西部世界》还是《头号玩家》?

2. 新闻:英伟达发布了全新的Cosmos物理AI模型和Omniverse机器人技术库。全新的Nvidia Omniverse™技术库与Nvidia Cosmos™世界基础模型(WFM)将加速机器人解决方案的开发与部署,重点针对机器人和工业数字孪生领域,覆盖从感知到行动的完整模拟、训练和部署工作流。

锐评:AI淘金热中,最赚钱的永远是卖铲子的。

3. 新闻:Anthropic公司的Claude Sonnet 4现已支持100万Token上下文窗口,是其原有上下文长度的五倍。这意味着Claude能在单次请求中处理多达75000行代码。公司表示,这一飞跃意味着模型一次便可处理整个代码库或数十篇论文。相关API和AWS Bedrock平台已经开放公测。

锐评:AI从“鱼的7秒钟记忆”进化到了能读懂整本《战争与和平》,堪称懒人福利。


4. 新闻:Anthropic的Claude Opus 4和4.1现可在必要时终止“持续有害或侮辱性”的对话。这项功能基于AI模型福祉研究,仅适用于索取非法或暴力内容等极端情况,旨在保护AI模型免受有害互动或行为失范的影响。

锐评:AI终于学会了说“不”。

5. 新闻:Anthropic为Claude AI推出学习模式,引导用户逐步推理而非直接提供答案。这些新的“学习模式”将Claude转变为教学伙伴,强调引导式探索而非即时解答。这种模式已经向Claude.ai和Claude Code的普通用户开放,旨在提升人类学习效果,并为ChatGPT的学习模式提供一种替代方案。

锐评:AI正从无所不知的“答案机”转型为循循善诱的“私人家教”。

6. 新闻:Menlo Research发布Jan-v1。这是Qwen3-4B-thinking的微调版本,针对本地环境中的SimpleQA(简单问答)任务进行优化。Jan-v1在SimpleQA任务上的性能可媲美Perplexity Pro,能在本地运行并通过MCP工具使用搜索数据源,堪称开源的本地化搜索助手。

锐评:随身搜索神器来了。

7. 新闻:AI研究员杰克·莫里斯(Jack Morris)创建了gpt-oss-20b-base。他通过逆转 gpt-oss-20b的对齐(alignment)过程,打造出响应更快、未经审查的“基础”模型。莫里斯在社交平台X上分享了研究成果,并将gpt-oss-20b-base模型发布在 HuggingFace上。严格来说,gpt-oss-20b-base并非真正意义上的基础模型,而是通过低秩适应(LoRA)技术撤销对齐训练的模型。此举虽然让其适用于更多任务,但也引发了关于对齐和安全风险的担忧。

锐评:AI大神总喜欢“拆封条”。

8. 新闻:谷歌正在为Gemini升级个性化记忆功能,包括“个人情境”(Personal Context)和“临时对话”(Temporary Chat),让用户可以控制Gemini对先前互动的记忆,从而提升其个性化体验。“个人情境”功能可帮助Gemini能够记住过往的聊天互动,而“临时对话”则允许用户进行一次性对话,且对话内容不会被纳入个性化记忆中。这些功能使Gemini在个性化和记忆方面追平了Anthropic和OpenAI开发的同类模型。

锐评:用户终于不用在每次对话时都要告诉Gemini“我是谁”了。

9. 新闻:谷歌在Google Flights中推出了一款名为“Flight Deals”的AI搜索工具。这款工具使用定制化的Gemini 2.5,帮助用户通过诸如“美食之都一周游”之类的自然语言查询来搜索低价机票。

锐评:能省钱是硬道理。

10. 新闻:自GPT-5发布以来的一周内,OpenAI进行了多项后续调整。针对用户因无法使用旧模型产生的强烈不满,OpenAI在模型选择器中重新加入了选择GPT-4o等旧版模型的选项。OpenAI曾在GPT-5发布时移除了该功能,但最终还是撤销了这一决定,为偏好旧模型的用户恢复了选择权。OpenAI还发现GPT-5存在路由错误,导致许多用户被导向性能较弱的GPT-5变体。修复后,用户得以访问性能更强的“思考”版本。此外,OpenAI发布了GPT-5提示词指南,帮助开发者针对GPT-5编写更有效的提示词,同时还推出提示词优化工具,可以提炼复杂指令并解释调整原因,从而有助于用户更精准、更清晰地利用GPT-5的推理能力。为应对需求,OpenAI还在扩充算力集群,并为Plus和Pro版订阅用户增加个性化设置以及第三方连接器(Dropbox、Gmail、Teams)等定制选项。


锐评:即便是行业领头羊,也免不了“上线先公测,用户当QA”。

11. 新闻:微软已将GPT-5全面集成至Copilot。全新的“智能模式”让消费者和企业用户在网页端、Windows、Mac和移动端Copilot中均能体验到GPT-5的强大功能。

锐评:实力演绎什么叫“近水楼台先得月”。

三、AI研究资讯——学霸的世界我不懂,但听起来很厉害

1. 新闻:Meta研究人员发表名为《Llama大规模高效推测解码》(Efficient Speculative Decoding for Llama at Scale)的新技术论文,概述了在生产级Llama系统中部署快速推测解码所面临的挑战和解决方案。论文详细介绍了如何通过大规模推测解码技术为Llama提速。

锐评:Llama立志要当AI界的博尔特,回复像闪电。

2. 新闻:Salesforce和南加州大学(USC)研究人员开发出CoAct-1,这是一款将图形用户界面(GUI)导航与代码执行相结合的AI智能体。在论文《CoAct-1: 以编码为行动的计算机操作智能体》(CoAct-1: Computer-using Agents with Coding as Actions)中,研究团队展示了CoAct-1混合系统如何在基准测试中取得SOTA成绩,并能以更少步骤高效完成复杂任务。CoAct-1有望实现企业自动化,但仍面临安全和人类监督方面的问题。

锐评:CoAct-1又会砸掉哪种员工的饭碗?

四、AI商业与政策——风口浪尖全是生意

1. 新闻:据报道,DeepSeek(深度求索)的下一代模型因华为芯片问题而推迟发布。《金融时报》援引消息称,供应问题是导致模型延期的主因。

锐评:应了那句古话:好事多磨。

2. 新闻:ChatGPT移动应用吸金势头强劲。自2023年5月份以来,其应用内用户消费支出已达20亿美元,约为竞争对手Claude和Grok的30倍。ChatGPT应用的下载量亦领先全球,达到6.9亿次,彰显出强大的市场主导地位。

锐评:聊得越多,ChatGPT越来钱。

3. 新闻:Anthropic凭借其在AI编程应用领域的主导地位,年化收入迅速达到50亿美元。然而,Anthropic近四分之一的收入依赖于Cursor和GitHub Copilot,对AI编程客户的依存度较高。OpenAI新发布的GPT-5模型性能相近但定价显著更低,可能动摇Anthropic的客户基础。

锐评:把鸡蛋放在一个篮子里有风险。

4. 新闻:企业级AI公司Cohere在近期完成5亿美元融资后,估值达到68亿美元,并任命 Meta前AI研究副总裁乔尔·皮诺(Joelle Pineau)为首席AI官,专注于开发实用且注重隐私的AI应用。

锐评:融资、挖人、讲故事,Cohere正在教科书式地扮演一个合格的AI独角兽。

5. 新闻:“氛围编程”初创公司Lovable首席执行官安东·奥斯卡(Anton Osika)表示,公司目标是在12个月内实现10亿美元的年度经常性收入(ARR)。这家成立于2023年的欧洲AI明星企业在8个月内就实现1亿美元ARR,并预计今年年底ARR将达到2.5亿美元。今年夏天,公司刚刚以18亿美元的估值完成2亿美元融资。

锐评:Lovable的增长速度堪比坐火箭,但是传奇还是泡沫只有时间知道。

6. 新闻:消息称美国AI搜索领域头部初创公司Perplexity正计划以全现金方式收购谷歌旗下的Chrome浏览器,出价高达345亿美元。

锐评:新秀敢叫板行业巨人,貌似公关意义远大于实际成交。

7. 新闻:Anthropic收购提示词管理与LLM可观测性平台Humanloop,以增强企业级AI工具的能力,并与OpenAI等对手竞争。Humanloop的技术核心是利用“模型上下文协议”(MCP)将上下文嵌入到日志和追踪数据中,从而管理复杂的AI遥测数据。此次收购将使Anthropic能为大型企业提供更主动的异常检测、根本原因分析和可行的洞见。

锐评:Anthropic在企业服务战场上给自己紧急加装了一块“重甲”。

8. 新闻:xAI联合创始人伊戈尔·巴布什金(Igor Babuschkin)宣布离职,创办Babuschkin Ventures。巴布什金曾负责xAI的工程团队,他新创办的风险投资公司将专注于AI安全研究,并投资推动人类进步的初创企业。

锐评:行业大佬们总喜欢转行去指导别人。

9. 新闻:AI伴侣类应用越来越受欢迎。截至今年7月份,该类应用营收同比增长64%,预计2025年全年将达到1.2亿美元。2025年以来,至少已经有128款AI伴侣应用发布,上半年总下载量超过6000万次,其中包括来自Replika、Character.AI、PolyBuzz、Chai 等公司的应用,但排名前10%的应用几乎包揽了近90%的收入。

锐评:AI伴侣的火爆,精准切中了当代人的“孤独”感。

10. 新闻:8月14日,全球首个以人形机器人为核心参赛主体的综合性大型赛事,世界人形机器人运动会,在北京国家速滑馆“冰丝带”开幕。来自16个国家的280支队伍、500多台人形机器人在3大类18个赛项的487场比赛中展开角逐。

值得注意的是,田径1500米决赛中,宇树北京灵翌科技队使用宇树春晚机器人同款H1人形机器人以6分34秒的成绩摘金;“天骄”队的“天工”机器人夺得亚军,成绩为6分55秒;杭州宇树科技以7分10秒的成绩获得季军。

田径400米决赛中,宇树上海高羿科技的H1人形机器人以1分28秒03的成绩斩获第二枚金牌;“天卓”和“天骄”队采用的“天工”机器人分获亚、季军。

星动纪元全尺寸双足人形机器人星动L7则在原地跳高项目中以95.641cm的高度斩获冠军。

百米飞人决战中,天工机器人以21.5秒夺冠,宇树H1包揽二三名。

此外在场景赛中,北京人形机器人创新中心派出的天轶2.0以全自主方式将27枚末端直径仅为8毫米的细长物料准确插入收纳箱的孔洞中,包揽世界人形机器人运动会物料整理冠亚军。

锐评:与其说是比赛,不如说是未来“打工人”的岗前技能大摸底。

11. 新闻:特斯拉正试图扩大其自动驾驶出租车服务的范围,积极谋划进入其他美国大城市。公司正在纽约市为Autopilot团队招聘车辆操作员,时薪30美元。按照首席执行官埃隆·马斯克(Elon Musk)的计划,特斯拉的目标是到今年年底,让美国一半以上的人口能够使用其自动驾驶出租车平台。

锐评:美国出租车司机的饭碗岌岌可危。

五、AI观察与评论——冷思考与热议论

1. 新闻:《金融时报》发问:AI是否“撞墙”?在GPT-5市场反响平平之后,《金融时报》发文探讨AI是否正“遭遇瓶颈”。文章认为,规模扩展法则(Scaling Law)正面临数据和算力瓶颈,呼吁业界探索多模态世界模型等新路径。

锐评:“大力出奇迹”的模式是不是到头了。

2. 新闻:GPT-5“性格”大变引发“聊天机器人情感依赖”问题。OpenAI对GPT-5进行更新后,AI伴侣的交互体验发生了变化。《卫报》专栏文章描述了用户的强烈反应,以及对科技公司如何塑造数字时代亲密关系的广泛担忧。

锐评:AI“性格”说变就变,比我前女友还不靠谱。

延伸阅读
相关推荐
热点推荐
伊朗女药剂师拒绝撤离,空袭第10天在“精准”打击下被“误杀”

伊朗女药剂师拒绝撤离,空袭第10天在“精准”打击下被“误杀”

网易新闻出品
2026-03-26 11:16:13
姐姐寻找弟弟33年后续!直播时闹矛盾,李鑫已告别离开,姐姐让步

姐姐寻找弟弟33年后续!直播时闹矛盾,李鑫已告别离开,姐姐让步

潮鹿逐梦
2026-03-26 17:43:25
官宣《浪姐7》遭全网抵制,49岁的范玮琪,终于迎来了“报应”!

官宣《浪姐7》遭全网抵制,49岁的范玮琪,终于迎来了“报应”!

阿纂看事
2026-03-26 20:49:43
2-0!托纳利立大功,意大利完胜,杀入决赛,再赢一场=晋级世界杯

2-0!托纳利立大功,意大利完胜,杀入决赛,再赢一场=晋级世界杯

足球狗说
2026-03-27 05:38:22
6900万元!摩洛哥要求塞内加尔归还非洲杯奖金+奖牌 后者强硬拒绝

6900万元!摩洛哥要求塞内加尔归还非洲杯奖金+奖牌 后者强硬拒绝

风过乡
2026-03-26 19:13:28
张雪峰前女友哭红眼,喊话不要给张雪峰泼脏水,曝两人分手原因

张雪峰前女友哭红眼,喊话不要给张雪峰泼脏水,曝两人分手原因

180视角
2026-03-26 14:51:03
“一降价还不是像狗一样跑过来!”罗技广告辱骂用户遭全网声讨…

“一降价还不是像狗一样跑过来!”罗技广告辱骂用户遭全网声讨…

柴狗夫斯基
2026-03-26 21:06:15
有没有人敢爆自己的瓜?网友:确定玩这么大吗?

有没有人敢爆自己的瓜?网友:确定玩这么大吗?

夜深爱杂谈
2026-02-18 20:55:58
单场定生死!世预赛欧附加赛半决赛:蓝衣军团救赎,黑马暗掀惊涛

单场定生死!世预赛欧附加赛半决赛:蓝衣军团救赎,黑马暗掀惊涛

侧身凌空斩
2026-03-26 13:04:09
苹果 Max 新品正式开售,3999 元起!

苹果 Max 新品正式开售,3999 元起!

科技堡垒
2026-03-26 11:36:39
教育部宣布中考重大变革,取消 5:5 分流,升学规则将全面调整?

教育部宣布中考重大变革,取消 5:5 分流,升学规则将全面调整?

今朝牛马
2026-03-26 20:22:18
我国航空发动机领域著名专家严红病逝,年仅57岁

我国航空发动机领域著名专家严红病逝,年仅57岁

澎湃新闻
2026-03-26 11:40:26
想拿中国尿素救春耕?先把欠中企的百亿欠款还了!否则一粒不售

想拿中国尿素救春耕?先把欠中企的百亿欠款还了!否则一粒不售

过期少女致幻录
2026-03-26 11:44:43
多地将举办“纪念张国荣”演唱会,行情火爆?张国荣挚友:请停止所有非法行为

多地将举办“纪念张国荣”演唱会,行情火爆?张国荣挚友:请停止所有非法行为

上观新闻
2026-03-26 15:06:07
姐弟俩被继母逼吃大便、热水烫下体、垃圾桶觅食、浑身淤青......生父威胁邻居别管闲事,已被逮捕!

姐弟俩被继母逼吃大便、热水烫下体、垃圾桶觅食、浑身淤青......生父威胁邻居别管闲事,已被逮捕!

新民周刊
2026-03-26 19:12:17
网易号平台每日辟谣公告(三月二十六日)

网易号平台每日辟谣公告(三月二十六日)

网易号官方平台
2026-03-26 18:04:59
世界杯需要意大利!四冠王意大利附加赛生死局,能否杀出重围?

世界杯需要意大利!四冠王意大利附加赛生死局,能否杀出重围?

宝哥爱足球
2026-03-26 00:07:41
追悼会从简,女儿独站告别厅,她一句话让人心碎

追悼会从简,女儿独站告别厅,她一句话让人心碎

周哥一影视
2026-03-27 03:37:44
伊朗总统:伊朗致力于结束战争 从未寻求拥有核武器

伊朗总统:伊朗致力于结束战争 从未寻求拥有核武器

财联社
2026-03-27 02:02:29
张雪峰的影响力,被严重低估了

张雪峰的影响力,被严重低估了

黔有虎
2026-03-26 14:32:34
2026-03-27 06:35:00

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

特朗普:对伊朗能源设施空袭再推迟10天

头条要闻

特朗普:对伊朗能源设施空袭再推迟10天

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

旅游
手机
健康
教育
公开课

旅游要闻

河南开封万岁山武侠城,游客买300元门票:给妻子拍照被保安阻拦

手机要闻

1499 iQOO Z11系列发布丨9020mAh电池 165Hz高刷

转头就晕的耳石症,能开车上班吗?

教育要闻

2026青岛要取消高中特色班招生?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版
×