网易首页 > 网易科技 > 网易科技 > 正文

一周AI大事:Kimi万亿模型"横空出世",小鹏人形机器人“以假乱真”!

0
分享至

一、重磅工具——1万亿参数Kimi“亮剑”,既能做事也会做事

新闻:月之暗面 (Moonshot AI) 宣布推出Kimi K2 Thinking,这是一款专为打造强大AI智能体而从零开始打造的开源AI推理模型。这款高效的混合专家(MoE)模型基于Kimi K2构建,总参数量达1万亿,推理时激活参数320亿,支持的最长上下文可达25.6万词元。

在数学、编程和智能体基准测试中,Kimi K2 Thinking的表现可媲美GPT-5和Claude 4.5 Thinking:在Humanities Last Exam (HLE) 测试中得分44.9%,在SWE-bench验证集测试中得分71.3%,在BrowseComp (智能体搜索)测试中得分60.2%。


这款模型不仅在写作、编码和推理方面具备优异的通用能力,在智能体任务和工具调用方面表现更为出色。它能在无人干预的情况下连续调用工具200到300次,通过数百个步骤的连贯推理来解决复杂问题。Kimi K2 Thinking采用的是量化感知训练(QAT)技术,确保其量化版本不会降低输出质量。鉴于其基准测试结果是基于INT4精度得出的,这更显得模型表现尤为抢眼。

这可能是自DeepSeek R1发布以来,中国企业推出的最重要的AI模型。它再次表明,中国AI实验室正在缩小与美国顶尖AI实验室的差距。

锐评:这次中国AI卷的不是文案,是能做事会做事。

二、AI技术与产品发布——从“算地球”到“换人脸”,大厂“炫技”停不下来

1. 新闻:艾伦人工智能研究所(AI2)推出开源的端到端“地球智能”平台OlmoEarth,旨在利用地球观测数据帮助人们深入理解地球运行机制。其中包含:


OlmoEarth基础模型:基于地球观测数据训练的小型AI模型,参数从140万到3亿不等,用于执行场景识别或图像语义分割等地理空间相关任务;OlmoEarth Studio:用于数据集建模和微调的功能;OlmoEarth Run:地球建模流程引擎;OlmoEarth Projects:经过微调的地球智能实用模型。

锐评:以后AI上算天下算地,中间算空气。

2. 新闻:微软将自研的文生图模型MAI-Image-1整合进Bing Image Creator和Copilot。这款模型能快速生成高质量的食物、自然和现实世界场景图像,使微软摆脱对OpenAI图像生成技术的依赖。

锐评:微软终于不靠OpenAI画图了,决定自己动手丰衣足食。

3. 新闻:美团龙猫团队发布全模态开源模型LongCat Flash Omni,采用MoE架构,总参数量5600亿,激活参数量270亿。技术报告显示,这款模型在多模态基准测试中达到了SOTA水平。

锐评:美团这次不送外卖,改送模型。

4. 新闻:中国电动汽车公司小鹏发布IRON人形机器人。该公司称这款机器人“最像人”,有柔性皮肤和仿生肌肉。人形骨骼、肌肉和皮肤结构使这款机器人成为迄今最接近人类的机器人,甚至引发了有关“恐怖谷效应”和“科幻成真”的讨论。小鹏还同步发布了VLA 2.0大模型,这是一款用于具身AI的视觉-语言-行动模型,适用于自动驾驶汽车和AI机器人。

锐评:过去总有人说小鹏汽车模仿特斯拉,这次要反过来了。

5. 新闻:Cognition公司发布Windsurf Codemaps。这款工具由SWE-1.5和Sonnet 4.5提供支持。它能帮助开发者理解复杂的代码结构,就像为代码库打造的Notebook LM。

锐评:Cognition掏出“代码活地图”,程序员再也不会迷路了。

6. 新闻:Maya Research团队发布Maya1开源语音生成模型,参数量30亿。这款文本转语音模型在质量基准测试中攀升至开源权重语音AI模型的第二名,在全球模型中排名第二十。其演示与模型权重现已上线HuggingFace平台。

锐评:AI已经不只会说话,还会“说得好听”

7. 新闻:谷歌在Gemini API中引入文件搜索工具(File Search Tool),提供端到端的检索增强生成(RAG)功能,为开发者简化了复杂的RAG流程。它支持内置引用、多种文件格式和强大的语义向量搜索。此外,谷歌的无代码应用构建工具Opal现已覆盖全球160多个国家和地区。

锐评:让开发者一键就能搞定头疼的RAG。

8. 新闻:Mozilla.ai发布开源接口any-llm 1.0,允许开发者将云端和本地的任意模型接入AI工作流。any-llm通过统一的API将项目逻辑与模型提供商解耦,使开发者无需重写集成代码即可自由切换模型。

锐评:想接谁接谁,实现模型自由不是梦。

9. 新闻:Higgsfield发布Recast功能,允许用户将任意视频中的角色替换为另一个角色。

锐评:AI让“主演换人不换戏”成为影视圈新常态。

10. 新闻:Sora现已登陆Android平台,让Sora 2的高级视频生成功能覆盖更多用户。但目前Android用户仍需邀请码才能使用Sora的生成功能,且仅有部分国家和地区开放。

锐评:Sora空降安卓,前提是你得有邀请码。

11. 新闻:谷歌新一代图像生成模型Nano Banana 2最早或将于下周发布。前作Nano Banana因其在图像编辑方面达到SOTA水平而广受欢迎,其升级版预计将大幅提升AI辅助创作工作流的效率。

锐评:AI绘画圈的传说要开续集了。

三、AI研究资讯——谷歌嫌地球电费贵,准备玩“算力上天”

新闻:作为天基AI基础设施项目Suncatcher的组成部分,谷歌将于2027年发射两颗搭载TPU AI芯片的卫星。该项目设想未来由多颗卫星组成的太空数据中心,通过卫星间光通信链路传输数据,执行分布式AI任务。谷歌希望在未来几十年,天基数据中心的成本效益或将超过地面数据中心,因为太阳能板在轨道上的效率比地面高出8倍。


锐评:省的电够不够发卫星的成本?

四、AI商业与政策——OpenAI豪掷千金,苹果低头付钱

1. 新闻:据报道,苹果正与谷歌达成协议,拟每年支付10亿美元,在下一代Siri语音助手中使用参数量达1.2万亿的谷歌AI模型。这意味着苹果在Siri的AI能力上再度依赖外部技术。长期未更新的Siri已让苹果在AI竞赛中明显落后。

锐评:Siri终于要变聪明,但脑子是谷歌的。

2. 新闻:OpenAI发布《青少年安全蓝图》,旨在指导AI产品和政策如何保护青少年安全以及如何更好地为青少年赋能。该蓝图强调适龄设计、有效的安全机制,以及持续的研究和评估。OpenAI表示,公司正积极为旗下产品部署家长控制与年龄预测系统等保护机制,而不是被动等待有关AI如何保护青少年的监管规定。

锐评:OpenAI想证明,关心下一代,我们是认真的。

3. 新闻:OpenAI与亚马逊宣布达成总额380亿美元的协议。OpenAI将在AWS基础设施上运行模型,以获取对数十万块英伟达芯片的访问权。这一举措进一步强化了OpenAI的算力与云端部署能力,从而更好地支撑ChatGPT的推理和训练。

锐评:豪掷380亿,只为喂饱ChatGPT。

4. 新闻:OpenAI宣布全球已经有100万家企业正在直接使用其公司服务。该公告介绍称,统计口径包括所有主动为商业用途付费的组织,以及通过开发者平台直接消费模型的企业。该公司此前在9月初曾披露,包含ChatGPT企业用户和校园版ChatGPT Edu的用户数量破百万。

锐评:看来都尝到了用AI上班划水的好。

5. 新闻:周三,英伟达CEO黄仁勋在接受采访时称,“中国将赢得人工智能竞赛”,理由是更有利的监管环境和更低的能源成本。这被视为黄仁勋迄今为止对中美AI竞赛作出的“最直白的表态”。


锐评:老黄说了句大实话。

6. 新闻:黄仁勋本周末再度访问台积电,亲赴芯片产线并罕见出席台积电职工运动会。这也是黄仁勋近3个月来第3次访问台积电。对于此次访问的目的,黄仁勋表示其公司最先进的Blackwell芯片正面临“非常强劲的需求”,因此对台积电晶圆的需求也在增长。他说道:“英伟达制造GPU,我们也制造CPU、网络设备、交换机,所以有很多与Blackwell相关的芯片。而且公司也正在努力研发下一代Rubin芯片。”台积电CEO魏哲家则直白地表示“黄仁勋想要更多芯片”,但被问及具体数量时,魏哲家笑称“这是机密!”

锐评:这是来催货了。

7. 新闻:全球首个AI大模型实时投资比赛“Alpha Arena”落下帷幕。历时17天,阿里通义千问Qwen以超20%的收益率夺冠,Qwen和DeepSeek两款中国模型也成为唯二盈利的模型,而美国四大顶尖模型全部亏损,GPT-5亏损超60%垫底。

锐评:论炒股,还得是国产。

8. 新闻:Perplexity表示,亚马逊发出法律威胁,试图阻止Comet AI助手在亚马逊平台购物。Perplexity指责这是“霸凌”,认为亚马逊是想通过控制AI购物智能体来实现平台利润最大化。相比之下,Shopify正积极迎合AI智能体在电商购物领域的新角色。Shopify表示,自今年1月份以来,AI流量增长了7倍,AI下的订单增长了11倍。Shopify已经在与Perplexity和微软合作开发聊天内购物体验,并与OpenAI合作深度集成ChatGPT。

锐评:亚马逊不让AI购物,是因为它不充会员。

9. 新闻:Anthropic宣布在巴黎和慕尼黑新设办事处,加速扩张全球业务。欧洲是Anthropic增长最快的地区,Claude AI让该公司的欧洲营收同比增长逾9倍。Anthropic的目标是2026年实现200亿至260亿美元的年化经常性收入。

锐评:看来在欧洲是真赚到钱了。

10. 新闻:美联社宣布推出结构化数据产品AP Intelligence,将经过核实的新闻报道转化为可用于AI和数据分析的行业数据集与信息源。

锐评:老牌媒体开始卖数据了,“真相”正式打包成API格式。

11. 新闻:面对来自大型科技公司的压力以及与美国在贸易问题上的磋商,欧盟委员会考虑暂停实施《AI法案》的部分条款。尽管法案已于2024年8月正式生效,但某些条款的实施时间可能会推迟。

锐评:欧洲AI监管也是雷声大雨点小。

五、AI观点与文章——卡戴珊考试挂科怪AI,“码农”编程全靠“感觉”了

1. 新闻:在接受《名利场》(Vanity Fair)采访时,美国网红金·卡戴珊 (Kim Kardashian) 谈到ChatGPT对于她可谓“亦敌亦友”。她表示因使用ChatGPT获取法律建议,自己未能通过美国司法考试,并指责模型“幻觉”生成的错误信息导致失分。这再次引发公众对大语言模型生成虚假答案、造成现实后果的关注。

锐评:考不好不能怪AI,还是要从自己身上找原因。

2. 新闻:《柯林斯词典》2025年度热词为“氛围编程”(vibe coding)”,意指使用自然语言提示词来让AI编写代码或生成应用程序。AI不仅在改变世界,也在改变语言本身。

锐评:编程不再敲代码,全凭“感觉”问AI。(辰辰)

延伸阅读
相关推荐
热点推荐
华西不开空调被投诉,住院患者已足额缴纳费用,官方回复了

华西不开空调被投诉,住院患者已足额缴纳费用,官方回复了

医脉圈
2026-05-05 20:06:03
聚焦目光的强大,是来自于自身

聚焦目光的强大,是来自于自身

飛娱日记
2026-05-02 08:36:00
美国做了个实验,将3男3女关一起2年,他们出来时,令所有人惊讶

美国做了个实验,将3男3女关一起2年,他们出来时,令所有人惊讶

千秋文化
2026-05-05 20:32:13
赢百万奖金后,吴宜泽坦白夺冠最大功臣,原来他和丁俊晖是一路人

赢百万奖金后,吴宜泽坦白夺冠最大功臣,原来他和丁俊晖是一路人

削桐作琴
2026-05-06 20:21:48
争议?56岁西蒙尼66分钟便换下2大巨星 欧冠出局后怒推阿森纳总监

争议?56岁西蒙尼66分钟便换下2大巨星 欧冠出局后怒推阿森纳总监

我爱英超
2026-05-06 06:09:59
浙江一男子的新能源车假期停在路边突然自燃,并烧毁附近两辆货车,消防认定系“车内设备故障引发火灾”,车商:不能证明是车子质量问题

浙江一男子的新能源车假期停在路边突然自燃,并烧毁附近两辆货车,消防认定系“车内设备故障引发火灾”,车商:不能证明是车子质量问题

洪观新闻
2026-05-06 13:04:07
广东队决战北京队,首发阵容大调整,杜锋输球面临下课

广东队决战北京队,首发阵容大调整,杜锋输球面临下课

宗介说体育
2026-05-06 10:03:48
关注中美高层互动,民进党当局忧虑自身上“菜单”

关注中美高层互动,民进党当局忧虑自身上“菜单”

京彩台湾
2026-05-06 09:04:21
“吃饭七分饱”被推翻了?医生:过了56岁,吃饭尽量要做到这8点

“吃饭七分饱”被推翻了?医生:过了56岁,吃饭尽量要做到这8点

刘哥谈体育
2026-05-06 18:57:32
哇 当年的许晴,浓眉大眼,目光坚毅,一身正气啊

哇 当年的许晴,浓眉大眼,目光坚毅,一身正气啊

动物奇奇怪怪
2026-05-06 18:15:58
想买车的先别急着出手,四大新车即将重磅上市,每款都有杀手锏

想买车的先别急着出手,四大新车即将重磅上市,每款都有杀手锏

火星说车
2026-05-06 15:26:17
特斯拉推出官方电池维修认证,为二手电动车保值难题提供解决方案

特斯拉推出官方电池维修认证,为二手电动车保值难题提供解决方案

IT之家
2026-05-06 16:25:54
封神!泰山21岁小将依木兰首秀11分钟封神,球迷狂呼:如获至宝

封神!泰山21岁小将依木兰首秀11分钟封神,球迷狂呼:如获至宝

梦忆之浅
2026-05-06 15:10:11
俗话说“惹金莫惹银,惹银害死人”,银环蛇毒性有多强?为何专挑夜钓的人下手?

俗话说“惹金莫惹银,惹银害死人”,银环蛇毒性有多强?为何专挑夜钓的人下手?

农夫也疯狂
2026-05-06 15:42:59
富豪太空闹剧撕碎探月浪漫

富豪太空闹剧撕碎探月浪漫

小眼睛小世界
2026-05-06 09:02:05
18分惨败雷霆!里夫斯毁掉詹姆斯封神夜,湖人该给他5年2.41亿吗

18分惨败雷霆!里夫斯毁掉詹姆斯封神夜,湖人该给他5年2.41亿吗

生活新鲜市
2026-05-06 19:59:20
今天A股最惨个股!连跌四月再遭一字20cm跌停

今天A股最惨个股!连跌四月再遭一字20cm跌停

财经智多星
2026-05-06 10:50:42
48岁男子替已故哥哥抚养4个孩子,无人敢嫁,至今仍单身已满头白发

48岁男子替已故哥哥抚养4个孩子,无人敢嫁,至今仍单身已满头白发

张晓磊
2026-04-27 11:21:00
世乒赛战报:梁靖崑王楚钦3-0晋级,8强对阵出炉,龙队观赛

世乒赛战报:梁靖崑王楚钦3-0晋级,8强对阵出炉,龙队观赛

蹲坑看世界
2026-05-06 02:01:19
江苏多地公布中小学暑假安排

江苏多地公布中小学暑假安排

极目新闻
2026-05-06 18:07:12
2026-05-06 21:28:49

科技要闻

“马斯克不懂AI”:OpenAI当庭戳老底

头条要闻

知情人士:伊朗将同意将铀浓缩材料运出伊朗

头条要闻

知情人士:伊朗将同意将铀浓缩材料运出伊朗

体育要闻

活塞1比0骑士:坎宁安不再是一个人了

娱乐要闻

神仙友谊!杨紫连续10年为张一山庆生

财经要闻

最新GDP!全国30强城市,又变了

汽车要闻

领克10/领克10+ 无论能源形式 领克都要快乐

态度原创

手机
本地
艺术
亲子
公开课

手机要闻

彻底放弃!小米暂停小折叠产品线,MIX Flip 2 成绝唱,华为无天敌了

本地新闻

用青花瓷的方式,打开西溪湿地

艺术要闻

震撼!康斯坦丁摄影作品里的性感曲线让人惊艳!

亲子要闻

跟着荷兰奶奶学识颜色

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版
×