网易首页 > 网易号 > 正文 申请入驻

Kimi大动作,AI助手大爆发!

0
分享至

近期,AI助手(AI Agent)备受热捧。

前有国内智谱AI智能体AutoGLM持续刷屏,最新消息OpenAI首个AI助手(Agent)产品或将于明年1月发布

此外,微软、苹果、华为、小米等国内外头部厂商也正争先推出AI助手相关产品。

A股市场上,近期AI助手&应用相关热度持续高企,中科金财、豆神教育等持续大涨。

OpenAI“下一个重大突破”

或将是AI助手

据科创板日报报道,OpenAI正准备推出一款代号为“Operator”的全新AI助手产 品, 可以自动执行各种复杂操作,包括编写代码、预订旅行、自动电商购物等。

根据内部员工爆料,OpenAI领导层预计将在2025年1月发布该产品 首先作为研究预览版和开发工具推出,届时将为开发人员开放API接口。

资料显示,AI助手(AI Agent),是一种模拟人类智能行为的人工智能系统,以大型语言模型(LLM)作为其核心引擎,基于复杂多模态数据的处理能力,它们能够感知环境,做出决策,并执行任务以实现特定的目标。对于普通用户而言,AI助手最核心的功能是AI自主操作手机,辅助完成复杂推理任务。

OpenAI的CEO山姆奥特曼几周前在Reddit的“问我任何问题”(Ask Me Anything)论坛上表示: 我们将 拥有越来越好的模型,但下一个重大突破将是AI助手。”

AI助手将进入大爆发期!

事实上,目前国内外头部厂商正争先推出AI助手产品。

10月25日,智谱AI推出自主智能体AutoGLM,只需接收文字/语音指令,就可以模拟人类操作手机,开启人机交互全新模式和应用新蓝海。具体来说,当你向AutoGLM发出指令后,它能够代替你在手机和网页上完成各种操作,比如写点评、电商下单、写摘要、点外卖、发微信等。

10月23日,Anthropic推出全新Claude 3.5 Haiku和升级版Sonnet。Sonnet能力不仅全面超过GPT-4o,更带来全新AI体验:计算机使用,可以像人类一样操作电脑。

与过去AI Agent直接通过代码/程序,后台联网搜索/操作应用不同的是,这一次Claude真正像人类一样去使用电脑:先看屏幕,再使用鼠标操作,再通过思考,重复以上步骤直到完成目的。在这个过程中,Claude每一次截图查看屏幕,移动光标/点选,并给出思考的全过程。

此外,据不完全梳理统计,

10月22日,微软宣布在Dynamics 365中集成10个自主AI Agent,支持OpenAI最新模型o1,具备自主学习能力,可自动执行跨平台复杂业务。微软近期还低调开源了AI工具OmniParser,其可帮助用户创建个性化智能体,以操作个人计算机。

谷歌计划在12月预览其大型动作模型“Project Jarvis”,该项目将帮助用户执行诸如“收集研究、购买产品或预订航班”等任务。

苹果选择将Siri与ChatGPT集成,实现更智能的人机交互。

华为则公布了一项可让AI像人类一样操作手机的新研究成果,相关团队提出一个手机控制架构:Lightweight Multi-modal App Control(轻量级多模态应用控制,简称LiMAC)。

德邦证券认为,2025年或进入全终端Agent爆发元 年, Agent network有望初具规模,终端有望率先放量、其次是全行业落地应用,AI应用商业模式闭环或将形成。

此外,上个月OpenAI首席产品官Kevin Weil也曾表示:2025年将是Agent系统最终进入主流的一年

Kimi重磅大动作

新模型媲美OpenAI最强模型

11月16日,正值国产大模型独角兽月之暗面Kimi Chat向全社会开放服务一周年之际,月之暗面正式发布其新一代数学推理模型k0-mat h, 意在与OpenAI的o1系列相抗衡。

众所周知,此前9月12日,OpenAI发布了最新的大模型OpenAI-o1,新模型包括o1-preview和o1-mini两种版本。

按照OpenAI的说法,这是他们迄今为止最强、最一致的模 型, 对于复杂推理任务而言,新模型代表着人工智能能力的崭新水平,因此值得将计数重置为1,给它一个有别于“GPT-4”系列的全新名 号。

与之前的版本相比,新模型最重要的一点就是使用了全新的“思维链模式”(Chain-of-Thought,CoT),一种“高阶推理的新范式”,擅长复杂任务推理,能在科学、编程和数学等领域解决比以往模型更难的问题。

怎么理解这个“思维链模式”?

打个比方,有点儿类似于丹尼尔·卡尼曼在书《思考,快与慢》中提出的人类大脑的两个思考系统,即依赖直觉和经验、快速且无意识的系统1和深思熟虑、谨慎且有意识的系统2。

o1模型的发布,意味着大模型从运用系统1发展到了运用系统2 表现在使用过程中,即为大模型不再是对问题做出即刻响应,而是先进行一定时间的思考,生成解释推理过程的内部思维链。

月之暗面最新发布的k0-math能力如何呢?

据基准测试显示,目前在中考、高考、考研以及包含入门竞赛题的MATH等4个数学基准测试中,k0-math初代模型成绩超过了OpenAI o1系列的o1-mini和o1-preview模型;在两个难度更大的竞赛级别的数学题库OMNI-MATH和AIME基准测试中,k0-math初代模型的表现分别达到了o1-mini最高成绩的90%和83%。

月之暗面创始人杨植麟在接受采访时表示,“如果说长文本是月之暗面登月的第一步,那么提升模型深度推理能力则是第二步。

其指出,大模型需要提升思考能 力。

“AI最重要的是思考和交互这两个能力,思考的重要性远大于交互,不是说交互不重要,交互是一个必要条件,但思考会决定上限。因此,接下来很重要的一件事是让AI具备思考的能力。”

最适合让AI锻炼思考的能力,无疑是数学场景 伽利略曾说过,宇宙是由数学这门语言书写而成的,它是整个宇宙的基石,很多规律只是通过数学来刻划的。而且好处是并不需要跟外界进行交互,相对来说比较严密的自成一体,它自己可以成为一个体系,这让数学成为AI学习这种思考能力的一种非常好的场景。”

Scaling laws依然有效

强化学习是重点

自ChatGPT发布后,通过增加更多数据和计算能力来“扩大”当前模型,便能持续改进模型的能力,即所谓的Scalinglaw(尺度定律)几乎成为业内共识。

但OpenAI原首席科学家Ilya Sutskever日前公开表示,扩大预训练的结果已经达到了平台 期, 每个人都在寻找下一个东西。

Scaling laws是否依然有效?

月之暗面创始人杨植麟认为,Scaling laws依然有效,但需更好的方 法。 预训练大模型还有迭代空间,预计还有半代到一代的模型的空间会在明年释放出来,明年业内领先的模型会把预训练做到一个比较极致的阶段,接下来最重点的东西会在强化学习上,但它还是Scale,只是用不同的方式去Scale。”

其同时提到,AI的发展就像在荡秋千,在两种状态之间来回切换:

一种是算法、数据准备好了,但算力不够,从Transformer架构诞生到GPT4的出现,更多的矛盾在于如何扩大规模(Scale),在算法和数据上不存在本质问题。

但到了今天,规模已经到达了一定的程度,会发现再加更多的算力,也不一定能解决问题,其中核心问题是没有高质量的数据,这时要做的事便是改变算法,突破瓶颈。现在这是他所在的公司乃至整个行业都面临的共同问题,好的算法能够释放Scaling的潜力,让模型持续变得更好,强化学习是接下来很重要的一个趋势

杨植麟同时提到,目前kimi每月使用人数已达到3600 而且数据在持续增长,当下月之暗面最核心的任务就是提升用户留存率。

关于AI助手,Kimi,AI大模型,大家还有啥想法?怎么看?欢迎评论区讨论交流呀~

免责声明(上下滑动查看全部)

任何在本文出现的信息(包括但不限于个股、评论、预测、图表、指标、理论、任何形式的表述等)均只作为参考,投资人须对任何自主决定的投资行为负责。另,本文中的任何观点、分析及预测不构成对阅读者任何形式的投资建议,亦不对因使用本文内容所引发的直接或间接损失负任何责任。投资有风险,过往业绩不预示未来表现。财经早餐力求文章所载内容及观点客观公正,但不保证其准确性、完整性、及时性等。本文仅代表作者本人观点。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
印媒:从哈佛留学生数量看中印两国不同

印媒:从哈佛留学生数量看中印两国不同

环球网资讯
2026-01-16 06:54:07
贺娇龙告别仪式:大家排队烧纸,家中包饺子画面曝光,太喜欢白色

贺娇龙告别仪式:大家排队烧纸,家中包饺子画面曝光,太喜欢白色

古希腊掌管松饼的神
2026-01-16 22:36:21
浙江AI直接揪出贪官!这波操作太硬核!

浙江AI直接揪出贪官!这波操作太硬核!

达文西看世界
2026-01-15 16:32:35
91年在医院照顾舅舅,顺便帮了邻床一把,没想到却改变了我一生

91年在医院照顾舅舅,顺便帮了邻床一把,没想到却改变了我一生

衍月
2025-11-17 16:54:11
“治港败类”曾荫权:治理香港7年,为何却在卸任后,获刑20个月

“治港败类”曾荫权:治理香港7年,为何却在卸任后,获刑20个月

卷史
2025-09-15 11:50:59
贾老板想溅老罗一身血

贾老板想溅老罗一身血

鹿有角
2026-01-16 21:35:58
19岁河南小伙在伦敦“捡”了个瑞士爷爷,回国后硬是把他接来郑州养老,临终前老人说了一句话,让无数人破防

19岁河南小伙在伦敦“捡”了个瑞士爷爷,回国后硬是把他接来郑州养老,临终前老人说了一句话,让无数人破防

源溯历史
2026-01-09 18:47:21
湖南第一庸官,好面子导致政府负债1000亿,为政绩骗刘强东100亿

湖南第一庸官,好面子导致政府负债1000亿,为政绩骗刘强东100亿

芊芊子吟
2026-01-15 10:20:03
贵州跑圈“女神”李绍艳离世,年仅30岁,经常在马路上逆行摆拍

贵州跑圈“女神”李绍艳离世,年仅30岁,经常在马路上逆行摆拍

叶公子
2026-01-15 17:20:45
“性萧条”才是这个时代真正的危机

“性萧条”才是这个时代真正的危机

深蓝夜读
2025-09-24 16:00:09
回顾探花大神:害人害己,多位女主被亲戚认出当场“社死”

回顾探花大神:害人害己,多位女主被亲戚认出当场“社死”

就一点
2025-10-09 12:19:42
委内瑞拉和伊朗这一手“反水”,直接给中国上一堂最昂贵的战略课

委内瑞拉和伊朗这一手“反水”,直接给中国上一堂最昂贵的战略课

南权先生
2026-01-16 16:22:00
祝福!“中国女婿”阿尔本与何沐妮订婚:我想我们只能陪伴彼此了

祝福!“中国女婿”阿尔本与何沐妮订婚:我想我们只能陪伴彼此了

懂球帝
2026-01-17 03:49:16
武汉老党员遭围殴反被判刑,妻子多年奔走至今未讨回清白

武汉老党员遭围殴反被判刑,妻子多年奔走至今未讨回清白

眼望北方
2026-01-17 09:17:22
和主教练对着干?曝姆巴佩拒绝出战对阵莱万特的比赛

和主教练对着干?曝姆巴佩拒绝出战对阵莱万特的比赛

油泼辣不辣
2026-01-17 07:07:58
惨败上海后!广东队被逼补强,朱芳雨下重本,强挖NBA乐透中锋?

惨败上海后!广东队被逼补强,朱芳雨下重本,强挖NBA乐透中锋?

绯雨儿
2026-01-17 11:00:38
河南一6岁女童发烧17天,脑子被“啃”出十几个洞,医生:孩子在潮湿环境中玩耍后,霉菌“爬”进脑子

河南一6岁女童发烧17天,脑子被“啃”出十几个洞,医生:孩子在潮湿环境中玩耍后,霉菌“爬”进脑子

大风新闻
2026-01-16 15:36:16
我们必须要永远保持对吕蒙“白衣渡江”严厉的批判态度!保持警惕

我们必须要永远保持对吕蒙“白衣渡江”严厉的批判态度!保持警惕

吕醿极限手工
2026-01-09 21:45:13
官宣!广州社保大调整!

官宣!广州社保大调整!

羊城攻略
2026-01-16 21:51:24
15年过去了,那个说要赡养前妻父母的莫科,履行承诺了吗?

15年过去了,那个说要赡养前妻父母的莫科,履行承诺了吗?

哄动一时啊
2025-12-19 14:39:26
2026-01-17 13:36:50
财经早餐 incentive-icons
财经早餐
美好的一天,从财经早餐开始!
10921文章数 110733关注度
往期回顾 全部

科技要闻

8亿周活扛不住烧钱 ChatGPT终向广告"低头"

头条要闻

癌症晚期男子驾车撞死婆孙2人后病亡 法院判赔超200万

头条要闻

癌症晚期男子驾车撞死婆孙2人后病亡 法院判赔超200万

体育要闻

三巨头走了俩,联盟笑柄却起飞了

娱乐要闻

徐家还是爱孩子的,在马筱梅生产前选择和解

财经要闻

央行再次结构性降息0.25个百分点

汽车要闻

林肯贾鸣镝:稳中求进,将精细化运营进行到底

态度原创

手机
旅游
数码
本地
公开课

手机要闻

小米17 Pro Max获得PChome2025卓越交互体验手机奖项

旅游要闻

郑州冬日顶流!这里的水杉林红成童话(8条公交线路直达)!

数码要闻

JSAUX笔记本电脑“三屏化”扩展套件FlipGo Horizon国行上市

本地新闻

云游内蒙|黄沙与碧波撞色,乌海天生会“混搭”

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版