Kimi大动作，AI助手大爆发！|算法|宇宙|大模型|kimi|agent|openai

Kimi大动作，AI助手大爆发！

2024-11-19 06:31:08　来源: 财经早餐

北京举报

分享至

近期，AI助手（AI Agent）备受热捧。

前有国内智谱AI智能体AutoGLM持续刷屏，最新消息OpenAI首个AI助手（Agent）产品或将于明年1月发布。

此外，微软、苹果、华为、小米等国内外头部厂商也正争先推出AI助手相关产品。

A股市场上，近期AI助手&应用相关热度持续高企，中科金财、豆神教育等持续大涨。

OpenAI“下一个重大突破”

或将是AI助手

据科创板日报报道，OpenAI正准备推出一款代号为“Operator”的全新AI助手产 品，可以自动执行各种复杂操作，包括编写代码、预订旅行、自动电商购物等。

根据内部员工爆料，OpenAI领导层预计将在2025年1月发布该产品 ，首先作为研究预览版和开发工具推出，届时将为开发人员开放API接口。

资料显示，AI助手（AI Agent），是一种模拟人类智能行为的人工智能系统，以大型语言模型（LLM）作为其核心引擎，基于复杂多模态数据的处理能力，它们能够感知环境，做出决策，并执行任务以实现特定的目标。对于普通用户而言，AI助手最核心的功能是AI自主操作手机，辅助完成复杂推理任务。

OpenAI的CEO山姆奥特曼几周前在Reddit的“问我任何问题”（Ask Me Anything）论坛上表示： “ 我们将 拥有越来越好的模型，但下一个重大突破将是AI助手。”

AI助手将进入大爆发期！

事实上，目前国内外头部厂商正争先推出AI助手产品。

10月25日，智谱AI推出自主智能体AutoGLM，只需接收文字/语音指令，就可以模拟人类操作手机，开启人机交互全新模式和应用新蓝海。具体来说，当你向AutoGLM发出指令后，它能够代替你在手机和网页上完成各种操作，比如写点评、电商下单、写摘要、点外卖、发微信等。

10月23日，Anthropic推出全新Claude 3.5 Haiku和升级版Sonnet。Sonnet能力不仅全面超过GPT-4o，更带来全新AI体验：计算机使用，可以像人类一样操作电脑。

与过去AI Agent直接通过代码/程序，后台联网搜索/操作应用不同的是，这一次Claude真正像人类一样去使用电脑：先看屏幕，再使用鼠标操作，再通过思考，重复以上步骤直到完成目的。在这个过程中，Claude每一次截图查看屏幕，移动光标/点选，并给出思考的全过程。

此外，据不完全梳理统计，

10月22日，微软宣布在Dynamics 365中集成10个自主AI Agent，支持OpenAI最新模型o1，具备自主学习能力，可自动执行跨平台复杂业务。微软近期还低调开源了AI工具OmniParser，其可帮助用户创建个性化智能体，以操作个人计算机。

谷歌计划在12月预览其大型动作模型“Project Jarvis”，该项目将帮助用户执行诸如“收集研究、购买产品或预订航班”等任务。

苹果选择将Siri与ChatGPT集成，实现更智能的人机交互。

华为则公布了一项可让AI像人类一样操作手机的新研究成果，相关团队提出一个手机控制架构：Lightweight Multi-modal App Control（轻量级多模态应用控制，简称LiMAC）。

德邦证券认为，2025年或进入全终端Agent爆发元 年， Agent network有望初具规模，终端有望率先放量、其次是全行业落地应用，AI应用商业模式闭环或将形成。

此外，上个月OpenAI首席产品官Kevin Weil也曾表示：2025年将是Agent系统最终进入主流的一年！

Kimi重磅大动作

新模型媲美OpenAI最强模型

11月16日，正值国产大模型独角兽月之暗面Kimi Chat向全社会开放服务一周年之际，月之暗面正式发布其新一代数学推理模型k0-mat h，意在与OpenAI的o1系列相抗衡。

众所周知，此前9月12日，OpenAI发布了最新的大模型OpenAI-o1，新模型包括o1-preview和o1-mini两种版本。

按照OpenAI的说法，这是他们迄今为止最强、最一致的模 型，对于复杂推理任务而言，新模型代表着人工智能能力的崭新水平，因此值得将计数重置为1，给它一个有别于“GPT-4”系列的全新名 号。

与之前的版本相比，新模型最重要的一点就是使用了全新的“思维链模式”(Chain-of-Thought,CoT)，一种“高阶推理的新范式”，擅长复杂任务推理，能在科学、编程和数学等领域解决比以往模型更难的问题。

怎么理解这个“思维链模式”？

打个比方，有点儿类似于丹尼尔·卡尼曼在书《思考，快与慢》中提出的人类大脑的两个思考系统，即依赖直觉和经验、快速且无意识的系统1和深思熟虑、谨慎且有意识的系统2。

o1模型的发布，意味着大模型从运用系统1发展到了运用系统2 ，表现在使用过程中，即为大模型不再是对问题做出即刻响应，而是先进行一定时间的思考，生成解释推理过程的内部思维链。

而月之暗面最新发布的k0-math能力如何呢？

据基准测试显示，目前在中考、高考、考研以及包含入门竞赛题的MATH等4个数学基准测试中，k0-math初代模型成绩超过了OpenAI o1系列的o1-mini和o1-preview模型；在两个难度更大的竞赛级别的数学题库OMNI-MATH和AIME基准测试中，k0-math初代模型的表现分别达到了o1-mini最高成绩的90%和83%。

月之暗面创始人杨植麟在接受采访时表示，“如果说长文本是月之暗面登月的第一步，那么提升模型深度推理能力则是第二步。

其指出，大模型需要提升思考能 力。

“AI最重要的是思考和交互这两个能力，思考的重要性远大于交互，不是说交互不重要，交互是一个必要条件，但思考会决定上限。因此，接下来很重要的一件事是让AI具备思考的能力。”

而最适合让AI锻炼思考的能力，无疑是数学场景 ，伽利略曾说过，宇宙是由数学这门语言书写而成的，它是整个宇宙的基石，很多规律只是通过数学来刻划的。而且好处是并不需要跟外界进行交互，相对来说比较严密的自成一体，它自己可以成为一个体系，这让数学成为AI学习这种思考能力的一种非常好的场景。”

Scaling laws依然有效

强化学习是重点

自ChatGPT发布后，通过增加更多数据和计算能力来“扩大”当前模型，便能持续改进模型的能力，即所谓的Scalinglaw（尺度定律）几乎成为业内共识。

但OpenAI原首席科学家Ilya Sutskever日前公开表示，扩大预训练的结果已经达到了平台 期，每个人都在寻找下一个东西。

Scaling laws是否依然有效？

月之暗面创始人杨植麟认为，Scaling laws依然有效，但需更好的方 法。预训练大模型还有迭代空间，预计还有半代到一代的模型的空间会在明年释放出来，明年业内领先的模型会把预训练做到一个比较极致的阶段，接下来最重点的东西会在“强化学习”上，但它还是Scale，只是用不同的方式去Scale。”

其同时提到，AI的发展就像在荡秋千，在两种状态之间来回切换：

一种是算法、数据准备好了，但算力不够，从Transformer架构诞生到GPT4的出现，更多的矛盾在于如何扩大规模（Scale），在算法和数据上不存在本质问题。

但到了今天，规模已经到达了一定的程度，会发现再加更多的算力，也不一定能解决问题，其中核心问题是没有高质量的数据，这时要做的事便是改变算法，突破瓶颈。现在这是他所在的公司乃至整个行业都面临的共同问题，好的算法能够释放Scaling的潜力，让模型持续变得更好，强化学习是接下来很重要的一个趋势。

杨植麟同时提到，目前kimi每月使用人数已达到3600 万，而且数据在持续增长，当下月之暗面最核心的任务就是提升用户留存率。

关于AI助手，Kimi,AI大模型，大家还有啥想法？怎么看？欢迎评论区讨论交流呀~

免责声明（上下滑动查看全部）

任何在本文出现的信息（包括但不限于个股、评论、预测、图表、指标、理论、任何形式的表述等）均只作为参考，投资人须对任何自主决定的投资行为负责。另，本文中的任何观点、分析及预测不构成对阅读者任何形式的投资建议，亦不对因使用本文内容所引发的直接或间接损失负任何责任。投资有风险，过往业绩不预示未来表现。财经早餐力求文章所载内容及观点客观公正，但不保证其准确性、完整性、及时性等。本文仅代表作者本人观点。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.