允中 发自 凹非寺
量子位 | 公众号 QbitAI
现在的AI圈,正陷入一种极其尴尬的“精神内耗”:
云端智力早已溢出,物理执行却极度贫血。
那些高喊着重塑生产力的“强通用大模型”,在面对没有API的企业ERP、逻辑破碎的社交终端(如微信)时,往往瞬间熄火。
说白了,目前的Agent市场,嘴炮选手太多,实干选手太少。
大多数AI依然只是被关在对话框里的“电子宠物”——在大气层指点江山,却进不了你的文件夹。
这种“决策与执行”间的最后一道红利墙,最近被一支号称全球最年轻(平均年龄00后)的AI开发者团队捅破了。
![]()
新升代技术科技成立于2025年2月,联合创始人兼CEOKevin有着多年管理经验,负责确保其Agent能切实解决日常运营难题;而联合创始人兼CTOTony Yan是剑桥大学工程硕士,负责带领团队攻克AI架构的核心技术难题。
他们发布的新一代工业级Agent——TuriX Superpower,思路极其生猛:不再折腾语义拼图,而是直接把万物“CLI化”
TuriX不仅为AI构建了触达物理环境的“执行终端”,更从底层交互逻辑上,开启了由“辅助交互”向“自动驾驶”跃迁的生产力实验。
AI进化出“手”:从指令下达到结果交付的终极闭环
以前的AI只是一个被关在对话框里的“聊天机器人”,只能动动嘴皮子。
而现在,TuriX进化出了完整的执行力:它能直接听懂指令,像真人助理一样接管你的电脑。
具体来看,它把“聊天、办公、写代码、自动化操作”四大能力合而为一。你只需要下达一个指令,剩下的思考、决策、搜索、生成,甚至是最后的转发,它都能一气呵成。
1、Chat(聊天):不仅理解你说的话,更懂你真正想要什么。
![]()
2、Work(办公):像专家一样为你计划、决策、优化。
![]()
3、Code(编码):为你编写代码,检测漏洞。
![]()
4、CUA(自动操作):安全可控地跨应用执行任务指令。
![]()
项目一键闭环,当你输入提示词指令到思考过程再到最终的结果交付,TuriX superpower拥有出色的执行到完成能力。
例如:“帮我做一份最新的AI行业调研报告并且发送给微信的小T。”
真正的AI智能,从此不止对话
Manus擅长的长流程规划,TuriX稳稳拿捏;GPT和Gemini霸榜的智力博弈,TuriX同样在场。
但真正让赛道产生代差的——TuriX不仅能做到,而且是实现真正完整的交付。
核心亮点:CLI Agent+ CUA强强联合
他们将通用AgentCUA(Computer Use Agent)深度融合,并且比Openclaw更加安全可控,不会擅自动用和泄漏用户隐私
这样一来,大家使用时能够告别“只能聊不能干”的尴尬,从而实现调用电脑APP智能操作,真正让AI从“工具”变成“助手”。
![]()
这背后的产业逻辑非常清晰:
传统AI智能体大多停留在“语义交互”层面,侧重于信息检索与文本生成;而TuriX则通过CUA架构实现了从“语义”到“行为”的跨越,直接介入本地办公环境的复杂任务流。
从对话框到执行终端,TuriX Superpower正在重新定义工业级AI的生产力基准。
![]()
注:目前仅支持Mac版本,Windows版本即将上线。
使用门槛低且安全,对用户友好
OpenClaw的安装流程不太适用于小白/非技术背景的用户,且容易发生操作安全等问题。
![]()
相比之下,TuriX仅需注册一个密钥(API KEY)即可直接马上体验。注册即送$2额度Token,帮助新用户解锁免费的产品体验。
操作步骤:进入TuriX官网 -> 下载并安装TuriX APP -> 注册API账号 -> 获取专属API Key -> 填入API Key
不谈虚的价值,只看真实场景应用
Chat(对话模式):不仅仅是问答,更是战略推演
不同于娱乐性质的闲聊,TuriX的Chat板块是整个系统的“战略部”。
- 深度逻辑推理:它能处理长上下文,支持复杂业务逻辑的拆解。
- 知识检索增强:结合实时搜索功能,为后续的自动化任务提供准确的信息输入。
- 用途场景:它其实就像你日常依赖的豆包/Gemini/ChatGPT,大事小事都能问。
![]()
![]()
Work(办公模式):并行处理的虚拟团队
- 协作模式:是TuriX实现“数字员工”愿景的核心场景,也是本次更新中技术突破最明显的部分;
- 从端到端:TuriX-CUA + CLI能力实现指令行+桌面操作一体,端到端之间能够互相调起;
- 人类在环(Human-in-the-Loop):在执行过程中,TuriX会体现它的思考过程,你可以随时介入。这种“半自动化协作”既保证了效率,又确保了人在关键决策点上的控制权。例如,你能够在2分钟内直接做一款马上能玩的小游戏。
![]()
![]()
![]()
![]()
Code(代码模式):开发者级别的执行精度
对于涉及技术栈的任务,TuriX的Code模式提供了专业级的支持。
- 本地环境感知:它能理解用户电脑上的代码仓库结构,直接辅助调试或编写脚本。
- CUA与CLI的融合:TuriX不仅能写代码,还能通过CUA能力在终端(Terminal)中运行这些代码,观测运行结果,并在发现报错时自主进行迭代修复。
CUA(计算机操作Agent):基于视觉模型的终极执行
这是TuriX的传统强项,区别于市面上多数的AI Agent。
- 自研视觉模型(Visual Model)的差异化特征:
传统的自动化工具依赖于软件底层的API或坐标定位,一旦软件更新界面,自动化流程就会失效。
TuriX本次引入了强大的视觉模型。它不再仅仅读取代码,而是“看”屏幕。它能识别什么是按钮、什么是输入框、什么是滚动条。
- GUI任务的自主执行:
无论是在macOS还是Windows环境下,TuriX都能像人类一样操作Office软件、社交媒体工具、专业的ERP系统甚至没有API接口的传统软件。
这种“感知即执行”的能力,让TuriX在桌面自动化基准测试中表现出远超行业平均水平的成功率。
TuriX-CUA × 通用Agent:智能边界,重新定义
从技术架构上看,通用智能体(General Agent)与CUA的协同,本质上是“感知-决策”中心“动力-执行”末端的解耦与再集成。
以ChatGPT为代表的云端模型负责高阶逻辑推理,解决“策略生成”维度的最优解;
TuriX-CUA则充当底层执行层,负责对物理屏幕的实时感知与精准操控。
这种架构有效对冲了双方的局限:即云端模型的操作盲区与垂直执行端的逻辑天花板
两者的短板互补,标志着AI Agent正在经历由“离线式认知”向“在线式交付”的物种进化,形成并发式的“数字劳动力集群”。
在推出Superpower完整版产品的同时,TuriX始终保持着核心引擎TuriX-CUA开源状态。
作为一个基于Python的计算机使用框架,TuriX-CUA采用了Planner+Executor的多模型设计,有效提升了长序列任务的稳定性。
![]()
![]()
目前,项目已迅速在GitHub获得超2200 Stars,支持macOS、 Windows、Linux多平台,并提供 “热插拔大脑” 的灵活配置——用户可以通过修改配置文件更换底层视觉语言模型(VLM),无需改动代码。
![]()
关注社区,共筑下一代智能生态
在算法风口频出的当下,Agent赛道正经历从“拟人化情感联结”向“工业级生产力”的范式转型。
TuriX团队始终保持着实用主义的冷静:Agent的终极使命不是成为“健谈的同伴”,而是成为执行人类意志的精密仪器。
在算力平权的时代,单纯的代码堆砌已不再是壁垒,对垂直场景痛点的精准拆解才最具稀缺性。
TuriX对“白盒”理念的坚持,本质上是技术理性的回归——让机器服务于人的逻辑,而非让人服从算法的黑盒。
这种“让机器回归机器,让人回归创造”的底色,正映射出Agent进化的确定性方向:从“Chatty Companion”(聊天机器人)转向“Silent, Capable Tool”(低调实干的生产力工具)。
随着TuriX Superpower正式上线,这种长期主义的坚持,正在填补AI与物理环境间的效率空白。工业级Agent介入琐碎日常的时代,序幕已拉开。
对于桌面Agent技术实现感兴趣,或计划在项目中集成CUA能力的开发者,可关注TuriX在GitHub上的开源进展:(团队表示,Issue区的反馈将直接驱动项目的工程化迭代)
GitHub链接:
https://github.com/TurixAI/TuriX-CUA
产品官网:
https://turix.ai/
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.