网易首页 > 网易号 > 正文 申请入驻

这个Agent学会刷B站、打德扑,还能盯盘写预测简报|实测Flowith OS

0
分享至


AI应用风向标(公众号:ZhidxcomAI)
作者|江宇
编辑|漠影

智东西10月29日报道,昨日,AI应用初创公司Flowith正式发布本地智能体操作系统Flowith OS,这是一整套为其Agent Neo设计的运行系统。


传统网页端AI助手通常被封装在某个标签页中,用户发出指令,助手被动响应。而Flowith OS正试图突破这个限制,用户只需要表达意图,系统就能将其转化为可以连续执行的完整操作流程

Flowith OS搭载了上下文改进系统,并通过在线强化学习持续优化。每完成一次任务,系统会自动回顾执行过程,根据结果进行反思,并不断更新其执行策略。这意味着,用户每次的使用过程,都会帮助智能体Neo变得更聪明。

为了实现长期的记忆积累,Flowith OS还引入了双层记忆系统,包括短期缓冲和长期情景记忆。系统不仅能记住你最近的指令,还能理解你在不同时期的偏好、写作风格和使用方式等,并在下次使用时自动调用。

技能和记忆被统一纳入到整个操作逻辑中。比如你曾保存过一个“图转PDF”的处理流程,或者习惯以某种语气写汇报文案,这些都可以被标记为技能或记忆,并在类似场景下被系统自动应用,无需重复设置。

为保证任务执行的响应速度,Flowith OS还配备了独立执行内核与速度缓存机制。系统可以并行安排任务流程,并对高频操作模块提前做预加载,从而实现本地执行中的快速响应。

在实际使用中,这套系统可以完成包括“批量生成PDF”、“提取航班信息并转为CSV”在内的流程型任务,也可以被用于管理社交平台账号,实现发帖、点赞、评论等自动化操作。更复杂的任务如生成视频、撰写标题、自动上传等,也已能在该系统内实现一条龙托管。


测评结果显示,Flowith OS在Online-Mind2Web Benchmark测试的四个难度等级下全面领先,平均准确率达到95.4%,在Easy和Medium任务中分别高达96.3%和97.7%,远超ChatGPT Atlas(平均61.3%)与Gemini 2.5(69%)等对手。


智东西也体验了一番Flowith OS的使用流程。

在首次启动阶段,系统会引导用户完成一系列初始化设置,包括导入Chrome或Safari中的浏览记录与标签页,以便无缝切换至新环境;接着用户可选择将其设为默认浏览器、添加到Dock或任务栏,并设置是否开机启动。

整个过程中,系统明确标注“100%本地存储”,所有执行历史、账户数据、记忆与技能内容均保存在本地设备中,不与云端同步


完成引导后,用户将进入Flowith OS的主界面。系统以“OS已觉醒”作为工作入口,中央搜索框支持导航、提问与指令输入,下方展示当前可执行的任务模组,如自动生成TikTok话术内容、批量管理社媒评论、快速获取创业创意等。左侧为智能体能力中心“智能”,划分为技巧、记忆与知识库三类,用户可以新建技能、记录记忆偏好以及调用知识库 。


整个界面在功能上融合了操作系统、浏览器与任务调度系统的特性,底层通过智能体驱动,前端则提供可视化流程入口,用户可从主界面直接发起任务。

那么,这套系统在实际使用中到底能完成哪些任务?我们用三个完全不同的场景做了测试,来看看Flowith OS的执行力。

体验1:谁在赚钱?让AI盯盘到分秒不差,一键生成AI预测简报

第一个体验任务围绕AI交易项目NoF1.ai展开。该项目在近期社交平台上引发大量讨论,玩法是让六个顶尖大语言模型分别管理1万美元的真实资金,在相同时间周期下进行全自动量化交易。

我们要求Flowith OS以实际市场数据为基础,对各模型的收益率、仓位分布与风险暴露进行实时追踪

Neo在接到指令后,首先连接至NoF1.ai的交易监控界面,并同步六个模型的当日表现


界面中央实时显示收益曲线折线图,从图中可见各模型自10月18日起的收益轨迹走势,DeepSeek与Qwen始终保持领先区间,Grok和Claude居中,GPT-5与Gemini则处于相对低位。

系统自动生成了各模型的策略标签(如“Long”或“Short”),并提取对应的仓位结构,用于计算当日风险敞口与杠杆水平。随后,Neo触发预测阶段任务,系统基于过去一日的收益和仓位数据生成《AI交易预测简报》。简报分为三部分:前一日策略偏差分析、次日趋势预测与模型信心指数。


文档自动输出六个模型的次日交易方向与预测置信度,其中DeepSeek与Grok的信心指数最高,分别为90与85,策略方向均为“多头延续”;Gemini则维持“空头”策略。简报最后部分还生成了策略总结。


在任务执行的全过程中,系统完成了实时数据抓取、模型策略识别与预测结果生成等环节,并输出完整可视化结果。最终生成的简报中,所有模型的收益、方向与置信度信息均以结构化方式呈现,构成了一份量化分析报告。

除了金融数据的追踪分析,我们也试着让Flowith OS走上“牌桌”,看看它面对博弈决策时的及时反应能力。

体验2:AI坐上牌桌,独立完成完整博弈

第二个体验任务围绕一局线上德州扑克展开,我们设定智能体Neo为一名基于博弈论最优策略(GTO)原则进行决策的AI玩家。

用户向Neo发出任务后,系统自动打开目标网站,并进入中等难度局。随后,按顺序识别出游戏UI中的关键信息位,如起始资金、对局位置、按钮区与公共牌区,并开始执行完整对局流程。

在预处理阶段,Neo自动根据自己的起始位置与手牌强度判断是否应跟注、加注或弃牌。


进入翻牌圈后,系统分析了公共牌面构成与对手行为,并结合自己的手牌质量与下注池大小完成操作。

在完整的一轮游戏中,Neo展现了相对完整的操作流程:预判手牌范围、识别对手下注区间、调整下注节奏,并依据实际牌面动态更新策略。在某些回合中,系统也展现出适度的防守性处理——在面临对手大额加注时果断弃牌。


就执行结果而言,整个任务在无需人工介入的情况下完成了网页打开、局面识别、按钮点击与行为执行等流程,系统能实时根据桌面状态更新决策内容,最终完成一整轮博弈操作。

而在更日常、轻量的场景里,比如刷B站、发评论,它也能直接接手操作,不用我们动手点一点。

体验3:AI化身“弹幕发射机”,会看评论,还懂梗

第三个体验任务是在B站发布评论。我们设定Neo的角色为一位熟悉网络语境、具备互动意识的评论者,目标是在热门视频下快速完成评论输入与发送操作。

系统启动后自动跳转至B站首页,并导航至“热门”板块,在播放量与讨论量均较高的视频中进行选择。


进入视频页后,Neo首先识别页面结构,迅速定位到评论区并滑动至底部。在加载完整评论流后,系统自动浏览了当前高赞评论的内容,观察用户围绕哪些关键词展开互动,生成了“UP主更新了,我的青春也复活了!”这一条评论内容,并完成输入与发送。


整个流程从导航入口到评论提交均为自动完成,系统在操作过程中正确处理了评论框加载、页面滚动与多次发送等细节,确保了评论内容可以完整发布,并显示在评论区列表中。


该任务验证了Flowith OS在浏览器页面的交互能力,智能体能够稳定识别Web结构中不同模块的状态变化,并执行任务。

结语:AI Agent开始接管屏幕上的一切

从量化交易分析,到在线博弈,再到社交平台发言,Flowith OS展示出一种不一样的操作方式。它不像传统AI助手那样等待用户输入明确指令,而是将复杂操作流程模块化、记忆化,并在本地完成执行与学习。

随着更多实际场景的接入与长期使用数据的积累,这一智能体层面的操作系统,在未来仍值得持续观察与期待。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
男子疑妻子出轨编理由在酒店调取监控,男子、酒店工作人员均被行政处罚

男子疑妻子出轨编理由在酒店调取监控,男子、酒店工作人员均被行政处罚

红星新闻
2026-01-02 16:41:07
瑞士酒吧起火瞬间画面曝光:女服务员举烟花被男酒保扛肩上,不慎引燃天花板

瑞士酒吧起火瞬间画面曝光:女服务员举烟花被男酒保扛肩上,不慎引燃天花板

环球时报国际
2026-01-02 12:20:21
江苏女子称奶奶去世公司不批假还被逼离职,公司法人回应:“上班摸鱼,害群之马!”

江苏女子称奶奶去世公司不批假还被逼离职,公司法人回应:“上班摸鱼,害群之马!”

潇湘晨报
2026-01-01 18:41:14
当“蔚小理”跌出头部:2026车企淘汰赛全面加速

当“蔚小理”跌出头部:2026车企淘汰赛全面加速

首席商业评论
2026-01-01 12:12:00
超级统治力!韩旭留洋率队7战全胜狂胜156分 升联赛第二逼近榜首

超级统治力!韩旭留洋率队7战全胜狂胜156分 升联赛第二逼近榜首

醉卧浮生
2026-01-02 18:34:41
小卡末节20分细节:上篮时脸被抠出血 爵士竟挑战成功激出战神卡

小卡末节20分细节:上篮时脸被抠出血 爵士竟挑战成功激出战神卡

Emily说个球
2026-01-02 14:43:26
浙江农林大学暨阳学院体育军训部原主任詹崇将逝世,年仅49岁

浙江农林大学暨阳学院体育军训部原主任詹崇将逝世,年仅49岁

澎湃新闻
2026-01-02 13:12:26
江苏四所“臭名远播”高校被人民日报点名,遭批评,学生请避雷

江苏四所“臭名远播”高校被人民日报点名,遭批评,学生请避雷

今日美食分享
2026-01-01 10:27:05
世茂集团成功赖账545亿元

世茂集团成功赖账545亿元

地产微资讯
2026-01-02 10:13:46
迪士尼乐园出意外! 181公斤巨石失控冲向观众员工肉身阻挡倒地

迪士尼乐园出意外! 181公斤巨石失控冲向观众员工肉身阻挡倒地

环球趣闻分享
2026-01-02 16:00:06
今天,港股突然高开,恒生科技大涨近4%,原因是什么?

今天,港股突然高开,恒生科技大涨近4%,原因是什么?

萌生财经
2026-01-02 13:06:39
连续多年财务造假!002055,将被ST!下周一停牌

连续多年财务造假!002055,将被ST!下周一停牌

中国基金报
2026-01-02 11:39:30
高市早苗各种造假、涉及邪教纷纷被曝光,究竟啥情况?

高市早苗各种造假、涉及邪教纷纷被曝光,究竟啥情况?

新民晚报
2026-01-02 09:55:48
台媒:FIBA因政治因素修改中国台北男篮主场;中国男篮主场或放到韩国

台媒:FIBA因政治因素修改中国台北男篮主场;中国男篮主场或放到韩国

懂球帝
2026-01-02 16:11:09
邻居闯入家中打人,女子慌乱中随手抓起菜刀将其砍伤,检方认定正当防卫,47秒监控视频成关键证据

邻居闯入家中打人,女子慌乱中随手抓起菜刀将其砍伤,检方认定正当防卫,47秒监控视频成关键证据

环球网资讯
2026-01-02 10:53:32
茅台巨震,黄牛的噩梦才刚刚开始

茅台巨震,黄牛的噩梦才刚刚开始

首席品牌观察
2026-01-02 14:51:07
特朗普回应健康质疑:手背瘀青只因服用阿司匹林,打瞌睡是在“放松”

特朗普回应健康质疑:手背瘀青只因服用阿司匹林,打瞌睡是在“放松”

上观新闻
2026-01-02 17:10:07
峨眉山全山寺院永久免费开放

峨眉山全山寺院永久免费开放

界面新闻
2026-01-02 10:57:39
单价1800元的机器,男子下单买3台却遭拒发?商家:价标错了,少了个零;法院:买家败诉

单价1800元的机器,男子下单买3台却遭拒发?商家:价标错了,少了个零;法院:买家败诉

大风新闻
2026-01-01 17:13:04
家人阳寿将尽有预兆?黑白无常透露:家中出现这3种征兆,切莫轻视

家人阳寿将尽有预兆?黑白无常透露:家中出现这3种征兆,切莫轻视

古怪奇谈录
2025-12-31 15:04:57
2026-01-02 19:43:00
智东西 incentive-icons
智东西
聚焦智能变革,服务产业升级。
11001文章数 116935关注度
往期回顾 全部

科技要闻

新势力年榜:零跑险胜华为,蔚来小鹏新高

头条要闻

媒体:赖清德叫嚣"中共不敢越雷池" 转头就被狠抽耳光

头条要闻

媒体:赖清德叫嚣"中共不敢越雷池" 转头就被狠抽耳光

体育要闻

英超离谱夜?4战全平3场0-0 曼城红军翻车

娱乐要闻

田亮一家新年全家福!森碟变清纯少女

财经要闻

8200亿扩产潮下的锂电供应链之战

汽车要闻

奇瑞汽车12月销量超23万辆 全年超263万辆

态度原创

教育
艺术
家居
数码
本地

教育要闻

一年级数学思维题,在方框里填上合适的数

艺术要闻

神似章子怡?这个越南模特火了,天生长了一张电影脸啊~

家居要闻

无形有行 自然与灵感诗意

数码要闻

三星发布The Freestyle+便携投影仪 亮度翻倍并加入多项AI功能

本地新闻

即将过去的2025年,对重庆的影响竟然如此深远

无障碍浏览 进入关怀版