网易首页 > 网易号 > 正文 申请入驻

近期思考汇编:Mythos模型、Hermes、以及Harness Engineering

0
分享至

作者 | 费斌杰 北京市青联委员 熵简科技CEO

本文作为我的日常思考汇编,总结一下最近AI领域值得关注的最新进展,内容会比较精炼。

(1)Anthropic Mythos:从“竞速发布”到“能力管控”

2026年4月7日,Anthropic 正式对外披露旗下最新前沿大模型 Claude Mythos Preview,并同步宣布启动网络安全合作计划 Project Glasswing。

这是 Anthropic 迄今发布的能力最强的模型,也是全球 AI 行业首个因能力"过于强大"而主动限制公开发布的模型。

Mythos 并非 Opus 的线性升级,而是架构与参数量的跨代跃升,在多项高难度评测上相比 Opus 4.6 实现了显著突破,呈现出能力断层。


尤其值得关注的是,Mythos大模型在网络安全领域表现出令人惊讶的破坏力,其 能力已从"漏洞发现"延伸至"漏洞利用→攻击链构造"的完整闭环,展现出接近自主化的攻击能力,远超多数顶尖人类安全专家。

自 2026 年 2 月 24 日开始内部测试以来,Mythos已在主流操作系统、浏览器及企业软件中已自主发现数千个零日漏洞,如果加以利用,将对企业信息安全造成重大危害。


因此,Anthropic 明确将 Mythos "锁进受控场景",而非向公众开放。Project Glasswing 已向 12 家核心合作方与 40 余家关键基础设施组织授予预发布访问权,授权合作方使用 Mythos 扫描并加固自身系统漏洞,以防御未来潜在的 Mythos 级攻击。

但市场显然对Anthropic的说法并不买单。

这次Mythos模型的发布可能标志着 AI 行业从"竞速发布"时代进入了"能力管控"时代,未来普通人未必有资格使用SOTA模型,这会带来三个潜在问题:

1)如果"受控发布"成为常态,谁来决定谁能获得访问权? 这个权力目前完全由 Anthropic 单方面掌握,没有任何外部制衡

2)学术界和中小企业可能被系统性排斥在前沿能力之外,加剧 AI 领域的集中化

3)地缘政治层面,本次Mythos大模型的合作方清单几乎全是美国企业——这会加速其他国家自主研发前沿模型的紧迫感,加剧全球军备竞赛。


除此之外,Mythos模型的发布还有一个重要意义:有力反驳了"Scaling Law触顶"的叙事

下面这张图最近在AI圈疯传,我给大家解读一下。


纵轴ECI(Epoch Capabilities Index) 是一个对模型能力进行综合评分的指数,将多个异构 Benchmark 的得分归一化为一个可比较的统一标度,用以衡量前沿模型在不同时间点的"综合智力水平"。

模型按发布时间从左到右排列:Claude 3 Opus → 3.5 Sonnet → 3.7 Sonnet → Opus 4 → Sonnet 4.5 → Opus 4.5 → Opus 4.6 → Mythos Preview

Benchmark 则从早期的 GPQA Diamond、AIME 2025,扩展到最新的 MLE-Bench、GSO-Bench,反映评测体系本身也在不断升级以追踪更强的模型。

这张图传递出来的核心思想是:Anthropic 模型的能力增长正在加速而非放缓,Mythos 是这条加速曲线上最新、最远的一个点,其跃升幅度超出了此前任何一代模型间的进步。

这与前些日子Dario在访谈中对于AI指数级发展(Radical Acceleration)的论断不谋而合。


Mythos模型的system-card全文在这里,感兴趣的朋友可以详细阅读:https://www-cdn.anthropic.com/08ab9158070959f88f296514c21b7facce6f52bc.pdf

(2)从OpenClaw到Hermes:An agent that grows with you

Hermes Agent 是由 Nous Research于近期推出的开源 AI 智能体框架,核心定位是"自进化 Agent",项目在 GitHub 上迅速获得超过 4 万星,引发广泛关注。


把Hermes掰开揉碎了,它的核心创新在于内置了一套“复盘->提炼->沉淀”的学习循环,每次任务执行完成后自动启动,无需人工干预

与此同时, 当 Agent 调用某个 Skill 发现其已过时、不完整或有错误时,会主动进行修复,采用精准的 patch + find-and-replace 方式,只修改需要变更的片段,而非重写整个文档。


听过我3月初第一次培训课程的朋友,应该对“self-improving-agent”有印象。当时我给大家分享了两个优秀的Skill,其中之一就是在ClawHub上狂揽3.1k星的self-improving-agent,它的核心思想就是引入自我学习机制,以md格式文件存储每一次学到的改进知识,避免以后再犯类似的错误。


这次Hermes将这个重要能力内化到了自身的框架中,是一次相当有趣的尝试。但我们还是得清醒的认识到,这只是一次微创新,如果要真的大幅提升Agent执行能力,不能只琢磨Skill层,还得在CLI层下功夫。当然这就是另一个大的话题了,先按下不表。


(3)Harness Engineering:Humans steer, Agents execute.

Harness Engineering中文名为“驾驭工程”,源自 OpenAI 2026 年 2 月发布的一篇文章,介绍了他们团队尝试100%用Codex构建一个软件产品的过程中,形成的对于人机交互范式的思考。

Harness Engineering的核心要点归根到底就一句话:人类负责驾驭方向,智能体负责执行

我非常认同这个观点,与我们熵简科技最近几个月的实践经验高度一致。


随着AI能力越来越强,人类将不可避免的成为工作流中效率最低的那一环。为了提高效率,人类的职能应该从“做好具体工作”,转变为“搭好脚手架”

以工程师为例,他们的核心工作不再是写代码,而应该是设计环境、明确意图、构建反馈回路,让 AI 智能体可靠地完成工作。


但是如果完全由AI跑闭环流程,不可避免会出现不断“熵增”直到系统瘫痪的问题。

还是以工程师举例,OpenAI发现如果不定期进行手动清扫,Codex会不断在代码库中积累“AI残渣”,并随着时间的累积,最终导致任务漂移。


为了对抗智能体的熵增难题,Harness Engineering给出的解法是:把人类"品味"编码进系统。

人类的审美偏好是对抗系统熵增的利器,可以将其转化为为操作文档、linter 规则或工具,从定期运行运行"清扫型"智能体任务,自动扫描并修复代码中的坏模式,实现熵减。

(4)AlphaClaw培训课程,「驯龙(虾)高手计划」第四讲预告

4月2日,我们举办了第三次 AlphaClaw 培训课程,并正式启动驯龙(虾)高手计划——每期分享3-5个投研实战案例,帮助专业投资者掌握金融小龙虾的最新玩法,成为在指数级变革中最早吃到红利的人。

错过了前三期培训课程的朋友,可以戳以下视频链接,需要拥有AlphaEngine账号才可以回看。

AlphaClaw投研小龙虾第一讲视频回放

http://alphaengine.top/share/#/share/research-insight?shareLink=GCKeVfKiGEOI5wlu8Jwg&id=290001786389260

案例1:投资大师思维复刻,让巴菲特帮你选股

案例2:财报季风格化批量点评

案例3:投研PPT制作与二次编辑

AlphaClaw投研小龙虾第二讲视频回放

https://www.alphaengine.top/#/share/summary?link=aBIT9Zs5Z2YMe1yizcKl

案例4:缠论选股策略构建

案例5:结合本地敏感数据撰写上会报告

案例6:有道云笔记批量导出到本地

AlphaClaw投研小龙虾第三讲视频回放

http://alphaengine.top/share/#/share/research-insight?shareLink=8D2Hc0c5dZAzIhgAt0bw&id=290001787316680

案例7: 定制投资日报生成

案例8: 从持仓数据刻画基金经理投资逻辑

案例9: 公司/行业投资框架一键生成

如何系统掌握 AI 投研工具的实战打法?

如何建设投研工作台,成为指数级变革中最早吃到红利的人?

熵简科技CEOAlphaEngine主理人费斌杰讲在本周三(4月15日)晚7:30,进行主题分享,欢迎感兴趣的投研专业人士参加。

AlphaClaw功能搭载于AlphaEngine桌面端,下载地址: https://www.alphaengine.top

AlphaEngine APP下载地址:

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
女员工嘲讽顾客“穷逛”后续:本人火到香港已社死,商场也被坑惨

女员工嘲讽顾客“穷逛”后续:本人火到香港已社死,商场也被坑惨

哄动一时啊
2026-06-01 19:30:38
在与俄领导人会面后,俄罗斯寡头们“自愿”为战争捐款2200亿卢布

在与俄领导人会面后,俄罗斯寡头们“自愿”为战争捐款2200亿卢布

山河路口
2026-06-02 14:04:22
5月29日新华社一份数据曝光,开2吨以上新能源车的车主集体失眠

5月29日新华社一份数据曝光,开2吨以上新能源车的车主集体失眠

音乐时光的娱乐
2026-05-31 12:26:42
“爸妈,我开辅助驾驶,你们放心”:一家三口全死了,智驾1分钟

“爸妈,我开辅助驾驶,你们放心”:一家三口全死了,智驾1分钟

江山挥笔
2026-06-02 18:47:02
荷兰没料到,闯中国领空这事没完,中方当各国面,让荷兰下不来台

荷兰没料到,闯中国领空这事没完,中方当各国面,让荷兰下不来台

共工之锚
2026-06-01 13:17:56
唐山货车司机大热天捎七旬老人40公里,临下车老人突然变脸讹钱

唐山货车司机大热天捎七旬老人40公里,临下车老人突然变脸讹钱

听心堂
2026-06-02 12:03:05
22岁身价1.4亿欧,世一腰横空出世!手握2座欧冠,曼联苦笑

22岁身价1.4亿欧,世一腰横空出世!手握2座欧冠,曼联苦笑

万花筒体育球球
2026-06-02 20:20:00
北大医学生司力嘉去世,年仅24岁,父亲透露原因,就差毕业典礼了

北大医学生司力嘉去世,年仅24岁,父亲透露原因,就差毕业典礼了

社会日日鲜
2026-06-02 13:53:45
宇树科技IPO通过,研发占比低得吓人!原来是靠社区Build?

宇树科技IPO通过,研发占比低得吓人!原来是靠社区Build?

小星球探索
2026-06-02 13:56:15
血压飙升!上海父亲晒聊天记录,“巨婴”儿子强行索要2万旅游费

血压飙升!上海父亲晒聊天记录,“巨婴”儿子强行索要2万旅游费

火山詩话
2026-06-02 14:27:07
银行储户从乡下骑车1小时到县城 ,持身份证提升限额被要求出示户口簿,银行:系内部规定

银行储户从乡下骑车1小时到县城 ,持身份证提升限额被要求出示户口簿,银行:系内部规定

澎湃新闻
2026-06-02 14:59:38
23岁摩洛哥王储拒绝“吻手礼”再出圈,几名男子试图亲吻其右手被拒

23岁摩洛哥王储拒绝“吻手礼”再出圈,几名男子试图亲吻其右手被拒

极目新闻
2026-06-02 19:49:03
伦敦世乒赛夺冠后,王皓宣布:王楚钦为国乒男队队长,梁靖崑为副队长

伦敦世乒赛夺冠后,王皓宣布:王楚钦为国乒男队队长,梁靖崑为副队长

环球网资讯
2026-06-02 14:32:33
7年来首次!上海气象预警重要调整→

7年来首次!上海气象预警重要调整→

上观新闻
2026-06-01 22:04:28
白俄罗斯总统:金正恩不是也不可能是独裁者

白俄罗斯总统:金正恩不是也不可能是独裁者

俄罗斯卫星通讯社
2026-06-02 15:11:02
浙江广厦主帅:G4无论结果如何都要拼到最后一刻

浙江广厦主帅:G4无论结果如何都要拼到最后一刻

北青网-北京青年报
2026-06-02 13:50:14
2亿和解费?她是遇上杀猪盘了吧!

2亿和解费?她是遇上杀猪盘了吧!

BenSir本色说
2026-05-31 22:05:15
谌旭彬:百姓躺平摆烂,食税群体怎么办?

谌旭彬:百姓躺平摆烂,食税群体怎么办?

老郭在学习
2026-06-01 17:12:48
12国掀桌子,全面限制原矿出口,中企没有退路,只剩一条路可以走

12国掀桌子,全面限制原矿出口,中企没有退路,只剩一条路可以走

影孖看世界
2026-06-01 23:20:57
口交、肛交等进入式性服务是卖淫行为吗?最高院定调了!

口交、肛交等进入式性服务是卖淫行为吗?最高院定调了!

黯泉
2026-06-02 11:54:54
2026-06-02 21:32:49
AlphaEngineer incentive-icons
AlphaEngineer
费同学的赛博书屋,分享关于科技、投资的最新观点
67文章数 7关注度
往期回顾 全部

科技要闻

烧掉千亿后,美团、阿里、京东谁先止血?

头条要闻

菲防长称中方未展现长期诚意 外交部:完全没感恩之心

头条要闻

菲防长称中方未展现长期诚意 外交部:完全没感恩之心

体育要闻

1米74的业余联赛替补,在英超踢中卫

娱乐要闻

奚梦瑶何猷君补办婚礼超幸福

财经要闻

智元和宇树的“暗战”愈演愈烈

汽车要闻

星途神秘新车轮廓曝光 又一款性能SUV要来了?

态度原创

房产
亲子
本地
艺术
军事航空

房产要闻

5200巨量投资曝光!未来五年,海南格局大变!

亲子要闻

六一平安出院,恰逢科室节日活动,欣欣尽兴玩耍

本地新闻

用剪纸的方式,打开江苏扬州

艺术要闻

周杰伦花 1.36 亿拍下这幅画

军事要闻

伊朗媒体新发布最高领袖照片

无障碍浏览 进入关怀版