网易首页 > 网易号 > 正文 申请入驻

国产模型API接到Codex之后,还能跑通这10个核心玩法

0
分享至


Agent界不能没有Coding Plan和Max x20订阅,就像麻婆豆腐里不能没有豆腐。

中转API确实能省钱,但缓存失效之后9折没了,额度虚标,速率跟不上,上下文被动缩水,这些苦我是一点也不想吃了。Claude的API我现在也没什么招,老被封。GPT Pro现在也不敢断,谁也不知道它会不会哪天也学一下友商,突然来个身份验证。

所以这次我想测一个更具体的,

如果把国内模型API接进Codex App,它到底还能不能撑起一套真实可用的Agent工作流?

刚好,Codex团队最近分享了如何把Codex用到极致的教程。

于是我跟上线两个月,刚刚又上了新模型,之前也没专门测过的阶跃星辰Step Plan一拍即合,做了这次国内Codex玩法合集。


我最先关心两个点。

接了API之后,还能不能用手机端连Codex?锁屏状态下呢?

答案是可以。

Codex最近更新的双击Command键,然后截屏整个屏幕的功能,API模式下还能不能用?

答案也是可以。

这两个点解决了我最担心的事情,API模式不是一个残血版Codex,至少在我这次测试里,它还能保留Codex App关键的入口和交互。

Step Plan这次可以通过配置模型名step-router-v1,根据任务复杂度自动在deepseek-v4-pro和step-3.5-flash之间切换。v4-pro刚还宣布了继续保持2.5折。四舍五入一下,这就有点像DeepSeek也出了一个Coding Plan。

对Coding Plan我的要求其实不高,

能随时买到的,额度别虚标的,Max token别动不动卡到8K的,

上面这些缺点大家可以对号入座一把。。。


PS:deepseek-v4-pro和step-3.5-flash的模型综合能力分,2603是step-3.5-flash的迭代版本


PS:deepseek-v4-pro和step-3.5-flash的价格排名

Step Plan里还塞了一个6B以下的image-edit-2模型,支持文生图和图像编辑。

这个我后面也顺手测了一下。

把API接进Codex

先说最实用的部分。

我给大家做了一个脚本,它会自动引导你完成所有的配置,

./install_stepfun_codex_adapter.sh

这个脚本主要做几件事,

选择订阅类型,比如Plan或者普通订阅,选择对应模型;

检查你的电脑是否已经安装cc-switch和Codex,如果没有,它会帮你装好;

在cc-switch里把Step的API转换成Codex需要的Responses API格式。


完成之后再打开Codex App,如果你在对话框右下角看到StepFun开头,就说明Codex已经从GPT账号登录切换到了API模式。



接上API,Codex的功能还剩多少?

开头我们已经测试了手机调用Codex App以及双击按键屏幕截图的功能。

那下一步我们继续跟着Codex团队的思路,测了最近用得很多的浏览器自动化和电脑自动化。

这次我还故意加了一个坑,

我同时打开了两个不同个人资料的账号,这两个账号上都装了Codex的浏览器插件。

在我的日常使用里,GPT-5.5有时候也会被这个场景迷惑到,不知道我要在哪个账号发X。

从截图里可以看到,一开始step-3.5-flash它确实被虚晃了一枪,后面它发现需要切换到另一个Profile,最后大概探索了3到4轮,完成了推特发布。


Computer Use当然也能做。

我让它在飞书里给我的Hermes发一条消息,问问能不能操作Claude Code的文字信息。

这怎么不算一次性把御三家都用上呢?


这里也顺手把Codex App里的几个入口捋一下,

browser|适合在侧边栏里做网页审查、阅读网页、标记页面,

@chrome|适合那些需要浏览器登录态的工作流,

@computer|适合处理只能在桌面GUI里点来点去的任务。

Step Plan里还带了一个image-edit-2。

来都来了,我在测试API接入Codex之后,在计划模式还能不能正常用的情况下,让他给我开发了一个可以调用这个图像模型的脚本。


我试了一下,让6B以下模型生成一个大小字体的中文图片,难度还是比较高的。

但我更多测试之后发现,拿它来修改图片里的文字,速度很快而且也很少改错。



还有两个我常用到的能力边界也要讲清楚。

在测试过程中,对话时自动压缩上下文的能力是正常生效的。

目前比较明确没有生效的是,因为是API登录,不是账号登录,所以如果你想通过已经登录到这个账号上的设备做连接,比如用MacBook Pro去操作非局域网的Mac mini,就不能直接连,这个时候还是要走SSH。


Codex还有一个我很喜欢的交互就是任务跑一半的时候,可以进行任务干预。

这个干预分成两种。

第一种是引导,

当你发现AI跑偏了,可以直接把它拉回来。比如我发送之后才临时想起来,想在第一个模块里加一些文字特效,就可以直接补进去。

第二种是排队,

它不会打断现在正在运行的任务,而是把新任务排在队伍后面。


这也是顺带测了一下切换到DeepSeek V4 Pro后,模型做出来的网页质量了。

除了上面这些功能测试,Codex团队分享的自动化和目标设定(goal),也是我这次重点想测的地方。

自动化的成功率还是比较高的。在Codex里面,它很多时候是以一个提示语的方式存在。右侧栏可以看到每次运行的成功率和失败率,也可以主动触发。

我这里直接搬了一个AI日报提示语,用之前开发的AI热点伯乐Skill跑了一次。

跟自动化不同,

Goals是为了更长时间的Codex任务准备的。

你给它写一个明确目标之后,AI会在一段时间内持续完成它。

如果你直接打Goal,Codex里没有出现相关选项,可以先在终端里输入:

Enabled feature `goals` in config.toml.

等它起作用之后,重启Codex App,就会看到一个叫设置目标的选项。

这就是我设计的一个目标,让模型开发一个用于AI图片展示的画廊网页。


BTW,目标本身是可以中途修改的。

当Codex能跑更长时间任务之后,我的下一个问题API版本的Codex还能保留记忆吗?

Codex团队在用Codex的时候打开共享记忆,也推荐我们把持久上下文存在Obsidian这样的知识库里。

我自己就是这么做的。

我的Hermes,OpenClaw,Claude Code和CodeX,它们的默认目录就是Obsidian的vault。我会通过Agent.md来约束它们每次读取文件的次数。这样虽然我每次加载消耗的 token 会比直接在空目录上面要多一些,但我能以最快的速度启动我的任务。

这次我让step-3.5-flash帮我查了一下,Obsidian里过去两个月存下来的、跟Codex工作流相关的数据有哪些,它们的路径分别在哪。

测试到这里的时候,我又发现了一个 API 版 Codex 缺失的功能,

Chronicle记忆组件,它能帮Codex从你最近屏幕上发生的事情中提取并构建记忆,但是换成API后,这个功能就关了。


最后又到了大家最关心的价格环节,

Plan能不能长期用,最后还是要回到价格,额度和稳定性。

这次我直接让GPT用绝对精准、不忽悠、把事情拆得明明白白、不焦虑、不踩坑、特别直白、不要绕圈子的方式,给了一版对比。


我的感受是,这类测试Case很适合以后有新模型时继续复用。

因为Codex现在的生态正在从一个编程Agent,逐步切换成一个通用Agent。

你在它上面测功能完整度,提示语适配度,浏览器能力,桌面能力,长期任务和记忆协作,基本能很快看出一个模型到底能不能放到Agent里用。

最后,也回答一下大家问得最多的问题:

我的主力Agent到底是Hermes、Codex,还是Claude Code?

我的选择是,

都要,但分工不同。

Hermes更适合做我的IM入口和长期调度层。

我在手机上配置了快捷键,按一下就能打开飞书,飞书里对接Hermes。它适合长期任务,多群组多会话。所以它很适合做计划,再通过tmux控制Codex或者子Agent派发出去执行。

所以没有必要在它们之间二选一。

买Coding Plan和订阅Max20最大的爽点,

不就是可以尽情尝试不同的Agent,

并保留各自好用的点吗?

就像买手机壳一样。

在预算允许的情况下,

我买它个四五种不同材质换着用,

岂不美滋滋。

@ 作者 / 卡尔

最后,感谢你看到这里如果喜欢这篇文章,不妨顺手给我们点赞|在看|转发|评论

如果想要第一时间收到推送,不妨给我个星标

如果你有更有趣的玩法,欢迎在评论区聊聊

更多的内容正在不断填坑中……


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
北京传来大消息!天价救命药迎来重大突破,很多家庭有救了

北京传来大消息!天价救命药迎来重大突破,很多家庭有救了

王二哥老搞笑
2026-05-30 15:00:47
1950年,毛岸英在作战会上与彭德怀叫板,他的上级紧张到手心冒汗

1950年,毛岸英在作战会上与彭德怀叫板,他的上级紧张到手心冒汗

南书房
2026-05-29 18:40:06
离开北京陈盈骏道别,发声喊话,官宣决定,妻子陪同,合同已到期

离开北京陈盈骏道别,发声喊话,官宣决定,妻子陪同,合同已到期

阿晞体育
2026-05-29 21:52:16
杭州女子征婚:不要彩礼,能提供5分钟夫妻生活,每月给男人3000

杭州女子征婚:不要彩礼,能提供5分钟夫妻生活,每月给男人3000

谭谈社会
2026-05-28 18:34:27
袁立病中公开与辛柏青真实关系,守护他丧妻体面

袁立病中公开与辛柏青真实关系,守护他丧妻体面

TVB的四小花
2026-05-30 00:42:11
日媒:高市正准备对华发动战争?日专家“重兵部署,战场选好了”

日媒:高市正准备对华发动战争?日专家“重兵部署,战场选好了”

二爷台球解说
2026-05-30 12:54:57
主动发声,1换3交易方案出炉!杰伦布朗加盟马刺,史蒂文斯赢麻了

主动发声,1换3交易方案出炉!杰伦布朗加盟马刺,史蒂文斯赢麻了

体育大朋说
2026-05-30 13:30:03
湖北省召开全省领导干部会议 宣布中央关于省委主要负责同志调整决定

湖北省召开全省领导干部会议 宣布中央关于省委主要负责同志调整决定

澎湃新闻
2026-05-30 12:58:07
窦骁妈妈比何超莲妈妈的气质还要好,窦骁养成如此性格是有原因的

窦骁妈妈比何超莲妈妈的气质还要好,窦骁养成如此性格是有原因的

阿废冷眼观察所
2026-05-30 15:37:57
跨省晋升,袁方履新云南省副省长!最新,上海市人大常委会表决通过人事任免事项!

跨省晋升,袁方履新云南省副省长!最新,上海市人大常委会表决通过人事任免事项!

阿离家居
2026-05-30 15:05:41
“都把儿子养雌化了!”初中男孩出现雌化现象,家长却执迷不悟

“都把儿子养雌化了!”初中男孩出现雌化现象,家长却执迷不悟

妍妍教育日记
2026-05-29 07:55:13
曼城、切尔西、大巴黎算豪门吗?绝对不算!他们只配叫做土豪!

曼城、切尔西、大巴黎算豪门吗?绝对不算!他们只配叫做土豪!

郝小小看体育
2026-05-27 09:44:21
比加息更猛!美联储新主席沃什要退3万亿押金,推翻18年旧规?

比加息更猛!美联储新主席沃什要退3万亿押金,推翻18年旧规?

小陆搞笑日常
2026-05-29 19:02:04
66岁安帅暴怒 感觉被耍得团团转 警告内马尔:14天后还有伤就走人

66岁安帅暴怒 感觉被耍得团团转 警告内马尔:14天后还有伤就走人

风过乡
2026-05-30 08:33:24
心理学:永远不要在儿女面前,随口说出这两句话,会毁掉孩子一生

心理学:永远不要在儿女面前,随口说出这两句话,会毁掉孩子一生

心理观察局
2026-05-30 07:08:20
铁了心要灭掉中国?一股可怕力量来了!

铁了心要灭掉中国?一股可怕力量来了!

回京历史梦
2026-05-29 18:33:48
一路走好!离6月仅剩1天,5位名人接连去世,最小42岁,令人唏嘘

一路走好!离6月仅剩1天,5位名人接连去世,最小42岁,令人唏嘘

八斗小先生
2026-05-30 13:58:35
宏远速递!徐杰签新合同,杜锋出席重要活动,朱芳雨深夜发声

宏远速递!徐杰签新合同,杜锋出席重要活动,朱芳雨深夜发声

多特体育说
2026-05-30 11:48:16
5-0、3-2!中超又1保级队提前上岸,泰山队错失名帅

5-0、3-2!中超又1保级队提前上岸,泰山队错失名帅

何老师呀
2026-05-30 09:25:03
小米生态新爆款!米家手持风扇提前售罄:169元买不到了

小米生态新爆款!米家手持风扇提前售罄:169元买不到了

快科技
2026-05-29 10:02:08
2026-05-30 19:35:00
卡尔的AI沃茨 incentive-icons
卡尔的AI沃茨
前大厂算法工程师,3家科技公司技术总监|致力打造最系统的Al学习体系,让1万人通过Al提高生产力
270文章数 137关注度
往期回顾 全部

科技要闻

车圈大佬发声:价格战远去,但竞争仍残酷

头条要闻

伊朗浓缩铀材料将被挖出销毁 特朗普就战事最新表态

头条要闻

伊朗浓缩铀材料将被挖出销毁 特朗普就战事最新表态

体育要闻

岁月不饶人!39岁德约鏖战近5小时拼到呕吐

娱乐要闻

张碧晨《歌手》 “活人微死” 自嘲

财经要闻

双汇管不住一头猪

汽车要闻

900V+3.2秒破百 领克10+&领克10上市16.99万元起

态度原创

家居
亲子
手机
本地
公开课

家居要闻

云栖 舒展如流云

亲子要闻

小锐锐不小心被烫伤了,包扎过程都很配合,懂事得让人心疼

手机要闻

摩托罗拉官宣Edge 70 Pro+手机:天玑8500 Extreme芯片

本地新闻

用剪纸的方式,打开江苏扬州

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版