网易首页 > 网易号 > 正文 申请入驻

爆炒小龙虾——低成本实战之三:接入Nvidia免费模型

0
分享至

Token耗尽/429错误之痛

OpenClaw 支持多种免费/低成本模型来源,但glm-5实践下来,模型token动不动耗尽,限额较小,不顶用。



财大气粗的nvidia通过同一套api key提供多个模型,免费额度据说是40次调用/分钟,看起来配置更简便,额度也更友好。忽略来源多样的免费/低成本模型,此番先考虑介入nvidia提供的模型,看看效果再说。

nvidia端提供免费无限模型额度



Nvidia可用免费模型清单

模型 ID

厂商

特点

上下文长度

z-ai/glm5

智谱 AI

国产顶级,综合能力强

128K

moonshotai/kimi-k2.5

月之暗面

长文本专家

256K

stepfun-ai/step-3.5-flash

阶跃星辰

极速响应

32K

minimaxai/minimax-m2.1

MiniMax

多模态支持

100K

deepseek-ai/deepseek-v3

DeepSeek

推理能力突出

64K

Meta/llama-3.3-70b-instruct

Meta

开源最强

128K

mistralai/mistral-large

Mistral

欧洲最强

128K

qwen/qwen2.5-72b-instruct

阿里巴巴

代码能力强

128K

google/gemma-3-27b-it

Google

轻量高效

128K

nvidia/llama-3.1-nemotron-70b-instruct

NVIDIA

优化版 Llama

128K

响应速度排序(实测数据)

优先级

模型

首 Token 延迟

适用场景

1

Step-3.5 Flash

< 1秒

极速响应,简单任务

2

GLM-5

1-2秒

综合能力强,Agent首选

3

MiniMax M2.1

1-2秒

多语言编程,长文本

4

DeepSeek V3

2-3秒

复杂推理,代码生成

5

Kimi K2.5

2-4秒

超长文本(256K)

6

Llama 3.3 70B

1-2秒

通用任务,稳定可靠

7

Mistral Large

1-2秒

欧洲语言,逻辑推理

8

Qwen2.5 72B

1-2秒

中文优化,代码能力

9

Gemma 3 27B

< 1秒

轻量级,资源敏感

10

Nemotron 70B

1-2秒

NVIDIA 优化版 Llama

nvidia端 api 可以获取

nvidia账号创建成功后,可以点击models,浏览NVIDIA提供的模型。这些模型的api key都是同一个,即nvidia下的api key:



点击感兴趣的模型,比如mini max m2.1,弹出框点击“Acknowledge & Continue”按钮后,出现以下界面:



点击右上角 View Code,弹出以下界面,点击右上角Generate API Key:



生成API Key以后,就可以拷贝、使用啦:



配置参数:

API Provider:OpenAI Compatible

Base URL:https://integrate.api.nvidia.com/v1

API key:上面生成的api_key

Model ID:z-ai/glm5 ; minimaxai/minimax-m2.1 ……

实际使用起来可能感觉反应不够敏捷,有点卡顿,可能是用的人多,也坑能是官方有限流限速。

不过,免费,已经很香了,不是吗?还要啥自行车?可以了。

唯一的限制是:40请求/min。基本够用了。

Openclaw侧配置

OpenClaw 原生支持通过 fallbacks(故障转移) 配置实现多模型自动切换。当主模型因 Token 耗尽、速率限制(429)或 API 故障时,系统可自动按顺序切换到备用模型。按照官方指南配置Openclaw.json即可。

配置注意点
NVIDIA NIM 的模型 ID 格式为 厂商/模型名,在 OpenClaw 中引用时需加上 provider 前缀:

  • 配置中 id: z-ai/glm5
  • 引用时: nvidia-nim/z-ai/glm5

如果单账户额度不足,理论上可配置 多个 NVIDIA Auth Profile,突破限额

验证配置及切换状态实时监控

重启 OpenClaw Gateway:

openclaw gateway restart

检查当前模型状态:

/model status

测试故障转移(手动触发):

# 查看当前使用的模型/usage full

查看当前模型和 Token 成本 :

/usage cost        # 查看成本统计
实测情况

配置完后,让它继续先前它自主规划的通过闲鱼发布任务揽客挣钱的项目。反应很迟缓,有时候我几乎怀疑它已经罢工。但各种手段检查,又好像并没有dead。让它做下自检:





15:40做自动切换是否配置到位监测,15:50都没动静,追问了一下:



第二轮又把模型提供商列了一遍:



自动切换按道理我是已经配到位的,但它检测结果是尚未支持。

配置文件已经做了备份,既然它说不对,让它修复下:



然后,5分钟过去,尚无动静。



从前面的对话时间戳也可看出来,反应非常慢。

如果是要有人监督、配合,基本不可用,太慢了,等不起。

如果是它真的完全自主自己24小时不停歇干活的话,慢不慢倒没那么紧要了。

这树懒一般的存在,自动fallback也不是而不关键,懒得等了。

试试让它做点其他的、比闲鱼发布更轻量一点的事看看。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
揭秘朝鲜金正恩早些年的日常生活:手机、香烟、饮料和饮食习惯!

揭秘朝鲜金正恩早些年的日常生活:手机、香烟、饮料和饮食习惯!

混沌录
2025-11-08 16:36:03
一越南老兵死扛三天不降,41军一炮送他归西,一查证件:官真不小

一越南老兵死扛三天不降,41军一炮送他归西,一查证件:官真不小

雍亲王府
2026-02-16 13:15:05
马斯克空降中国,不是为了造车!他盯上一个比芯片更致命的资源

马斯克空降中国,不是为了造车!他盯上一个比芯片更致命的资源

米师傅安装
2026-02-17 20:56:23
又被逆转!杜兰特空砍21+6,伦纳德27+12杀疯,乌度卡你该下课了

又被逆转!杜兰特空砍21+6,伦纳德27+12杀疯,乌度卡你该下课了

巴叔GO聊体育
2026-02-18 10:48:06
你见过哪些因为“作死”,亲手毁掉婚姻的人?网友:结局大快人心

你见过哪些因为“作死”,亲手毁掉婚姻的人?网友:结局大快人心

夜深爱杂谈
2026-02-04 23:37:05
日本高市早苗内阁集体辞职

日本高市早苗内阁集体辞职

每日经济新闻
2026-02-18 09:28:16
“一代鞋王”达芙妮没落,家族内斗中亏40亿,最后败给了红颜祸水

“一代鞋王”达芙妮没落,家族内斗中亏40亿,最后败给了红颜祸水

小熊侃史
2025-12-28 11:02:11
79年对越战争许世友为何对邓小平不满?回国当天没人敢去机场迎接

79年对越战争许世友为何对邓小平不满?回国当天没人敢去机场迎接

历史龙元阁
2026-02-16 12:50:06
研究称悉尼妹频遭女性抹黑 是因为胸太大了!

研究称悉尼妹频遭女性抹黑 是因为胸太大了!

3DM游戏
2026-02-18 07:54:05
“武”动新春!外媒惊叹中国人形机器人技术突破

“武”动新春!外媒惊叹中国人形机器人技术突破

看看新闻Knews
2026-02-17 12:52:15
你有知道哪些炸裂的秘密?网友:我有个秘密说出来肯定大家要笑死

你有知道哪些炸裂的秘密?网友:我有个秘密说出来肯定大家要笑死

带你感受人间冷暖
2026-01-29 00:10:05
谭松韵华汉豪门隐婚生子瓜?时间线全曝光!多年零绯闻全是障眼法

谭松韵华汉豪门隐婚生子瓜?时间线全曝光!多年零绯闻全是障眼法

八卦王者
2026-02-18 11:46:51
高市早苗手舞足蹈公布“天大喜讯”,英媒秒懂:中国的阳谋奏效了

高市早苗手舞足蹈公布“天大喜讯”,英媒秒懂:中国的阳谋奏效了

东极妙严
2026-02-18 12:53:10
美伊谈判实质不是表面消息,而是能源矿产份额和驻军及开放

美伊谈判实质不是表面消息,而是能源矿产份额和驻军及开放

邵旭峰域
2026-02-18 11:29:51
42岁的王冠嫁给了企业家,住800平的别墅,穿188元的拖鞋

42岁的王冠嫁给了企业家,住800平的别墅,穿188元的拖鞋

潘蠸旅行浪子
2026-01-27 17:15:38
我国最危险的时代,美国随时能开战,是这个小国“帮了”中国

我国最危险的时代,美国随时能开战,是这个小国“帮了”中国

混沌录
2026-02-08 13:18:24
电动车跑高速费电,装个变速箱不就行了?99%车企不敢,两家试过

电动车跑高速费电,装个变速箱不就行了?99%车企不敢,两家试过

小李车评李建红
2026-02-16 09:00:03
iOS 26.3 安装后必做的 6 大任务

iOS 26.3 安装后必做的 6 大任务

小柱解说游戏
2026-02-18 08:11:01
警备区、卫戍区、守备区三者有何区别?它们分别属于什么级别?

警备区、卫戍区、守备区三者有何区别?它们分别属于什么级别?

风信子的花
2026-02-17 09:43:22
王菲化妆师再次发文,回应造型翻车:不要问,问就是AI

王菲化妆师再次发文,回应造型翻车:不要问,问就是AI

韩小娱
2026-02-18 07:59:50
2026-02-18 15:04:49
我不叫阿哏
我不叫阿哏
分享有趣、有用的故事!
309文章数 6397关注度
往期回顾 全部

科技要闻

怒烧45亿,腾讯字节阿里决战春节

头条要闻

媒体:中日在慕尼黑交锋后 新加坡总理"转向"

头条要闻

媒体:中日在慕尼黑交锋后 新加坡总理"转向"

体育要闻

维尼修斯进球后罢赛 向穆帅投诉对手歧视

娱乐要闻

6大卫视春晚收视出炉 北京台稳居第一

财经要闻

面条火腿香菇酱!上市公司这些年请你吃

汽车要闻

量产甲醇插混 吉利银河星耀6甲醇插混版申报图

态度原创

家居
时尚
教育
公开课
军事航空

家居要闻

中古雅韵 乐韵伴日常

50+女性秋冬穿搭指南,4个让年龄法则成为加分项,越穿越优雅

教育要闻

“新校长”应有的模样

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

菲海警在南海投放不明物体 被中国海警全程监控并拍下

无障碍浏览 进入关怀版