Google的Gemini系列模型向来是性价比之选,但流量一上来,账单数字跳得比心率还快。现在有个叫Puter.js的方案,把成本转嫁给了终端用户——开发者零门槛接入,用户自己买单。
核心逻辑很简单:以前是你申请Google API密钥、绑信用卡、盯配额、防泄露;现在是用户登录Puter账号,花自己的积分。新账号有初始额度,用完自己充。
![]()
支持的模型覆盖Gemini 2.5 Pro、2.5 Flash、2.5 Flash Lite、2.0 Flash、2.0 Flash Lite、3 Flash Preview,以及Gemma 2/3/4系列(4B到31B多个尺寸)。功能上支持流式输出、视觉输入、温度调节、多轮对话,全在浏览器里跑。
![]()
接入只需要一行CDN脚本:,然后调puter.ai.chat()。没有后端、没有环境变量、没有密钥轮换。适合静态页面、Demo、黑客松项目、浏览器插件这类场景。
但别搞错场景——Puter.js只认浏览器里的用户会话。Cron任务、批处理、Webhook、后端服务这些,老老实实走官方Gemini API。
选型建议:默认上2.5 Flash;Prompt复杂或需要深度推理时切2.5 Pro;要速度、要便宜、要跑量,选2.5 Flash Lite。
![]()
一个最小可运行的HTML长这样:引入脚本,写几句JavaScript调API,打开浏览器,Puter自动处理登录流和模型调用。终端用户第一次用时会走Puter的授权流程,之后按用量扣自己的积分。
对开发者来说,这意味着可以把AI能力塞进任何能跑浏览器的地方,而不用担心凌晨三点收到Google Cloud的账单告警。代价是用户端需要Puter账号——对于面向消费者的工具,这是把双刃剑:降低了你的接入成本,但提高了用户的使用门槛。
技术实现上,Puter.js把LLM调用从"开发者持有密钥并付费"翻转成了"用户持有账户并自费"。这不是免费午餐,是转移支付。能不能跑通,取决于你的产品形态是否允许把成本透明转嫁给终端用户。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.