网易首页 > 网易号 > 正文 申请入驻

Thinking Machines产品更新:K2 Thinking、Qwen3-VL都可以微调

0
分享至



机器之心报道

机器之心编辑部

当前,AI 领域的研究者与开发者在关注 OpenAI、Google 等领先机构最新进展的同时,也将目光投向了由前 OpenAI CTO Mira Murati 创办的 Thinking Machines Lab。

今年早些时候,他们推出了首款产品 Tinker:这是一个 API,用于帮开发者 / 研究人员微调语言模型。你只需要专注于训练数据和算法,而你不擅长的关于 Infra 的部分 —— 调度、调优、资源管理和 Infra 可靠性 —— 统统由 Tinker 来搞定,从而大大简化了 LLM 的后训练过程。

此前,Tinker 仅向研究人员和开发者开放内部测试;而如今,Thinking Machines 宣布正式取消候选名单,所有用户都可以直接使用 Tinker

除此以外,Tinker 还带来了其他三项更新:

首先,更强推理能力:用户现在可以在 Tinker 上对 Kimi K2 Thinking 进行微调。 Kimi K2 拥有万亿参数规模,是 Thinking Machines 目前规模最大的模型,专为长链推理和工具调用场景而设计。

其次,兼容 OpenAI API 的全新推理接口:Tinker 提供了标准的推理接口,例如:



借助本次发布,Tinker 还新增了兼容 OpenAI API 的接口封装,用户只需通过指定模型路径,即可对模型进行快速采样,即使模型仍处于训练过程中也可以使用。

这也意味着,Tinker 现在可以即插即用地接入任何兼容 OpenAI API 的平台。



最后,Qwen3-VL 支持视觉输入。Tinker 新增了两款视觉模型:Qwen3-VL-30B-A3B-Instruct 和 Qwen3-VL-235B-A22B-Instruct。借助这些模型,用户可以在多种应用场景中处理图片、截图以及示意图等视觉内容。



这些视觉输入开箱即用,可直接应用于多种任务场景,包括监督微调和强化学习微调。



Tinker支持的模型

过去,开发者若想训练或微调前沿大模型,必须自行采购 GPU、搭建集群、处理 CUDA/NCCL 环境、维护分布式训练稳定性,门槛极高且成本巨大。

而 Tinker 通过将所有训练基础设施抽象为一个 API,使开发者无需管理任何算力资源,只需准备数据和算法即可训练模型。更重要的是,此次更新首次让普通开发者能够微调万亿参数的 Kimi K2 Thinking,这本来是只有顶级实验室才能掌握的能力,视觉输入的加入进一步降低了 VLM 应用门槛。

对此,研究者纷纷表示:「能够在无需自行管理 GPU 基础设施的情况下训练自定义图文数据,对开发者来说是一项巨大的进步。」



使用 Tinker 训练图像分类模型

为了展示 Tinker 新增的视觉能力,Thinking Machines Lab 对 Qwen3-VL-235B-A22B-Instruct 进行了微调,并将其应用于多项经典图像分类基准测试中。

具体而言,研究团队选择了四个常用的数据集进行评估,包括:

  • Caltech-101:包含 101 类常见物体的数据集
  • Stanford Cars:涵盖汽车品牌、型号和年份的数据集
  • Oxford Flowers:花卉品种数据集
  • Oxford Pets:宠物品种数据集

由于 Qwen3-VL 本质上是语言模型,研究中将图像分类任务建模为文本生成问题:给定一张图片,模型直接输出对应的类别名称。研究人员将这一方法与传统的视觉基线方案 DINOv2 进行了对比。

DINOv2 是一种通过自监督方式训练的视觉 Transformer,常被用作纯计算机视觉任务的 backbone。对于 DINOv2,研究中在其模型之上添加了一个分类头,用于预测所有 N 个类别的概率分布。两种模型均采用 LoRA 方式进行微调。



图中展示了经过微调的 Qwen3-VL-235B-A22B 与 DINOv2 在简单图像分类任务上的性能对比。

在小样本数据场景下,Qwen3-VL-235B-A22B 的表现优于 DINOv2。这不仅是因为其模型规模更大,更重要的是,作为视觉语言模型(VLM),它天然具备语言知识(例如知道「向日葵」指代什么)。正是这种通用的语言与视觉联合能力,使得 Qwen3-VL 在图像分类之外,也能够更方便地迁移到其他视觉任务中。

还没体验的小伙伴,Tinker 绝对值得一试。

https://thinkingmachines.ai/tinker/

https://thinkingmachines.ai/blog/tinker-general-availability/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
被封禁账号仅2月,coco再次曝出猛料,这次谢贤的体面彻底被撕

被封禁账号仅2月,coco再次曝出猛料,这次谢贤的体面彻底被撕

橙星文娱
2026-04-15 11:11:07
上海32岁女子离婚2年求复婚,儿子一句传话让她瞬间崩溃痛哭

上海32岁女子离婚2年求复婚,儿子一句传话让她瞬间崩溃痛哭

捣蛋窝
2026-04-16 15:54:37
逃了?匈牙利外长西雅尔多神秘失踪,已携带涉俄密件前往莫斯科?

逃了?匈牙利外长西雅尔多神秘失踪,已携带涉俄密件前往莫斯科?

小蒋爱唠嗑
2026-04-16 07:58:19
国民党的创始人——不是孙中山,而是宋教仁,宋教仁是谁?

国民党的创始人——不是孙中山,而是宋教仁,宋教仁是谁?

小莜读史
2026-04-14 19:44:08
详解毕福剑事件始未,世间再无“毕姥爷”!

详解毕福剑事件始未,世间再无“毕姥爷”!

好运来好运
2024-07-30 06:39:24
你最接近生理极限的一次经历是什么?网友分享让人目瞪口呆!

你最接近生理极限的一次经历是什么?网友分享让人目瞪口呆!

夜深爱杂谈
2026-04-09 19:39:13
2026 年最稳的 5 个 “铁饭碗” 排名:医生排不上,第一竟然是它

2026 年最稳的 5 个 “铁饭碗” 排名:医生排不上,第一竟然是它

细说职场
2026-04-13 11:14:47
广州增城一小区发生电梯坠梯, 从15层坠至负2层,一业主受伤!不少业主曾多次反映困梯、坠梯问题,但一直没有得到有效解决

广州增城一小区发生电梯坠梯, 从15层坠至负2层,一业主受伤!不少业主曾多次反映困梯、坠梯问题,但一直没有得到有效解决

大风新闻
2026-04-15 22:16:05
文瑾莹鬼门关前走一趟!高EQ:身体变大,心也宽了 9年前险截肢

文瑾莹鬼门关前走一趟!高EQ:身体变大,心也宽了 9年前险截肢

ETtoday星光云
2026-04-16 16:20:10
又一艘现代级改装完毕官宣亮相,改装的更彻底,绝非大号的054A

又一艘现代级改装完毕官宣亮相,改装的更彻底,绝非大号的054A

爱吃醋的猫咪
2026-04-16 20:49:29
哟!两位现役国手合砍5分,这水平提出冲冠?球迷:最多一轮游

哟!两位现役国手合砍5分,这水平提出冲冠?球迷:最多一轮游

南海浪花
2026-04-16 09:07:21
五一不要随便走,3个好消息,2个坏消息,关系到每一个人!

五一不要随便走,3个好消息,2个坏消息,关系到每一个人!

小谈食刻美食
2026-04-16 07:31:22
姚晨崩塌,李大嘴姜超说,《武林外传》里最能装的,其实是姚晨

姚晨崩塌,李大嘴姜超说,《武林外传》里最能装的,其实是姚晨

西楼知趣杂谈
2026-04-15 18:19:25
15岁就成父亲,为养家闯荡NBA,47顺位逆袭成全明星

15岁就成父亲,为养家闯荡NBA,47顺位逆袭成全明星

体坛热评
2026-04-16 14:38:52
孙俪在上海花展被人拍了,就一张侧脸,没开美颜,也没找角度

孙俪在上海花展被人拍了,就一张侧脸,没开美颜,也没找角度

去山野间追风
2026-04-15 12:19:04
日本派兵开始搞大事,人民日报向全球通告日本罪行,北约30国站台

日本派兵开始搞大事,人民日报向全球通告日本罪行,北约30国站台

傲傲讲历史
2026-04-13 23:21:05
法媒感叹:你封我,我就自己造,整个中国都在以这样的精神前行

法媒感叹:你封我,我就自己造,整个中国都在以这样的精神前行

夏末的晨溪
2026-04-15 04:31:20
直到许家印当庭认罪悔罪,才发现,原来曹德旺早就猜中了他的结局

直到许家印当庭认罪悔罪,才发现,原来曹德旺早就猜中了他的结局

以茶带书
2026-04-15 23:00:50
上海一民营医院骗取医保基金300多万,32人被抓

上海一民营医院骗取医保基金300多万,32人被抓

上观新闻
2026-04-16 13:14:05
阿媒列马斯切拉诺辞职原因:不满体育总监,不赞成德保罗加盟

阿媒列马斯切拉诺辞职原因:不满体育总监,不赞成德保罗加盟

懂球帝
2026-04-16 10:35:14
2026-04-17 07:15:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12780文章数 142631关注度
往期回顾 全部

科技要闻

赵明:智驾之战,看谁在大模型上更高效

头条要闻

特朗普:伊朗已同意几乎所有要求

头条要闻

特朗普:伊朗已同意几乎所有要求

体育要闻

皇马拜仁踢出名局,但最抢镜的还是他

娱乐要闻

丝芭传媒创始人王子杰去世,享年63岁

财经要闻

海尔与医美女王互撕 换血抗衰谁的生意?

汽车要闻

空间大五个乘客都满意?体验岚图泰山X8

态度原创

手机
旅游
艺术
房产
军事航空

手机要闻

OPPO Find X10:8000mAh超大电池+双2亿影像,中屏机皇实锤!

旅游要闻

社评:读懂“China Travel”持续圈粉的逻辑

艺术要闻

这 4 个红底黑字,藏着毛主席给一位普通母亲的最高赞誉,看完泪目

房产要闻

人人人人!封关后首届消博会,挤爆了!

军事要闻

封锁霍尔木兹海峡后 美释放双重信号

无障碍浏览 进入关怀版