网易首页 > 网易号 > 正文 申请入驻

Thinking Machines产品更新:K2 Thinking、Qwen3-VL都可以微调

0
分享至



机器之心报道

机器之心编辑部

当前,AI 领域的研究者与开发者在关注 OpenAI、Google 等领先机构最新进展的同时,也将目光投向了由前 OpenAI CTO Mira Murati 创办的 Thinking Machines Lab。

今年早些时候,他们推出了首款产品 Tinker:这是一个 API,用于帮开发者 / 研究人员微调语言模型。你只需要专注于训练数据和算法,而你不擅长的关于 Infra 的部分 —— 调度、调优、资源管理和 Infra 可靠性 —— 统统由 Tinker 来搞定,从而大大简化了 LLM 的后训练过程。

此前,Tinker 仅向研究人员和开发者开放内部测试;而如今,Thinking Machines 宣布正式取消候选名单,所有用户都可以直接使用 Tinker

除此以外,Tinker 还带来了其他三项更新:

首先,更强推理能力:用户现在可以在 Tinker 上对 Kimi K2 Thinking 进行微调。 Kimi K2 拥有万亿参数规模,是 Thinking Machines 目前规模最大的模型,专为长链推理和工具调用场景而设计。

其次,兼容 OpenAI API 的全新推理接口:Tinker 提供了标准的推理接口,例如:



借助本次发布,Tinker 还新增了兼容 OpenAI API 的接口封装,用户只需通过指定模型路径,即可对模型进行快速采样,即使模型仍处于训练过程中也可以使用。

这也意味着,Tinker 现在可以即插即用地接入任何兼容 OpenAI API 的平台。



最后,Qwen3-VL 支持视觉输入。Tinker 新增了两款视觉模型:Qwen3-VL-30B-A3B-Instruct 和 Qwen3-VL-235B-A22B-Instruct。借助这些模型,用户可以在多种应用场景中处理图片、截图以及示意图等视觉内容。



这些视觉输入开箱即用,可直接应用于多种任务场景,包括监督微调和强化学习微调。



Tinker支持的模型

过去,开发者若想训练或微调前沿大模型,必须自行采购 GPU、搭建集群、处理 CUDA/NCCL 环境、维护分布式训练稳定性,门槛极高且成本巨大。

而 Tinker 通过将所有训练基础设施抽象为一个 API,使开发者无需管理任何算力资源,只需准备数据和算法即可训练模型。更重要的是,此次更新首次让普通开发者能够微调万亿参数的 Kimi K2 Thinking,这本来是只有顶级实验室才能掌握的能力,视觉输入的加入进一步降低了 VLM 应用门槛。

对此,研究者纷纷表示:「能够在无需自行管理 GPU 基础设施的情况下训练自定义图文数据,对开发者来说是一项巨大的进步。」



使用 Tinker 训练图像分类模型

为了展示 Tinker 新增的视觉能力,Thinking Machines Lab 对 Qwen3-VL-235B-A22B-Instruct 进行了微调,并将其应用于多项经典图像分类基准测试中。

具体而言,研究团队选择了四个常用的数据集进行评估,包括:

  • Caltech-101:包含 101 类常见物体的数据集
  • Stanford Cars:涵盖汽车品牌、型号和年份的数据集
  • Oxford Flowers:花卉品种数据集
  • Oxford Pets:宠物品种数据集

由于 Qwen3-VL 本质上是语言模型,研究中将图像分类任务建模为文本生成问题:给定一张图片,模型直接输出对应的类别名称。研究人员将这一方法与传统的视觉基线方案 DINOv2 进行了对比。

DINOv2 是一种通过自监督方式训练的视觉 Transformer,常被用作纯计算机视觉任务的 backbone。对于 DINOv2,研究中在其模型之上添加了一个分类头,用于预测所有 N 个类别的概率分布。两种模型均采用 LoRA 方式进行微调。



图中展示了经过微调的 Qwen3-VL-235B-A22B 与 DINOv2 在简单图像分类任务上的性能对比。

在小样本数据场景下,Qwen3-VL-235B-A22B 的表现优于 DINOv2。这不仅是因为其模型规模更大,更重要的是,作为视觉语言模型(VLM),它天然具备语言知识(例如知道「向日葵」指代什么)。正是这种通用的语言与视觉联合能力,使得 Qwen3-VL 在图像分类之外,也能够更方便地迁移到其他视觉任务中。

还没体验的小伙伴,Tinker 绝对值得一试。

https://thinkingmachines.ai/tinker/

https://thinkingmachines.ai/blog/tinker-general-availability/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
日韩股市均创新高 日经225指数首次突破6万点大关

日韩股市均创新高 日经225指数首次突破6万点大关

财联社
2026-04-23 08:14:21
被打女司机耳膜穿孔,警方已经立案,保安恐承担刑责

被打女司机耳膜穿孔,警方已经立案,保安恐承担刑责

映射生活的身影
2026-04-22 21:55:22
英国议会通过法案,2008年后出生者终身不得购烟

英国议会通过法案,2008年后出生者终身不得购烟

澎湃新闻
2026-04-22 14:53:04
伊朗代表团如约参加三亚亚沙会,共有61名运动员报名参赛,在入场仪式环节全员将右手放在胸前

伊朗代表团如约参加三亚亚沙会,共有61名运动员报名参赛,在入场仪式环节全员将右手放在胸前

鲁中晨报
2026-04-23 09:00:07
上海德云社换明星阵容也不火,上座率不高,观众评价更不好

上海德云社换明星阵容也不火,上座率不高,观众评价更不好

我就是个码字的
2026-04-23 07:30:03
杨乐乐后悔全职带娃落泪,在婚姻中不快乐,汪涵:为什么要和我比

杨乐乐后悔全职带娃落泪,在婚姻中不快乐,汪涵:为什么要和我比

八斗小先生
2026-04-23 10:25:23
马科斯火烧眉毛了,三番五次催促中国帮帮忙,中方官媒回了四个字

马科斯火烧眉毛了,三番五次催促中国帮帮忙,中方官媒回了四个字

近史博览
2026-04-23 10:47:01
狄龙:季后赛应该像乔丹、詹姆斯一样强硬,亚历山大有点脆弱

狄龙:季后赛应该像乔丹、詹姆斯一样强硬,亚历山大有点脆弱

懂球帝
2026-04-23 13:41:07
以色列网友疑问:犹太人若迁至中国,能否掌控这片土地?法国网友回应引发热议

以色列网友疑问:犹太人若迁至中国,能否掌控这片土地?法国网友回应引发热议

苗苗情感说
2026-04-22 09:13:00
中国驻美大使谢锋:中国大蒜做梦也没想到,有朝一日会被列为“国家安全威胁”

中国驻美大使谢锋:中国大蒜做梦也没想到,有朝一日会被列为“国家安全威胁”

每日经济新闻
2026-04-22 11:09:45
至今,还有13个国家和中国没有建交,他们都是谁?

至今,还有13个国家和中国没有建交,他们都是谁?

深度报
2026-04-22 22:30:57
湖人薪资情况:詹姆斯5260万合同到期,今夏将拥有9000万空间

湖人薪资情况:詹姆斯5260万合同到期,今夏将拥有9000万空间

懂球帝
2026-04-23 11:14:06
太阳2将价值暴跌!布克被夹成肉夹馍,吉莱斯皮遭严防后三节挂0!

太阳2将价值暴跌!布克被夹成肉夹馍,吉莱斯皮遭严防后三节挂0!

篮球资讯达人
2026-04-23 13:04:47
大不了关掉美国工厂!曹德旺谈美国加征关税:福耀绝不做赔本买卖

大不了关掉美国工厂!曹德旺谈美国加征关税:福耀绝不做赔本买卖

澎湃新闻
2026-04-22 17:42:34
窦唯二十年前的采访刷屏,间谍原来一直就在身边,我们都在被渗透

窦唯二十年前的采访刷屏,间谍原来一直就在身边,我们都在被渗透

歪歌社团
2026-04-23 04:33:45
最高院:提供 “口交” “肛交”等进入式性服务,是否属卖淫行为?

最高院:提供 “口交” “肛交”等进入式性服务,是否属卖淫行为?

周军律师聊案子
2026-04-21 09:50:16
网红莫氏鸡煲凉透了!从通宵排队到空无一人,终究逃不过昙花一现

网红莫氏鸡煲凉透了!从通宵排队到空无一人,终究逃不过昙花一现

椰青美食分享
2026-04-23 11:35:48
美以失算!伊朗强硬派全面掌权,温和派靠边站,美伊谈判又熄火

美以失算!伊朗强硬派全面掌权,温和派靠边站,美伊谈判又熄火

国是直通车
2026-04-22 20:39:30
中纪委2026严查新方向,这6类岗位首当其冲

中纪委2026严查新方向,这6类岗位首当其冲

细说职场
2026-04-23 09:15:43
用了16年的学位证校方称从未授予,当事人自我举报求证真伪 炒作还是确有其事?

用了16年的学位证校方称从未授予,当事人自我举报求证真伪 炒作还是确有其事?

红星新闻
2026-04-22 19:10:31
2026-04-23 14:23:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12832文章数 142634关注度
往期回顾 全部

科技要闻

车没卖爆,利润却大涨,特斯拉发布财报

头条要闻

快递员将7999元手机放门口丢了 20天后手机自己"报警"

头条要闻

快递员将7999元手机放门口丢了 20天后手机自己"报警"

体育要闻

莱斯特城降入英甲,一场亏麻了的豪赌

娱乐要闻

《凌探未来》公益纪录片今日发布

财经要闻

医院专家号"秒空"!警方牵出黑色产业链

汽车要闻

长安"1445"战略:一张走向"世界长安"的行军地图

态度原创

时尚
数码
艺术
本地
公开课

比白衬衫还火!入夏一定要拥有这条裙子,太时髦了

数码要闻

线上销量都快被小米超越!友商吐槽:格力空调从行业第一掉下来有原因

艺术要闻

生完7个女儿后,60岁的她被香奈儿邀请走高定秀!

本地新闻

SAGA GIRLS 2026女团选秀

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版