网易首页 > 网易号 > 正文 申请入驻

Thinking Machines产品更新:K2 Thinking、Qwen3-VL都可以微调

0
分享至

来源:市场资讯

(来源:机器之心Pro)


机器之心报道

机器之心编辑部

当前,AI 领域的研究者与开发者在关注 OpenAI、Google 等领先机构最新进展的同时,也将目光投向了由前 OpenAI CTO Mira Murati 创办的 Thinking Machines Lab。

今年早些时候,他们推出了首款产品 Tinker:这是一个 API,用于帮开发者 / 研究人员微调语言模型。你只需要专注于训练数据和算法,而你不擅长的关于 Infra 的部分 —— 调度、调优、资源管理和 Infra 可靠性 —— 统统由 Tinker 来搞定,从而大大简化了 LLM 的后训练过程。

此前,Tinker 仅向研究人员和开发者开放内部测试;而如今,Thinking Machines 宣布正式取消候选名单,所有用户都可以直接使用 Tinker

除此以外,Tinker 还带来了其他三项更新:

首先,更强推理能力:用户现在可以在 Tinker 上对 Kimi K2 Thinking 进行微调。 Kimi K2 拥有万亿参数规模,是 Thinking Machines 目前规模最大的模型,专为长链推理和工具调用场景而设计。

其次,兼容 OpenAI API 的全新推理接口:Tinker 提供了标准的推理接口,例如:


借助本次发布,Tinker 还新增了兼容 OpenAI API 的接口封装,用户只需通过指定模型路径,即可对模型进行快速采样,即使模型仍处于训练过程中也可以使用。

这也意味着,Tinker 现在可以即插即用地接入任何兼容 OpenAI API 的平台。


最后,Qwen3-VL 支持视觉输入。Tinker 新增了两款视觉模型:Qwen3-VL-30B-A3B-Instruct 和 Qwen3-VL-235B-A22B-Instruct。借助这些模型,用户可以在多种应用场景中处理图片、截图以及示意图等视觉内容。


这些视觉输入开箱即用,可直接应用于多种任务场景,包括监督微调和强化学习微调。


Tinker支持的模型

过去,开发者若想训练或微调前沿大模型,必须自行采购 GPU、搭建集群、处理 CUDA/NCCL 环境、维护分布式训练稳定性,门槛极高且成本巨大。

而 Tinker 通过将所有训练基础设施抽象为一个 API,使开发者无需管理任何算力资源,只需准备数据和算法即可训练模型。更重要的是,此次更新首次让普通开发者能够微调万亿参数的 Kimi K2 Thinking,这本来是只有顶级实验室才能掌握的能力,视觉输入的加入进一步降低了 VLM 应用门槛。

对此,研究者纷纷表示:「能够在无需自行管理 GPU 基础设施的情况下训练自定义图文数据,对开发者来说是一项巨大的进步。」


使用 Tinker 训练图像分类模型

为了展示 Tinker 新增的视觉能力,Thinking Machines Lab 对 Qwen3-VL-235B-A22B-Instruct 进行了微调,并将其应用于多项经典图像分类基准测试中。

具体而言,研究团队选择了四个常用的数据集进行评估,包括:

由于 Qwen3-VL 本质上是语言模型,研究中将图像分类任务建模为文本生成问题:给定一张图片,模型直接输出对应的类别名称。研究人员将这一方法与传统的视觉基线方案 DINOv2 进行了对比。

DINOv2 是一种通过自监督方式训练的视觉 Transformer,常被用作纯计算机视觉任务的 backbone。对于 DINOv2,研究中在其模型之上添加了一个分类头,用于预测所有 N 个类别的概率分布。两种模型均采用 LoRA 方式进行微调。


图中展示了经过微调的 Qwen3-VL-235B-A22B 与 DINOv2 在简单图像分类任务上的性能对比。

在小样本数据场景下,Qwen3-VL-235B-A22B 的表现优于 DINOv2。这不仅是因为其模型规模更大,更重要的是,作为视觉语言模型(VLM),它天然具备语言知识(例如知道「向日葵」指代什么)。正是这种通用的语言与视觉联合能力,使得 Qwen3-VL 在图像分类之外,也能够更方便地迁移到其他视觉任务中。

还没体验的小伙伴,Tinker 绝对值得一试。

https://thinkingmachines.ai/tinker/

https://thinkingmachines.ai/blog/tinker-general-availability/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
女子看到别人电动车筐里的水,拿起来就喝 ,喝了几口又把水拧好放回去,男子不知情,出来后把剩下的水喝光

女子看到别人电动车筐里的水,拿起来就喝 ,喝了几口又把水拧好放回去,男子不知情,出来后把剩下的水喝光

观威海
2026-04-16 09:04:57
在古代,大雪封山的时候土匪们都在干什么?你肯定想不到

在古代,大雪封山的时候土匪们都在干什么?你肯定想不到

网络易不易
2026-04-14 13:55:13
全员“梓涵”消失不见,老师崩溃!新一批烂大街名字再次来袭

全员“梓涵”消失不见,老师崩溃!新一批烂大街名字再次来袭

谭老师地理大课堂
2026-04-12 20:21:47
善恶到头终有报,如今73岁的唐国强,已经走上了一条不归路!

善恶到头终有报,如今73岁的唐国强,已经走上了一条不归路!

吴蒂旅行ing
2026-03-20 05:20:46
4月16日译名发布:瓦尔季斯·东布罗夫斯基斯

4月16日译名发布:瓦尔季斯·东布罗夫斯基斯

参考消息
2026-04-16 11:07:42
鞠婧祎方回应“丝芭创始人王子杰去世”:不与争论,生命为大,愿安息;王子杰曾创立SNH48,打造鞠婧祎“四千年美女”标签,推动其成顶流

鞠婧祎方回应“丝芭创始人王子杰去世”:不与争论,生命为大,愿安息;王子杰曾创立SNH48,打造鞠婧祎“四千年美女”标签,推动其成顶流

大风新闻
2026-04-16 14:09:04
机构:若美军持续封锁 伊朗两周内或被迫大幅减产

机构:若美军持续封锁 伊朗两周内或被迫大幅减产

财联社
2026-04-15 17:30:11
巴基斯坦,进口中国空警500E预警机,碾压印度,已成定局?

巴基斯坦,进口中国空警500E预警机,碾压印度,已成定局?

万里繁华
2026-04-16 15:23:35
苏林访华阵容不是一般的豪华,越南高层能来的基本全来了

苏林访华阵容不是一般的豪华,越南高层能来的基本全来了

南宗历史
2026-04-15 16:40:47
1979年,1名中国兵被2名越南女兵抓进深山13年,回国后称很想她们

1979年,1名中国兵被2名越南女兵抓进深山13年,回国后称很想她们

莫地方
2026-04-16 00:45:03
千岛湖平均水深30米,鱼群胖成猪,最大的鱼能多大?

千岛湖平均水深30米,鱼群胖成猪,最大的鱼能多大?

普陀动物世界
2026-04-15 17:41:16
39岁前国脚现状:定居美国踢野球,早已财富自由,有2个可爱女儿

39岁前国脚现状:定居美国踢野球,早已财富自由,有2个可爱女儿

揽星河的笔记
2026-04-14 15:18:30
马筱梅深夜泪崩,张兰发文隔空撑腰

马筱梅深夜泪崩,张兰发文隔空撑腰

蒂蒂茱家
2026-04-16 10:53:37
10胜0负!这3组季后赛首轮对决,其实悬念不大了,火箭、马刺晋级

10胜0负!这3组季后赛首轮对决,其实悬念不大了,火箭、马刺晋级

篮球扫地僧
2026-04-16 15:56:52
石油枯竭竟是假象?颠覆认知,石油根本不是远古动植物演化而来

石油枯竭竟是假象?颠覆认知,石油根本不是远古动植物演化而来

丁丁鲤史纪
2026-04-13 16:00:40
环卫工捡到藏着30万现金的牛奶箱!在上海一小区垃圾站旁,失主居然不是来丢垃圾的人

环卫工捡到藏着30万现金的牛奶箱!在上海一小区垃圾站旁,失主居然不是来丢垃圾的人

环球网资讯
2026-04-15 14:32:25
红薯逆袭?科学研究:坚持吃红薯,不出半年,或能收获这5种好处

红薯逆袭?科学研究:坚持吃红薯,不出半年,或能收获这5种好处

健康之光
2026-04-06 18:41:47
我要是这男的,不得笑掉大牙!

我要是这男的,不得笑掉大牙!

水泥土的搞笑
2026-04-13 06:18:09
变卦了?郑丽文访美日期确定:两岸想要和平,美国非常重要

变卦了?郑丽文访美日期确定:两岸想要和平,美国非常重要

消费侠
2026-04-16 13:59:45
中美就特朗普访华保持着沟通

中美就特朗普访华保持着沟通

财联社
2026-04-16 15:20:09
2026-04-16 16:08:49
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
2885244文章数 6658关注度
往期回顾 全部

科技要闻

39.98万!小鹏GX预售“纯电增程同价”

头条要闻

特朗普称访华行程不会受伊朗战事影响 外交部回应

头条要闻

特朗普称访华行程不会受伊朗战事影响 外交部回应

体育要闻

很快,亚洲篮球要有自己的NCAA了?

娱乐要闻

丝芭传媒创始人王子杰去世,享年63岁

财经要闻

一季度GDP,5.0%!

汽车要闻

空间大五个乘客都满意?体验岚图泰山X8

态度原创

旅游
游戏
数码
艺术
公开课

旅游要闻

一张票根,三重豪礼!2026齐鲁超赛泰安文旅大礼包重磅来袭,61项主题优惠等你来领!

索尼新专利曝光:可扭曲、挤压、捏变形的PS手柄

数码要闻

英特尔代工业务有望迎来苹果、AMD、Google和英伟达等大客户订单

艺术要闻

张大千『 花菓荟萃册』

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版