网易首页 > 网易号 > 正文 申请入驻

Thinking Machines产品更新:K2 Thinking、Qwen3-VL都可以微调

0
分享至

来源:市场资讯

(来源:机器之心Pro)


机器之心报道

机器之心编辑部

当前,AI 领域的研究者与开发者在关注 OpenAI、Google 等领先机构最新进展的同时,也将目光投向了由前 OpenAI CTO Mira Murati 创办的 Thinking Machines Lab。

今年早些时候,他们推出了首款产品 Tinker:这是一个 API,用于帮开发者 / 研究人员微调语言模型。你只需要专注于训练数据和算法,而你不擅长的关于 Infra 的部分 —— 调度、调优、资源管理和 Infra 可靠性 —— 统统由 Tinker 来搞定,从而大大简化了 LLM 的后训练过程。

此前,Tinker 仅向研究人员和开发者开放内部测试;而如今,Thinking Machines 宣布正式取消候选名单,所有用户都可以直接使用 Tinker

除此以外,Tinker 还带来了其他三项更新:

首先,更强推理能力:用户现在可以在 Tinker 上对 Kimi K2 Thinking 进行微调。 Kimi K2 拥有万亿参数规模,是 Thinking Machines 目前规模最大的模型,专为长链推理和工具调用场景而设计。

其次,兼容 OpenAI API 的全新推理接口:Tinker 提供了标准的推理接口,例如:


借助本次发布,Tinker 还新增了兼容 OpenAI API 的接口封装,用户只需通过指定模型路径,即可对模型进行快速采样,即使模型仍处于训练过程中也可以使用。

这也意味着,Tinker 现在可以即插即用地接入任何兼容 OpenAI API 的平台。


最后,Qwen3-VL 支持视觉输入。Tinker 新增了两款视觉模型:Qwen3-VL-30B-A3B-Instruct 和 Qwen3-VL-235B-A22B-Instruct。借助这些模型,用户可以在多种应用场景中处理图片、截图以及示意图等视觉内容。


这些视觉输入开箱即用,可直接应用于多种任务场景,包括监督微调和强化学习微调。


Tinker支持的模型

过去,开发者若想训练或微调前沿大模型,必须自行采购 GPU、搭建集群、处理 CUDA/NCCL 环境、维护分布式训练稳定性,门槛极高且成本巨大。

而 Tinker 通过将所有训练基础设施抽象为一个 API,使开发者无需管理任何算力资源,只需准备数据和算法即可训练模型。更重要的是,此次更新首次让普通开发者能够微调万亿参数的 Kimi K2 Thinking,这本来是只有顶级实验室才能掌握的能力,视觉输入的加入进一步降低了 VLM 应用门槛。

对此,研究者纷纷表示:「能够在无需自行管理 GPU 基础设施的情况下训练自定义图文数据,对开发者来说是一项巨大的进步。」


使用 Tinker 训练图像分类模型

为了展示 Tinker 新增的视觉能力,Thinking Machines Lab 对 Qwen3-VL-235B-A22B-Instruct 进行了微调,并将其应用于多项经典图像分类基准测试中。

具体而言,研究团队选择了四个常用的数据集进行评估,包括:

由于 Qwen3-VL 本质上是语言模型,研究中将图像分类任务建模为文本生成问题:给定一张图片,模型直接输出对应的类别名称。研究人员将这一方法与传统的视觉基线方案 DINOv2 进行了对比。

DINOv2 是一种通过自监督方式训练的视觉 Transformer,常被用作纯计算机视觉任务的 backbone。对于 DINOv2,研究中在其模型之上添加了一个分类头,用于预测所有 N 个类别的概率分布。两种模型均采用 LoRA 方式进行微调。


图中展示了经过微调的 Qwen3-VL-235B-A22B 与 DINOv2 在简单图像分类任务上的性能对比。

在小样本数据场景下,Qwen3-VL-235B-A22B 的表现优于 DINOv2。这不仅是因为其模型规模更大,更重要的是,作为视觉语言模型(VLM),它天然具备语言知识(例如知道「向日葵」指代什么)。正是这种通用的语言与视觉联合能力,使得 Qwen3-VL 在图像分类之外,也能够更方便地迁移到其他视觉任务中。

还没体验的小伙伴,Tinker 绝对值得一试。

https://thinkingmachines.ai/tinker/

https://thinkingmachines.ai/blog/tinker-general-availability/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
2025最能“扛收视”7位女演员:宋祖儿倒数,杨紫第3,第1没悬念

2025最能“扛收视”7位女演员:宋祖儿倒数,杨紫第3,第1没悬念

八斗小先生
2026-01-07 17:19:16
2026年央视马年春晚官宣,看完导演和拟邀名单,厕所都不敢去上了

2026年央视马年春晚官宣,看完导演和拟邀名单,厕所都不敢去上了

包饺子ai剪辑
2025-12-11 11:52:28
医生发现:天冷还坚持散步的老年人,用不了多久,身体或有4变化

医生发现:天冷还坚持散步的老年人,用不了多久,身体或有4变化

展望云霄
2025-12-12 22:15:11
研究发现:每天都吸烟的人,多数到了60岁以后,身体或变成这样?

研究发现:每天都吸烟的人,多数到了60岁以后,身体或变成这样?

华庭讲美食
2026-01-26 00:21:35
越南少将阮德辉揭露:中方撤军时越军为何按兵不动?

越南少将阮德辉揭露:中方撤军时越军为何按兵不动?

磊子讲史
2026-01-09 18:00:27
北京市卫健委主任:今年将落地一揽子生育支持政策 研究放宽普惠托育收费标准、优化补贴政策

北京市卫健委主任:今年将落地一揽子生育支持政策 研究放宽普惠托育收费标准、优化补贴政策

财联社
2026-01-25 15:47:04
科学家扫描了25万个大脑发现:决定孩子一生的,不是智商,而是父母的这三件事

科学家扫描了25万个大脑发现:决定孩子一生的,不是智商,而是父母的这三件事

阅读第一
2025-12-13 08:34:34
装逼撞到你擅长的领域是啥体验?网友:我曾经也干过这种事呀

装逼撞到你擅长的领域是啥体验?网友:我曾经也干过这种事呀

夜深爱杂谈
2025-12-21 17:57:28
肮脏,但是有效!高手搞钱、谋官、追爱,就靠这3个做局智慧

肮脏,但是有效!高手搞钱、谋官、追爱,就靠这3个做局智慧

第一管理
2024-04-08 20:17:19
以色列已经告诉世界:日本若敢拥有核武器,美国并不会第一个翻脸

以色列已经告诉世界:日本若敢拥有核武器,美国并不会第一个翻脸

八斗小先生
2025-12-26 09:33:27
“跳水”大降价,又一豪车品牌扛不住了!

“跳水”大降价,又一豪车品牌扛不住了!

蒋东文
2026-01-16 20:51:15
教外语应该穿什么,学外语又该穿什么?

教外语应该穿什么,学外语又该穿什么?

三人成虎V5
2026-01-24 21:53:04
《太平年》史实大结局:钱弘俶被赵光义暗杀,孙太真见证钱氏融宋

《太平年》史实大结局:钱弘俶被赵光义暗杀,孙太真见证钱氏融宋

动物奇奇怪怪
2026-01-25 02:45:08
大跳水!暴跌40%,又土又贵还开遍机场,中产的标配,卖不动了

大跳水!暴跌40%,又土又贵还开遍机场,中产的标配,卖不动了

毒sir财经
2025-11-16 23:08:08
自称“性商教母”,近50岁网红“黑白颠周媛”主账号已被封,中国妇女报发表评论

自称“性商教母”,近50岁网红“黑白颠周媛”主账号已被封,中国妇女报发表评论

扬子晚报
2026-01-23 07:37:10
牛啊!中国奥运冠军宣布怀孕,挺孕肚仍做出“一字马”,肚大如箩

牛啊!中国奥运冠军宣布怀孕,挺孕肚仍做出“一字马”,肚大如箩

二疯说球
2025-12-06 11:12:18
官媒发文,63岁俞敏洪再破天花板,让董宇辉和整个商界沉默了

官媒发文,63岁俞敏洪再破天花板,让董宇辉和整个商界沉默了

白日追梦人
2026-01-25 08:11:14
四川街头惊现外地救护车 引发群众猜疑和恐慌

四川街头惊现外地救护车 引发群众猜疑和恐慌

七彩云南简南俊
2026-01-25 17:56:40
贝克汉姆长子抨击父母,小儿子发文暗讽哥哥忘本:你以为你是谁?

贝克汉姆长子抨击父母,小儿子发文暗讽哥哥忘本:你以为你是谁?

乡野小珥
2026-01-23 16:14:15
一位刚退休的国企中层干部透露:如今国企晋升通道就剩一条路了

一位刚退休的国企中层干部透露:如今国企晋升通道就剩一条路了

涵豆说娱
2026-01-17 15:15:00
2026-01-26 04:11:00
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
2057561文章数 5296关注度
往期回顾 全部

科技要闻

黄仁勋在上海逛菜市场,可能惦记着三件事

头条要闻

男孩打碎电视屏为"还债"在小区创业 不到2个月赚了6千

头条要闻

男孩打碎电视屏为"还债"在小区创业 不到2个月赚了6千

体育要闻

中国足球不会一夜变强,但他们已经创造历史

娱乐要闻

央八开播 杨紫胡歌主演的40集大剧来了

财经要闻

隋广义等80人被公诉 千亿骗局进入末路

汽车要闻

别克至境E7内饰图曝光 新车将于一季度正式发布

态度原创

亲子
艺术
时尚
数码
教育

亲子要闻

真是你哥的好妹妹~

艺术要闻

这些肖像看完直呼“爽”!真是好久都没有看到了!

看了鲁豫对章小蕙的采访,最大感触是这一点

数码要闻

AMD最强APU更新!锐龙AI Max+ 400详细规格曝光:5.2GHz CPU、3.0GHz GPU

教育要闻

西藏考生必看!合肥工业大学招生计划揭秘

无障碍浏览 进入关怀版