网易首页 > 网易号 > 正文 申请入驻

趋境开源框架 KTransformers 成主流大模型首选,Qwen、Kimi、智谱 AI 推荐,单卡跑万亿模型

0
分享至

全球头部开源模型方的共同选择,印证了一款底层框架的硬实力。趋境科技与清华共同开源的KTransformers,已成为Qwen、Kimi、智谱AI等多个主流大模型发布首日的推荐推理引擎,其工程实践与兼容性也被多家一体机产品线采纳,成为被开发者、厂商与开源社区广泛复用的共建式底层框架。

技术与生态双认可:成功入选 “计算机系统领域奥斯卡” SOSP 2025

KTransformers 是一个高性能异构推理框架,专注于高效利用底层 GPU、CPU、内存等多样化算力,让大模型在更低算力、更灵活的硬件架构上高效运行。其论文《KTransformers: Unleashing the Full Potential of CPU/GPU Hybrid Inference for MoE Models》成功入选 “计算机系统领域奥斯卡” SOSP 2025,该顶会过去几十年间见证了虚拟化、分布式文件系统等无数里程碑式技术成果的首次亮相,此次入选标志着 KTransformers 的技术实力获得全球顶尖认可。

11月6日,月之暗面发布Kimi-K2-Thinking 模型后,KTransformers迅速完成全面适配,支持用户在单卡环境下完成推理任务,2卡环境下完成LoRA微调任务,大幅降低部署与定制化门槛。同时,趋境科技也已完成该模型在昇腾NPU上的全面适配,提供完善的全国产化推理解决方案,进一步拓宽其应用场景。

推理与微调双高效:KTransformers+SGLang实现高性能推理部署

在推理部署层面,KTransformers与主流推理框架SGLang于10月达成合作,双方架构合入同一分支。在Kimi-K2-1TB的模型推理任务中,用户仅需简单安装SGLang与KTransformers CPU内核,下载官方模型及量化权重,即可通过一条命令启动服务,且仅需单张消费级 GPU+CPU。这一合作融合了GPU+CPU异构推理创新模式与全GPU传统推理模式,推动大模型推理向更高性能、更低成本演进,迈向更广泛的产业落地。


在微调部署层面,KTransformers与LLaMA-Factory深度集成,支持LoRA等轻量级微调方法,仅占用约41 GB显存+2T内存,就能实现46.55 token/s的微调吞吐量。传统上,LoRA 微调千亿模型成本高达数百万,而趋境的异构微调能力将资源需求降低到单个消费级 GPU(如 RTX 4090)起,让高校、中小型实验室、初创公司甚至个人开发者都能参与大模型定制。该方案在 DeepSeek-14B 模型上展现了超过传统方案 1.8 倍的吞吐、显存占用降低 82%,是消费级显卡上微调超大参数 MoE 模型的唯一可行方案。

对趋境科技而言,KTransformers承载的是 “普惠顶尖AI智能与隐私” 的价值理念。大模型时代需要更广谱的推理基础设施路线,趋境已与多个国产 CPU、GPU硬件平台合作,推进全国产高性价比方案;为数十家行业开发伙伴提供算力底座,让更多团队用得起、调得动大模型。今天的KTransformers,已让大模型推理脱离高端算力垄断;未来,趋境将继续推动 AI 能力普惠,让大模型真正融入各类业务场景。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
因公牺牲的贺娇龙坠马频率及危害远超奥运 她为了宣传效果太拼了!

因公牺牲的贺娇龙坠马频率及危害远超奥运 她为了宣传效果太拼了!

劲爆体坛
2026-01-15 01:43:04
刘强东没想到,离过年不到2月,章泽天走上了和田朴珺一样的路

刘强东没想到,离过年不到2月,章泽天走上了和田朴珺一样的路

查尔菲的笔记
2026-01-14 21:39:35
远离造神陷阱,官媒揭开杀猪宴呆呆妹真实处境,令人担心的事发生

远离造神陷阱,官媒揭开杀猪宴呆呆妹真实处境,令人担心的事发生

法老不说教
2026-01-14 14:43:04
中国狂抛美债,特朗普紧急发一道总统令,他认为:中国一定会领情

中国狂抛美债,特朗普紧急发一道总统令,他认为:中国一定会领情

策略述
2026-01-14 17:14:31
夫妻开宝马夜行高速遭陌生男子半道拦车,急刹避让后对方竟爬上引擎盖躺挡风玻璃,交警赶到后将他带走

夫妻开宝马夜行高速遭陌生男子半道拦车,急刹避让后对方竟爬上引擎盖躺挡风玻璃,交警赶到后将他带走

极目新闻
2026-01-14 12:58:25
从一线明星,沦落到拍短剧,这5位演员走到今天这步,怪不了别人

从一线明星,沦落到拍短剧,这5位演员走到今天这步,怪不了别人

阿纂看事
2026-01-13 18:05:31
他爆了,内娱最大的玄学

他爆了,内娱最大的玄学

八卦南风
2026-01-14 14:06:25
1984年贺子珍在上海病逝,市委不敢定丧葬规格,邓小平看后只说了一句话,结局出人意料

1984年贺子珍在上海病逝,市委不敢定丧葬规格,邓小平看后只说了一句话,结局出人意料

历史回忆室
2026-01-11 22:43:10
美媒:美国将暂停对75个国家的所有签证

美媒:美国将暂停对75个国家的所有签证

新华社
2026-01-14 22:40:07
同意加装电梯但一直没有出资,一户人家被全楼“孤立”!积怨太深,卖房时尴尬了

同意加装电梯但一直没有出资,一户人家被全楼“孤立”!积怨太深,卖房时尴尬了

扬子晚报
2026-01-14 11:27:18
当媒体开始“抢新闻”,说明新闻确实很少了

当媒体开始“抢新闻”,说明新闻确实很少了

走读新生
2026-01-14 13:24:50
贺娇龙坠马后续:确认死亡,知情人曝原因头 骨被马踏碎,画面太惨

贺娇龙坠马后续:确认死亡,知情人曝原因头 骨被马踏碎,画面太惨

生活魔术专家
2026-01-15 02:49:09
47岁贺娇龙去世,同学发声:遗体已运回老家,安葬在父亲墓地旁

47岁贺娇龙去世,同学发声:遗体已运回老家,安葬在父亲墓地旁

180视角
2026-01-15 02:15:55
哈萨克斯坦:放弃离中国近的阿拉木图,迁都到阿斯塔纳,为哪般?

哈萨克斯坦:放弃离中国近的阿拉木图,迁都到阿斯塔纳,为哪般?

阿柒的讯
2026-01-13 20:18:13
突发!携程集团被立案调查,股价盘尾大跌

突发!携程集团被立案调查,股价盘尾大跌

凤凰网财经
2026-01-14 17:21:06
有风度!泰国主帅高度赞扬中国队引发热议,球迷:打服了

有风度!泰国主帅高度赞扬中国队引发热议,球迷:打服了

侧身凌空斩
2026-01-14 23:20:49
被要求判死刑,尹锡悦涨红了脸,抓起麦克风陈述89分钟,拍桌怒骂特检组

被要求判死刑,尹锡悦涨红了脸,抓起麦克风陈述89分钟,拍桌怒骂特检组

红星新闻
2026-01-14 12:58:18
男人牢记:搞定女人的“千古定律”,就这三条,百试百灵!

男人牢记:搞定女人的“千古定律”,就这三条,百试百灵!

千秋文化
2026-01-14 21:05:03
篡改网友视频称牙膏能修牙填缝,狂卖70万单!高露洁失控了……

篡改网友视频称牙膏能修牙填缝,狂卖70万单!高露洁失控了……

柴狗夫斯基
2026-01-13 10:59:40
美专家:中国人不可怕,可怕的是他们买光刻机却不是用来生产芯片

美专家:中国人不可怕,可怕的是他们买光刻机却不是用来生产芯片

肖兹探秘说
2026-01-14 20:41:32
2026-01-15 07:32:49
雷峰网 incentive-icons
雷峰网
关注智能与未来!
68343文章数 656053关注度
往期回顾 全部

科技要闻

携程因涉嫌垄断被市场监管总局调查

头条要闻

外媒揭美对伊朗动手方案:派特种部队对高层实施"斩首"

头条要闻

外媒揭美对伊朗动手方案:派特种部队对高层实施"斩首"

体育要闻

你是个好球员,我们就拿你交易吧

娱乐要闻

网红彭十六偷税被封杀 曾成功转型明星

财经要闻

携程被立案调查,最高或被罚超50亿

汽车要闻

曝Model Y或降到20万以内!

态度原创

亲子
手机
艺术
房产
教育

亲子要闻

家长要告诉孩子一生遇到都是有用的人

手机要闻

REDMI Turbo 5 MAX现身跑分,天玑9500s芯片加持

艺术要闻

历代书家集字春联大集合

房产要闻

热销17亿后!天正·三亚湾壹号,被爆违建!

教育要闻

27的老师们如果实在无从下手:

无障碍浏览 进入关怀版