网易首页 > 网易号 > 正文 申请入驻

K2 Thinking横空出世引热议:月之暗面高管亲自回应技术、效率与成本问题

0
分享至

财联社11月13日讯(编辑 赵昊)本周,人工智能初创公司月之暗面(Moonshot AI)的核心高管在“美版贴吧”Reddit上举行了一场AMA(可以问我任何问题)活动,回应了多项业界热点议题。

参与这项活动的三位高管分别为杨植麟(论坛用户名:ComfortableAsk4494)、周昕宇(zxytim)和吴育昕(ppwwyyxx),三人在24小时内持续回答了论坛上网友提出的问题。

上周,月之暗面发布了Kimi K2 Thinking,公司称其为“迄今能力最强的开源思考模型”。因此,AMA活动上的大多数问题与K2 Thinking有关,有点像是该模型线上发布会的问答环节。


有人询问,为什么K2 Thinking能在单次推理中实现如此长的推理时间和推理链,而GPT5却做不到?GPT5 Pro通过智能体来延长推理时间,但推理效果仍然不如K2 Thinking单次长时间推理。未来是否会考虑进一步提升基础模型的推理速度?

杨植麟回答道:“我认为推理时间取决于API的吞吐量,而推理令牌的数量则取决于模型的训练方式。我们训练K2 Thinking的方式倾向于使用相对更多的推理令牌以获得最佳结果。我们的Turbo API应该会快得多。此外,K2原生支持INT4类型,这进一步加快了推理过程。”

当被问及“FP4相对于INT4的改进是否真的意义重大?”时,周昕宇称,选择INT4是为了更好地兼容“非Blackwell GPU”,同时利用现有的INT4推理marlin内核。

吴育昕在另一个问题下称,“我们使用配备Infiniband的H800 GPU;它不如美国的高端GPU那么好,而且我们的显卡数量也处于劣势,但我们充分利用了每一张显卡!

有网友称,K2 Thinking似乎使用了过多的代币。杨植麟承认了这一现象,并解释道“当前版本中,我们优先考虑的是绝对性能而非代币效率。我们会尝试将效率纳入奖励机制,以便它能学习如何简化思考过程。”

有人质疑,K2 Thinking通过专门训练,以达到在高水平逻辑推理(HLE)测试中取得好成绩,但“它的高分似乎与实际使用中的智能水平不太相符。”

杨植麟回应称,“我们在提升智能体推理能力方面取得了一些进展,使其在HLE测试中得分较高。我们正在努力进一步提升其通用能力,以便在更多实际应用场景中充分发挥智能的作用。”

当网友询问“K2 Thinking培训费用只有460万美元是真的吗?”杨植麟回答道:“这并非官方数据,因为培训成本很难量化,其中很大一部分用于研究和实验。”

在点赞最多的回答中,周昕宇透露,公司的新架构KDA(Kernel Attention Dual Architecture)能让模型获得更高的基准测试分数,而且速度更快、效率更高,从而使我们能够更快地进行预训练、更快地部署到强化学习中,并服务更多用户。

周昕宇表示,“我们正在开发更多改进方案,完成后会与大家分享。”杨植麟也补充道:“KDA是我们最新的实验性架构,与KDA相关的想法很可能会在K3中得到应用。”

在被追问何时推出K3模型的问题中,杨植麟还调侃了OpenAI的首席执行官萨姆·奥尔特曼,他回应称,肯定能在“萨姆价值万亿美元的数据中心建成之前”推出K3模型。

有网友询问对“OpenAI为什么会烧掉这么多钱”的看法,周昕宇称“不知道。只有萨姆自己知道。我们有自己的方式和节奏。”周昕宇还提到,月之暗面没有人工智能浏览器的计划,因为“不需要去套一层新的Chromium壳”。

当被问及公司有没有“视觉-语言模型(VL)的计划时”,杨植麟写道:“是的,我们正在努力。敬请期待!”

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
火箭与魔术更新明日比赛伤病名单:伊森范乔丹等伤停&班切罗缺阵

火箭与魔术更新明日比赛伤病名单:伊森范乔丹等伤停&班切罗缺阵

梁岱爱玩车
2025-11-16 04:57:31
中国可能已被五场战争包围,最先爆发战争的可能不是台湾

中国可能已被五场战争包围,最先爆发战争的可能不是台湾

boss外传
2025-10-17 15:30:03
早就想打!日媒首次爆料:中国双航母出动时日军战机已做战斗准备

早就想打!日媒首次爆料:中国双航母出动时日军战机已做战斗准备

诗意世界
2025-08-21 13:13:50
曾医生前夫被低估了!众人说他配不上妻子,实则是眼科大拿

曾医生前夫被低估了!众人说他配不上妻子,实则是眼科大拿

诗意世界
2025-11-13 17:50:38
想不通,一个堂堂正正的五常居然被一个二战的战败国所威胁

想不通,一个堂堂正正的五常居然被一个二战的战败国所威胁

忠于法纪
2025-11-15 09:31:14
红军城全剧终已至。俄军撒劝降单,赢家不是普京,也不是泽连斯基

红军城全剧终已至。俄军撒劝降单,赢家不是普京,也不是泽连斯基

超人强动物俱乐部
2025-11-15 14:52:01
希拉里爆料震撼全球:特朗普要分天下?东亚给中国,东欧给普京!

希拉里爆料震撼全球:特朗普要分天下?东亚给中国,东欧给普京!

小鱼爱鱼乐
2025-11-15 09:31:44
今夕何夕!中国队2-0韩国队!

今夕何夕!中国队2-0韩国队!

五星体育
2025-11-15 21:50:55
4-0!巴萨2亿天王缺席,西班牙仍狂胜,5战19球剑指美加墨

4-0!巴萨2亿天王缺席,西班牙仍狂胜,5战19球剑指美加墨

我的护球最独特
2025-11-16 03:03:42
已连续缺席独行侠8场比赛,记者:对阵开拓者浓眉仍出战成疑

已连续缺席独行侠8场比赛,记者:对阵开拓者浓眉仍出战成疑

懂球帝
2025-11-16 08:09:07
当年,为什么大部分日本民众都支持侵华战争?深层原因是这个

当年,为什么大部分日本民众都支持侵华战争?深层原因是这个

阿胡
2024-07-04 11:01:21
电影鬼灭之刃首日票房破亿

电影鬼灭之刃首日票房破亿

界面新闻
2025-11-14 17:25:42
河北灭门案更多“诡异细节”流出,疑家属早知情,凶手家属曝更多

河北灭门案更多“诡异细节”流出,疑家属早知情,凶手家属曝更多

奇思妙想草叶君
2025-11-15 20:48:40
网友公认四川第一美人!这颜值真是绝了!

网友公认四川第一美人!这颜值真是绝了!

乡野小珥
2025-11-16 01:43:05
致15死1失踪,湖南怀化沅水流域重大水上交通事故调查报告公布

致15死1失踪,湖南怀化沅水流域重大水上交通事故调查报告公布

界面新闻
2025-11-15 15:13:18
何超琼陪外甥女领奖,6岁荷包蛋圆脸大眼很可爱,真像四太梁安琪

何超琼陪外甥女领奖,6岁荷包蛋圆脸大眼很可爱,真像四太梁安琪

丰谭笔录
2025-11-14 00:18:45
没两把刷子还真进不去里面呢!网友:出狱时,老板带着合同来请

没两把刷子还真进不去里面呢!网友:出狱时,老板带着合同来请

夜深爱杂谈
2025-11-15 22:18:20
出轨嫖娼,奢侈消费!网友直呼被“做局”

出轨嫖娼,奢侈消费!网友直呼被“做局”

陆弃
2025-11-14 14:21:48
【热身】U16男足0比2缅甸U16

【热身】U16男足0比2缅甸U16

体坛周报
2025-11-15 22:47:10
热搜上引群嘲的“娇妻小二本”事件,暴露出多少中国女人的悲哀

热搜上引群嘲的“娇妻小二本”事件,暴露出多少中国女人的悲哀

小椰子专栏
2025-11-14 13:14:51
2025-11-16 08:56:49
财联社 incentive-icons
财联社
以“准确、快速、权威、专业”为新闻准则,为投资者提供专业的投资资讯。
648734文章数 1015545关注度
往期回顾 全部

科技要闻

撕掉流量外衣,小米还剩什么?

头条要闻

日本外相:高市早苗的发言未违反国际法 没有必要收回

头条要闻

日本外相:高市早苗的发言未违反国际法 没有必要收回

体育要闻

樊振东和他的尖子班 勇闯地表最强乒乓球赛

娱乐要闻

钟嘉欣婚变风波升级!被骗婚?

财经要闻

小米之“惑”

汽车要闻

"冰彩沙"全配齐 红旗HS6 PHEV预售17.88万起

态度原创

艺术
时尚
手机
旅游
家居

艺术要闻

她从教师岗位退休,却在画布上开始了第二次人生!

今年冬天最流行的4组叠穿,让你美出新高度!

手机要闻

全球首发出圈实况拼图!OPPO Reno15系列下周登场

旅游要闻

新疆阜康:天山天池景区迎客来

家居要闻

现代简逸 寻找生活的光

无障碍浏览 进入关怀版