网易首页 > 网易号 > 正文 申请入驻

K2 Thinking横空出世引热议:月之暗面高管亲自回应技术、效率与成本问题

0
分享至

财联社11月13日讯(编辑 赵昊)本周,人工智能初创公司月之暗面(Moonshot AI)的核心高管在“美版贴吧”Reddit上举行了一场AMA(可以问我任何问题)活动,回应了多项业界热点议题。

参与这项活动的三位高管分别为杨植麟(论坛用户名:ComfortableAsk4494)、周昕宇(zxytim)和吴育昕(ppwwyyxx),三人在24小时内持续回答了论坛上网友提出的问题。

上周,月之暗面发布了Kimi K2 Thinking,公司称其为“迄今能力最强的开源思考模型”。因此,AMA活动上的大多数问题与K2 Thinking有关,有点像是该模型线上发布会的问答环节。


有人询问,为什么K2 Thinking能在单次推理中实现如此长的推理时间和推理链,而GPT5却做不到?GPT5 Pro通过智能体来延长推理时间,但推理效果仍然不如K2 Thinking单次长时间推理。未来是否会考虑进一步提升基础模型的推理速度?

杨植麟回答道:“我认为推理时间取决于API的吞吐量,而推理令牌的数量则取决于模型的训练方式。我们训练K2 Thinking的方式倾向于使用相对更多的推理令牌以获得最佳结果。我们的Turbo API应该会快得多。此外,K2原生支持INT4类型,这进一步加快了推理过程。”

当被问及“FP4相对于INT4的改进是否真的意义重大?”时,周昕宇称,选择INT4是为了更好地兼容“非Blackwell GPU”,同时利用现有的INT4推理marlin内核。

吴育昕在另一个问题下称,“我们使用配备Infiniband的H800 GPU;它不如美国的高端GPU那么好,而且我们的显卡数量也处于劣势,但我们充分利用了每一张显卡!

有网友称,K2 Thinking似乎使用了过多的代币。杨植麟承认了这一现象,并解释道“当前版本中,我们优先考虑的是绝对性能而非代币效率。我们会尝试将效率纳入奖励机制,以便它能学习如何简化思考过程。”

有人质疑,K2 Thinking通过专门训练,以达到在高水平逻辑推理(HLE)测试中取得好成绩,但“它的高分似乎与实际使用中的智能水平不太相符。”

杨植麟回应称,“我们在提升智能体推理能力方面取得了一些进展,使其在HLE测试中得分较高。我们正在努力进一步提升其通用能力,以便在更多实际应用场景中充分发挥智能的作用。”

当网友询问“K2 Thinking培训费用只有460万美元是真的吗?”杨植麟回答道:“这并非官方数据,因为培训成本很难量化,其中很大一部分用于研究和实验。”

在点赞最多的回答中,周昕宇透露,公司的新架构KDA(Kernel Attention Dual Architecture)能让模型获得更高的基准测试分数,而且速度更快、效率更高,从而使我们能够更快地进行预训练、更快地部署到强化学习中,并服务更多用户。

周昕宇表示,“我们正在开发更多改进方案,完成后会与大家分享。”杨植麟也补充道:“KDA是我们最新的实验性架构,与KDA相关的想法很可能会在K3中得到应用。”

在被追问何时推出K3模型的问题中,杨植麟还调侃了OpenAI的首席执行官萨姆·奥尔特曼,他回应称,肯定能在“萨姆价值万亿美元的数据中心建成之前”推出K3模型。

有网友询问对“OpenAI为什么会烧掉这么多钱”的看法,周昕宇称“不知道。只有萨姆自己知道。我们有自己的方式和节奏。”周昕宇还提到,月之暗面没有人工智能浏览器的计划,因为“不需要去套一层新的Chromium壳”。

当被问及公司有没有“视觉-语言模型(VL)的计划时”,杨植麟写道:“是的,我们正在努力。敬请期待!”

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
原来有这么多工作需要保密!网友:牺牲12年的爸爸竟然回来了!

原来有这么多工作需要保密!网友:牺牲12年的爸爸竟然回来了!

另子维爱读史
2026-01-16 18:29:22
再打下去可能灭国,四年前乌克兰还有4300多万人,如今还有多少?

再打下去可能灭国,四年前乌克兰还有4300多万人,如今还有多少?

古史青云啊
2026-02-18 09:27:23
真正决定孩子未来的,不是学区房,不是补习班,而是你家的家风

真正决定孩子未来的,不是学区房,不是补习班,而是你家的家风

青苹果sht
2026-02-13 06:20:39
完爆怀特塞德+碾压麦基!广东队瞄准2米08空间型内线,保底总决赛

完爆怀特塞德+碾压麦基!广东队瞄准2米08空间型内线,保底总决赛

绯雨儿
2026-02-18 17:02:56
除夕女儿看监控,发现母亲独自在客厅坐了一宿,画面曝光让人心酸

除夕女儿看监控,发现母亲独自在客厅坐了一宿,画面曝光让人心酸

瓜哥的动物日记
2026-02-18 03:45:24
美国一富豪被冷冻50年,原定2017年苏醒,解冻时工作人员紧急叫停

美国一富豪被冷冻50年,原定2017年苏醒,解冻时工作人员紧急叫停

蜉蝣说
2025-12-01 11:20:58
短道速滑男子500米1/4决赛:刘少昂/林孝埈分列第二第三组

短道速滑男子500米1/4决赛:刘少昂/林孝埈分列第二第三组

林子说事
2026-02-18 19:42:46
人闲车不闲!前奔驰首席设计师公布红猪300 SEL新构想

人闲车不闲!前奔驰首席设计师公布红猪300 SEL新构想

快科技
2026-02-17 22:21:16
北京警方刑拘30余人!

北京警方刑拘30余人!

美丽大北京
2026-02-18 17:16:34
邮报:阿莫林在柴郡的租房合同有中断条款,仅损失4.5万镑

邮报:阿莫林在柴郡的租房合同有中断条款,仅损失4.5万镑

懂球帝
2026-02-18 19:13:06
春晚飘过40载,今年春晚尤其难看

春晚飘过40载,今年春晚尤其难看

凤眼论
2026-02-16 22:50:18
我就说像王菲怎么会喜欢上窦唯呢?看了这张照片我才明白

我就说像王菲怎么会喜欢上窦唯呢?看了这张照片我才明白

科学发掘
2026-02-16 10:58:02
奥莱报:欧足联将调查维尼修斯遭歧视事件,处罚或为至少10场禁赛

奥莱报:欧足联将调查维尼修斯遭歧视事件,处罚或为至少10场禁赛

懂球帝
2026-02-18 09:30:04
小区楼上天天晚上都有女的大声叫。。。

小区楼上天天晚上都有女的大声叫。。。

微微热评
2025-12-24 00:26:04
2026年嫖娼非犯罪但违法!拘留罚款标准明确,这几类人重罚

2026年嫖娼非犯罪但违法!拘留罚款标准明确,这几类人重罚

复转这些年
2026-02-11 22:23:18
戴安娜秘密录音曝光:和查尔斯一周三次夫妻生活,他却想当卡米拉卫生棉

戴安娜秘密录音曝光:和查尔斯一周三次夫妻生活,他却想当卡米拉卫生棉

小鱼爱鱼乐
2026-02-17 07:05:58
央视春晚收视率破40%!王菲出场不到38%,知名乐评人吐槽王菲假唱

央视春晚收视率破40%!王菲出场不到38%,知名乐评人吐槽王菲假唱

古希腊掌管月桂的神
2026-02-16 23:36:38
建行储蓄卡未离身却遭连续盗刷,近1.5万元流向三省,深圳警方向三地警方发协查函

建行储蓄卡未离身却遭连续盗刷,近1.5万元流向三省,深圳警方向三地警方发协查函

大风新闻
2026-02-18 17:37:03
中国队大捷添2金1铜金牌榜升5位 将挑战都灵成绩冲击队史第三佳绩

中国队大捷添2金1铜金牌榜升5位 将挑战都灵成绩冲击队史第三佳绩

劲爆体坛
2026-02-18 22:26:20
勒布朗:不知道祖巴茨是否依然记恨湖人,失去戴维斯真的影响很大

勒布朗:不知道祖巴茨是否依然记恨湖人,失去戴维斯真的影响很大

稻谷与小麦
2026-02-18 23:22:31
2026-02-19 01:40:49
财联社 incentive-icons
财联社
以“准确、快速、权威、专业”为新闻准则,为投资者提供专业的投资资讯。
686082文章数 1017664关注度
往期回顾 全部

科技要闻

怒烧45亿,腾讯字节阿里决战春节

头条要闻

27岁女子上门做年夜饭月入4.5万:一桌10个菜1888元

头条要闻

27岁女子上门做年夜饭月入4.5万:一桌10个菜1888元

体育要闻

首金!苏翊鸣唱国歌落泪 自信比1呐喊

娱乐要闻

明星过年百态!黄晓明等现身三亚

财经要闻

面条火腿香菇酱!上市公司这些年请你吃

汽车要闻

量产甲醇插混 吉利银河星耀6甲醇插混版申报图

态度原创

艺术
游戏
健康
手机
教育

艺术要闻

震惊!安徒生竟是画家,他的田园生活太美了!

PS王牌引擎太强大!成为《死亡搁浅2》唯一选择

转头就晕的耳石症,能开车上班吗?

手机要闻

三星预热S26系列全新相机功能,AI修复画面、切换昼夜场景

教育要闻

初二掉分不是偶然,是慢慢积累的结果

无障碍浏览 进入关怀版