网易首页 > 网易号 > 正文 申请入驻

K2 Thinking横空出世引热议:月之暗面高管亲自回应技术、效率与成本问题

0
分享至

财联社11月13日讯(编辑 赵昊)本周,人工智能初创公司月之暗面(Moonshot AI)的核心高管在“美版贴吧”Reddit上举行了一场AMA(可以问我任何问题)活动,回应了多项业界热点议题。

参与这项活动的三位高管分别为杨植麟(论坛用户名:ComfortableAsk4494)、周昕宇(zxytim)和吴育昕(ppwwyyxx),三人在24小时内持续回答了论坛上网友提出的问题。

上周,月之暗面发布了Kimi K2 Thinking,公司称其为“迄今能力最强的开源思考模型”。因此,AMA活动上的大多数问题与K2 Thinking有关,有点像是该模型线上发布会的问答环节。


有人询问,为什么K2 Thinking能在单次推理中实现如此长的推理时间和推理链,而GPT5却做不到?GPT5 Pro通过智能体来延长推理时间,但推理效果仍然不如K2 Thinking单次长时间推理。未来是否会考虑进一步提升基础模型的推理速度?

杨植麟回答道:“我认为推理时间取决于API的吞吐量,而推理令牌的数量则取决于模型的训练方式。我们训练K2 Thinking的方式倾向于使用相对更多的推理令牌以获得最佳结果。我们的Turbo API应该会快得多。此外,K2原生支持INT4类型,这进一步加快了推理过程。”

当被问及“FP4相对于INT4的改进是否真的意义重大?”时,周昕宇称,选择INT4是为了更好地兼容“非Blackwell GPU”,同时利用现有的INT4推理marlin内核。

吴育昕在另一个问题下称,“我们使用配备Infiniband的H800 GPU;它不如美国的高端GPU那么好,而且我们的显卡数量也处于劣势,但我们充分利用了每一张显卡!

有网友称,K2 Thinking似乎使用了过多的代币。杨植麟承认了这一现象,并解释道“当前版本中,我们优先考虑的是绝对性能而非代币效率。我们会尝试将效率纳入奖励机制,以便它能学习如何简化思考过程。”

有人质疑,K2 Thinking通过专门训练,以达到在高水平逻辑推理(HLE)测试中取得好成绩,但“它的高分似乎与实际使用中的智能水平不太相符。”

杨植麟回应称,“我们在提升智能体推理能力方面取得了一些进展,使其在HLE测试中得分较高。我们正在努力进一步提升其通用能力,以便在更多实际应用场景中充分发挥智能的作用。”

当网友询问“K2 Thinking培训费用只有460万美元是真的吗?”杨植麟回答道:“这并非官方数据,因为培训成本很难量化,其中很大一部分用于研究和实验。”

在点赞最多的回答中,周昕宇透露,公司的新架构KDA(Kernel Attention Dual Architecture)能让模型获得更高的基准测试分数,而且速度更快、效率更高,从而使我们能够更快地进行预训练、更快地部署到强化学习中,并服务更多用户。

周昕宇表示,“我们正在开发更多改进方案,完成后会与大家分享。”杨植麟也补充道:“KDA是我们最新的实验性架构,与KDA相关的想法很可能会在K3中得到应用。”

在被追问何时推出K3模型的问题中,杨植麟还调侃了OpenAI的首席执行官萨姆·奥尔特曼,他回应称,肯定能在“萨姆价值万亿美元的数据中心建成之前”推出K3模型。

有网友询问对“OpenAI为什么会烧掉这么多钱”的看法,周昕宇称“不知道。只有萨姆自己知道。我们有自己的方式和节奏。”周昕宇还提到,月之暗面没有人工智能浏览器的计划,因为“不需要去套一层新的Chromium壳”。

当被问及公司有没有“视觉-语言模型(VL)的计划时”,杨植麟写道:“是的,我们正在努力。敬请期待!”

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
410次开房记录流出:央企“女老虎”陶荔芳,背后还有多少同伙

410次开房记录流出:央企“女老虎”陶荔芳,背后还有多少同伙

深度报
2025-12-14 22:36:54
中国为何要禁枪?1993年湖南2村械斗堪比战争,5000人混战34小时

中国为何要禁枪?1993年湖南2村械斗堪比战争,5000人混战34小时

卡索
2024-06-28 10:32:05
图灵奖科学家泼冷水:机器人连猫都不如!宇树王兴兴隔空回应

图灵奖科学家泼冷水:机器人连猫都不如!宇树王兴兴隔空回应

娱乐督察中
2026-02-18 19:50:57
广东深圳,一男子一夜之间,49亿身家蒸发,导致负债10亿他立马

广东深圳,一男子一夜之间,49亿身家蒸发,导致负债10亿他立马

网络易不易
2026-02-18 16:00:09
1900年,八国联军把“黄莲圣母”当成玩物,凌辱后运往欧洲展览?

1900年,八国联军把“黄莲圣母”当成玩物,凌辱后运往欧洲展览?

谈史论天地
2026-02-08 12:00:10
79年对越战争许世友为何对邓小平不满?回国当天没人敢去机场迎接

79年对越战争许世友为何对邓小平不满?回国当天没人敢去机场迎接

历史龙元阁
2026-02-16 12:50:06
“性萧条”才是这个时代真正的危机

“性萧条”才是这个时代真正的危机

深蓝夜读
2025-09-24 16:00:09
虎口救羊!2026年的第一场硬仗,中方严厉警告,立威之战已打响?

虎口救羊!2026年的第一场硬仗,中方严厉警告,立威之战已打响?

史智文道
2026-01-30 22:36:38
朝鲜人一不加班、二不熬夜、三不挣钱,平时放假都干些什么事呢?

朝鲜人一不加班、二不熬夜、三不挣钱,平时放假都干些什么事呢?

壹知眠羊
2026-01-04 18:08:22
在农村见过最离谱的事情是什么?男女关系的开放程度让人目瞪口呆

在农村见过最离谱的事情是什么?男女关系的开放程度让人目瞪口呆

夜深爱杂谈
2026-01-06 20:51:44
日本翻拍《水浒传 北方谦三》正式上映,日本人为什么更喜欢水浒?

日本翻拍《水浒传 北方谦三》正式上映,日本人为什么更喜欢水浒?

日本物语
2026-02-17 20:41:02
陈伟霆一家北京过春节,何穗晒照别墅摆满各色蝴蝶兰,年味十足

陈伟霆一家北京过春节,何穗晒照别墅摆满各色蝴蝶兰,年味十足

南方城市网
2026-02-17 21:04:12
坏消息,老鹰队库明加在被交易至勇士队后至少还要缺席一周

坏消息,老鹰队库明加在被交易至勇士队后至少还要缺席一周

好火子
2026-02-19 06:29:33
12死!湖北烟花店爆炸:店主信息被扒,死者身份披露,一细节可怕

12死!湖北烟花店爆炸:店主信息被扒,死者身份披露,一细节可怕

博士观察
2026-02-18 23:29:56
容祖儿晒霍汶希女儿近照,妈妈把她养的真好,15岁长得好港女

容祖儿晒霍汶希女儿近照,妈妈把她养的真好,15岁长得好港女

手工制作阿歼
2026-02-18 19:13:02
“空气香甜女”杨舒平,已被美国驱逐出境,如今回国下场大快人心

“空气香甜女”杨舒平,已被美国驱逐出境,如今回国下场大快人心

小李子体育
2026-02-18 20:11:43
专职诈骗!广东总商会副会长被终身监禁,101亿赃款全部没收

专职诈骗!广东总商会副会长被终身监禁,101亿赃款全部没收

云鹏叙事
2026-02-18 10:13:03
加拿大冰壶队成双击作弊重灾区 瑞典媒体派记者抓到现行被拒绝采访

加拿大冰壶队成双击作弊重灾区 瑞典媒体派记者抓到现行被拒绝采访

劲爆体坛
2026-02-18 11:10:04
“老人味”的祸首被揪出!医生提醒:55岁后要少碰,老了或也没味

“老人味”的祸首被揪出!医生提醒:55岁后要少碰,老了或也没味

健康之光
2026-02-09 14:28:50
看了鸨鸟怎么交配,才知道古代青楼的老板娘,为何叫“老鸨”!

看了鸨鸟怎么交配,才知道古代青楼的老板娘,为何叫“老鸨”!

热点大放送
2026-02-12 20:22:49
2026-02-19 08:28:49
财联社 incentive-icons
财联社
以“准确、快速、权威、专业”为新闻准则,为投资者提供专业的投资资讯。
686103文章数 1017670关注度
往期回顾 全部

科技要闻

怒烧45亿,腾讯字节阿里决战春节

头条要闻

男子租新能源车自驾因APP控车失灵返程 起诉索赔被驳

头条要闻

男子租新能源车自驾因APP控车失灵返程 起诉索赔被驳

体育要闻

首金!苏翊鸣唱国歌落泪 自信比1呐喊

娱乐要闻

明星过年百态!黄晓明等现身三亚

财经要闻

面条火腿香菇酱!上市公司这些年请你吃

汽车要闻

量产甲醇插混 吉利银河星耀6甲醇插混版申报图

态度原创

时尚
房产
艺术
手机
公开课

马年壁纸送上,祝大家新年快乐,马上发财!

房产要闻

三亚新机场,又传出新消息!

艺术要闻

震惊!安徒生竟是画家,他的田园生活太美了!

手机要闻

谷歌Pixel 10a正式发布:纯平摄像头 极致简约

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版