网易首页 > 网易号 > 正文 申请入驻

K2 Thinking横空出世引热议:月之暗面高管亲自回应技术、效率与成本问题

0
分享至

财联社11月13日讯(编辑 赵昊)本周,人工智能初创公司月之暗面(Moonshot AI)的核心高管在“美版贴吧”Reddit上举行了一场AMA(可以问我任何问题)活动,回应了多项业界热点议题。

参与这项活动的三位高管分别为杨植麟(论坛用户名:ComfortableAsk4494)、周昕宇(zxytim)和吴育昕(ppwwyyxx),三人在24小时内持续回答了论坛上网友提出的问题。

上周,月之暗面发布了Kimi K2 Thinking,公司称其为“迄今能力最强的开源思考模型”。因此,AMA活动上的大多数问题与K2 Thinking有关,有点像是该模型线上发布会的问答环节。


有人询问,为什么K2 Thinking能在单次推理中实现如此长的推理时间和推理链,而GPT5却做不到?GPT5 Pro通过智能体来延长推理时间,但推理效果仍然不如K2 Thinking单次长时间推理。未来是否会考虑进一步提升基础模型的推理速度?

杨植麟回答道:“我认为推理时间取决于API的吞吐量,而推理令牌的数量则取决于模型的训练方式。我们训练K2 Thinking的方式倾向于使用相对更多的推理令牌以获得最佳结果。我们的Turbo API应该会快得多。此外,K2原生支持INT4类型,这进一步加快了推理过程。”

当被问及“FP4相对于INT4的改进是否真的意义重大?”时,周昕宇称,选择INT4是为了更好地兼容“非Blackwell GPU”,同时利用现有的INT4推理marlin内核。

吴育昕在另一个问题下称,“我们使用配备Infiniband的H800 GPU;它不如美国的高端GPU那么好,而且我们的显卡数量也处于劣势,但我们充分利用了每一张显卡!

有网友称,K2 Thinking似乎使用了过多的代币。杨植麟承认了这一现象,并解释道“当前版本中,我们优先考虑的是绝对性能而非代币效率。我们会尝试将效率纳入奖励机制,以便它能学习如何简化思考过程。”

有人质疑,K2 Thinking通过专门训练,以达到在高水平逻辑推理(HLE)测试中取得好成绩,但“它的高分似乎与实际使用中的智能水平不太相符。”

杨植麟回应称,“我们在提升智能体推理能力方面取得了一些进展,使其在HLE测试中得分较高。我们正在努力进一步提升其通用能力,以便在更多实际应用场景中充分发挥智能的作用。”

当网友询问“K2 Thinking培训费用只有460万美元是真的吗?”杨植麟回答道:“这并非官方数据,因为培训成本很难量化,其中很大一部分用于研究和实验。”

在点赞最多的回答中,周昕宇透露,公司的新架构KDA(Kernel Attention Dual Architecture)能让模型获得更高的基准测试分数,而且速度更快、效率更高,从而使我们能够更快地进行预训练、更快地部署到强化学习中,并服务更多用户。

周昕宇表示,“我们正在开发更多改进方案,完成后会与大家分享。”杨植麟也补充道:“KDA是我们最新的实验性架构,与KDA相关的想法很可能会在K3中得到应用。”

在被追问何时推出K3模型的问题中,杨植麟还调侃了OpenAI的首席执行官萨姆·奥尔特曼,他回应称,肯定能在“萨姆价值万亿美元的数据中心建成之前”推出K3模型。

有网友询问对“OpenAI为什么会烧掉这么多钱”的看法,周昕宇称“不知道。只有萨姆自己知道。我们有自己的方式和节奏。”周昕宇还提到,月之暗面没有人工智能浏览器的计划,因为“不需要去套一层新的Chromium壳”。

当被问及公司有没有“视觉-语言模型(VL)的计划时”,杨植麟写道:“是的,我们正在努力。敬请期待!”

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
后悔也晚了!大批F35逼到家门口,伊朗却发现红旗9和歼10还未到位

后悔也晚了!大批F35逼到家门口,伊朗却发现红旗9和歼10还未到位

古史青云啊
2026-01-26 19:17:58
美媒:特朗普的前白宫新闻秘书请求他“不要一意孤行”,应将ICE撤出明尼苏达州

美媒:特朗普的前白宫新闻秘书请求他“不要一意孤行”,应将ICE撤出明尼苏达州

环球网资讯
2026-01-26 08:57:09
3人携带“观音王”茶叶入境澳洲被拦,恐判终身监禁!

3人携带“观音王”茶叶入境澳洲被拦,恐判终身监禁!

澳洲红领巾
2026-01-25 13:36:28
返乡跨省大单火了!5800公里赚 3.48 万,司机:订单结束手都在抖

返乡跨省大单火了!5800公里赚 3.48 万,司机:订单结束手都在抖

石辰搞笑日常
2026-01-26 13:38:42
我错了?疑似错判点燃浙江总经理怒火,中国头号裁判惨遭前辈输出

我错了?疑似错判点燃浙江总经理怒火,中国头号裁判惨遭前辈输出

体坛野秀才
2026-01-26 00:43:29
Wright:乌度卡告诉我,交易截止日前,火箭没有引进控卫的打算

Wright:乌度卡告诉我,交易截止日前,火箭没有引进控卫的打算

移动挡拆
2026-01-26 20:44:25
充分适应快船的打法后,锋线大将如今已经成为了顶级3D球员?

充分适应快船的打法后,锋线大将如今已经成为了顶级3D球员?

稻谷与小麦
2026-01-26 22:57:22
羁绊!他9天前亚洲杯失点致队被U23国足淘汰,今绝平国足找回面子

羁绊!他9天前亚洲杯失点致队被U23国足淘汰,今绝平国足找回面子

我爱英超
2026-01-26 23:47:10
喜讯!申花中卫位置下个月迎来久违强援,26岁的他归队挑大梁

喜讯!申花中卫位置下个月迎来久违强援,26岁的他归队挑大梁

张丽说足球
2026-01-26 11:09:10
泪目!拜合拉木能入选中国队原因曝光,国足选人标准应大变革

泪目!拜合拉木能入选中国队原因曝光,国足选人标准应大变革

世界多元
2026-01-24 17:27:29
新干线上外国乘客的行李箱掉下砸到日本女性头部,语言不通无法和解造成列车晚点

新干线上外国乘客的行李箱掉下砸到日本女性头部,语言不通无法和解造成列车晚点

日本物语
2026-01-25 20:32:37
央视披露:太原舰遭美舰高速逼近,全舰拉响警报导弹进入待命状态

央视披露:太原舰遭美舰高速逼近,全舰拉响警报导弹进入待命状态

阿龙聊军事
2026-01-26 20:40:50
俞敏洪发布严正声明

俞敏洪发布严正声明

新京报政事儿
2026-01-26 12:42:34
末节打破僵局,华南虎主场98-89战胜天津

末节打破僵局,华南虎主场98-89战胜天津

广东华南虎
2026-01-26 23:59:18
黄仁勋现身北京王府井吃云南菜,店长:点了小锅米线、石屏包浆豆腐、清炒甜豌豆,还加了一壶普洱茶

黄仁勋现身北京王府井吃云南菜,店长:点了小锅米线、石屏包浆豆腐、清炒甜豌豆,还加了一壶普洱茶

极目新闻
2026-01-26 15:54:51
“女儿被人骑了一圈”,浙江家长情绪崩溃:那个小男孩把她当马

“女儿被人骑了一圈”,浙江家长情绪崩溃:那个小男孩把她当马

泽泽先生
2026-01-18 21:18:06
为什么设计院和施工单位挤满了平庸又懦弱到令人发指的高学历穷人

为什么设计院和施工单位挤满了平庸又懦弱到令人发指的高学历穷人

黯泉
2026-01-26 23:34:56
集体倒戈!特朗普,彻底演砸了!

集体倒戈!特朗普,彻底演砸了!

大嘴说天下
2026-01-25 20:34:37
全新保时捷卡宴系列官宣!酷似幽灵设计,颜值很飒很有型

全新保时捷卡宴系列官宣!酷似幽灵设计,颜值很飒很有型

米粒说车唯一呀
2026-01-25 16:52:13
《我是刑警》原型,四人血洗煤矿、兄弟相残,鹤岗128案真相还原

《我是刑警》原型,四人血洗煤矿、兄弟相残,鹤岗128案真相还原

史记趣闻
2025-01-08 20:50:03
2026-01-27 00:39:00
科创板日报 incentive-icons
科创板日报
上海报业集团主管主办
61360文章数 44540关注度
往期回顾 全部

科技要闻

印奇再上牌桌,阶跃融资50亿

头条要闻

女子被丈夫和闺蜜背叛一夜白头:听到儿子叫第三者妈妈

头条要闻

女子被丈夫和闺蜜背叛一夜白头:听到儿子叫第三者妈妈

体育要闻

叛逆的大公子,要砸了贝克汉姆这块招牌

娱乐要闻

张雨绮被抵制成功!辽视春晚已将她除名

财经要闻

从美式斩杀线看中国社会的制度韧性构建

汽车要闻

宾利第四台Batur敞篷版发布 解锁四项定制创新

态度原创

本地
艺术
时尚
公开课
军事航空

本地新闻

云游中国|格尔木的四季朋友圈,张张值得你点赞

艺术要闻

沙特急刹车,NEOM规模大缩水,线性摩天楼留小段

甜了10年,超多暧昧细节,全网求他俩原地结婚

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

委代总统称遭美威胁:马杜罗已死

无障碍浏览 进入关怀版