网易首页 > 网易号 > 正文 申请入驻

Deep Cogito 推出混合型 AI "推理"模型

0
分享至

一家名为 Deep Cogito 的新公司近期揭开面纱,推出了一系列可以在"推理"和非推理模式之间切换的开放 AI 模型。

像 OpenAI 的 o1 这样的推理模型在数学和物理等领域展现出巨大潜力,这要归功于它们能够通过逐步解决复杂问题来进行自我验证的能力。然而,这种推理能力是有代价的:更高的计算成本和延迟。这就是为什么像 Anthropic 这样的实验室正在追求"混合"模型架构,将推理组件与标准的非推理元素相结合。混合模型可以快速回答简单问题,同时在处理更具挑战性的问题时投入更多时间思考。

Deep Cogito 的所有模型(称为 Cogito 1)都是混合模型。该公司声称,这些模型的性能优于同等规模的最佳开放模型,包括来自 Meta 和中国 AI 初创公司 DeepSeek 的模型。

该公司在博客文章中解释道:"每个模型都可以直接回答问题,或在回答前进行自我反思(类似推理模型)。所有这些都是由一个小团队在大约 75 天内开发完成的。"

Cogito 1 模型的参数规模从 30 亿到 700 亿不等,该公司表示,在未来几周和几个月内,将会推出参数规模达到 6710 亿的模型。参数数量大致对应于模型的问题解决能力,通常参数越多越好。

需要说明的是,Cogito 1 并非从零开始开发。Deep Cogito 是在 Meta 的开源 Llama 和阿里巴巴的 Qwen 模型基础上构建的。该公司表示,他们应用了新颖的训练方法来提升基础模型的性能,并实现可切换的推理能力。

根据 Cogito 的内部基准测试结果,最大的 Cogito 1 模型——启用推理功能的 Cogito 70B,在某些数学和语言评估中的表现优于 DeepSeek 的 R1 推理模型。在禁用推理功能的情况下,Cogito 70B 在通用 AI 测试 LiveBench 上的表现也超过了 Meta 最近发布的 Llama 4 Scout 模型。

所有 Cogito 1 模型都可以通过 Fireworks AI 和 Together AI 这两家云服务提供商的 API 下载或使用。

"目前,我们仍处于扩展曲线的早期阶段,仅使用了传统大语言模型后期/持续训练所需计算资源的一小部分,"Cogito 在其博客文章中写道。"展望未来,我们正在研究互补的后期训练方法来实现自我提升。"

根据加利福尼亚州的文件显示,总部位于旧金山的 Deep Cogito 成立于 2024 年 6 月。该公司的 LinkedIn 页面列出了两位联合创始人:Drishan Arora 和 Dhruv Malhotra。Malhotra 此前是 Google AI 实验室 DeepMind 的产品经理,负责生成式搜索技术。Arora 曾是 Google 的高级软件工程师。

根据 PitchBook 的信息,Deep Cogito 的投资方包括 South Park Commons,该公司雄心勃勃地致力于构建"通用超级智能"。公司创始人将这个术语理解为能够比大多数人更好地完成任务,并"发现我们尚未想象到的全新能力"的 AI。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
孙宇晨九亿美元灰飞烟灭,地表最强也难逃被收割的命运!

孙宇晨九亿美元灰飞烟灭,地表最强也难逃被收割的命运!

大秦共和国
2026-04-23 13:03:21
定了!5月1日起,医生收“红包回扣”不再是违规,直接算犯罪

定了!5月1日起,医生收“红包回扣”不再是违规,直接算犯罪

生活魔术专家
2026-04-24 16:41:31
被挤爆!佛山首家山姆来了!顺德店开业直击!购物车都堆成山?!

被挤爆!佛山首家山姆来了!顺德店开业直击!购物车都堆成山?!

乐居好房
2026-04-24 14:47:33
震惊!徐向前揭露西安事变背后的惊天秘密!

震惊!徐向前揭露西安事变背后的惊天秘密!

鉴史录
2026-04-23 00:15:03
中日关系冰封 5 个月的死局,被日本用一招谁都没料到的棋

中日关系冰封 5 个月的死局,被日本用一招谁都没料到的棋

果妈聊娱乐
2026-04-24 07:27:25
限制特朗普战争权力议案,第五次被否决

限制特朗普战争权力议案,第五次被否决

南方都市报
2026-04-23 21:32:58
媒体人:四川女篮主力外援坎贝奇大概率缺席WCBA总决赛G5

媒体人:四川女篮主力外援坎贝奇大概率缺席WCBA总决赛G5

懂球帝
2026-04-24 11:01:14
不再是120/80,“新血压标准”已公布,别再自己吓自己!

不再是120/80,“新血压标准”已公布,别再自己吓自己!

芹姐说生活
2026-04-14 23:27:03
3艘俄军舰被炸沉!局势触及核红线,美方:俄罗斯或动用核武器!

3艘俄军舰被炸沉!局势触及核红线,美方:俄罗斯或动用核武器!

健身狂人
2026-04-23 15:46:53
27%!16%!客场不敌猛龙,骑士揪出最大水货,他真不值1410万年薪

27%!16%!客场不敌猛龙,骑士揪出最大水货,他真不值1410万年薪

麦子的篮球故事
2026-04-24 16:24:17
卖国求财!稀土老总7项机密被境外买走,美国F-35差点被开卷考试

卖国求财!稀土老总7项机密被境外买走,美国F-35差点被开卷考试

菁菁子衿
2026-04-23 09:16:23
震惊!广州一互联网公司招5名文员,收到4000余份简历,HR慌了…

震惊!广州一互联网公司招5名文员,收到4000余份简历,HR慌了…

火山詩话
2026-04-23 16:46:58
14年前拿U型锁砸人的蔡洋:2022年出狱,找不到工作靠打零工为生

14年前拿U型锁砸人的蔡洋:2022年出狱,找不到工作靠打零工为生

天天热点见闻
2026-04-21 05:15:28
福建永安这个男保安,扇了不能扇的人…

福建永安这个男保安,扇了不能扇的人…

媒体人溪婉
2026-04-24 13:50:51
个人获赔1.2亿元!江苏这个案例创国内之最

个人获赔1.2亿元!江苏这个案例创国内之最

现代快报
2026-04-23 18:03:34
森林狼3将身价暴涨!戈贝尔强防守,道苏姆奇兵,迪温琴佐迎蜕变

森林狼3将身价暴涨!戈贝尔强防守,道苏姆奇兵,迪温琴佐迎蜕变

篮球资讯达人
2026-04-24 13:08:49
阿瑙托维奇:因疫情在中国隔离至抑郁,最终选择重返欧洲

阿瑙托维奇:因疫情在中国隔离至抑郁,最终选择重返欧洲

懂球帝
2026-04-23 08:32:10
任何一艘美航母上,都要带足大量女兵?她们在航母上有什么作用?

任何一艘美航母上,都要带足大量女兵?她们在航母上有什么作用?

探源历史
2026-04-06 04:10:07
2009年孔东梅偶遇蒋孝严,面对祖坟被挖的半世纪世仇,毛蒋后人仅用四字破局震惊全场!

2009年孔东梅偶遇蒋孝严,面对祖坟被挖的半世纪世仇,毛蒋后人仅用四字破局震惊全场!

寄史言志
2026-04-23 22:43:11
巅峰时的十三爷胤祥,权力到底有多大?雍正:他若反,我只能等死

巅峰时的十三爷胤祥,权力到底有多大?雍正:他若反,我只能等死

凡人侃史
2026-04-23 23:08:50
2026-04-24 18:19:00
至顶头条 incentive-icons
至顶头条
记录和推动数字化创新
17960文章数 49700关注度
往期回顾 全部

科技要闻

DeepSeek V4牵手华为,价格依然"屠夫级"

头条要闻

媒体:伊朗将恢复往返中国航班 霍尔木兹决战或收兵了

头条要闻

媒体:伊朗将恢复往返中国航班 霍尔木兹决战或收兵了

体育要闻

里程碑之战拖后腿,哈登18分8失误

娱乐要闻

停工16个月!赵露思证实接拍新剧

财经要闻

19家企业要"铝代铜",格力偏不

汽车要闻

零跑Lafa5 Ultra北京车展上市:11.88-12.48万

态度原创

教育
家居
数码
本地
公开课

教育要闻

山东省“书香校园”联盟成立

家居要闻

自然肌理 温润美学

数码要闻

一英寸口袋云台相机!大疆Osmo Pocket 4图赏

本地新闻

云游中国|逛世界风筝都 留学生探秘中国传统文化

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版