网易首页 > 网易号 > 正文 申请入驻

Deep Cogito 推出混合型 AI "推理"模型

0
分享至

一家名为 Deep Cogito 的新公司近期揭开面纱,推出了一系列可以在"推理"和非推理模式之间切换的开放 AI 模型。

像 OpenAI 的 o1 这样的推理模型在数学和物理等领域展现出巨大潜力,这要归功于它们能够通过逐步解决复杂问题来进行自我验证的能力。然而,这种推理能力是有代价的:更高的计算成本和延迟。这就是为什么像 Anthropic 这样的实验室正在追求"混合"模型架构,将推理组件与标准的非推理元素相结合。混合模型可以快速回答简单问题,同时在处理更具挑战性的问题时投入更多时间思考。

Deep Cogito 的所有模型(称为 Cogito 1)都是混合模型。该公司声称,这些模型的性能优于同等规模的最佳开放模型,包括来自 Meta 和中国 AI 初创公司 DeepSeek 的模型。

该公司在博客文章中解释道:"每个模型都可以直接回答问题,或在回答前进行自我反思(类似推理模型)。所有这些都是由一个小团队在大约 75 天内开发完成的。"

Cogito 1 模型的参数规模从 30 亿到 700 亿不等,该公司表示,在未来几周和几个月内,将会推出参数规模达到 6710 亿的模型。参数数量大致对应于模型的问题解决能力,通常参数越多越好。

需要说明的是,Cogito 1 并非从零开始开发。Deep Cogito 是在 Meta 的开源 Llama 和阿里巴巴的 Qwen 模型基础上构建的。该公司表示,他们应用了新颖的训练方法来提升基础模型的性能,并实现可切换的推理能力。

根据 Cogito 的内部基准测试结果,最大的 Cogito 1 模型——启用推理功能的 Cogito 70B,在某些数学和语言评估中的表现优于 DeepSeek 的 R1 推理模型。在禁用推理功能的情况下,Cogito 70B 在通用 AI 测试 LiveBench 上的表现也超过了 Meta 最近发布的 Llama 4 Scout 模型。

所有 Cogito 1 模型都可以通过 Fireworks AI 和 Together AI 这两家云服务提供商的 API 下载或使用。

"目前,我们仍处于扩展曲线的早期阶段,仅使用了传统大语言模型后期/持续训练所需计算资源的一小部分,"Cogito 在其博客文章中写道。"展望未来,我们正在研究互补的后期训练方法来实现自我提升。"

根据加利福尼亚州的文件显示,总部位于旧金山的 Deep Cogito 成立于 2024 年 6 月。该公司的 LinkedIn 页面列出了两位联合创始人:Drishan Arora 和 Dhruv Malhotra。Malhotra 此前是 Google AI 实验室 DeepMind 的产品经理,负责生成式搜索技术。Arora 曾是 Google 的高级软件工程师。

根据 PitchBook 的信息,Deep Cogito 的投资方包括 South Park Commons,该公司雄心勃勃地致力于构建"通用超级智能"。公司创始人将这个术语理解为能够比大多数人更好地完成任务,并"发现我们尚未想象到的全新能力"的 AI。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
韩国西瓜大涨价,单个西瓜卖到136元

韩国西瓜大涨价,单个西瓜卖到136元

界面新闻
2026-05-19 12:46:17
菲总统称不希望卷入任何与台湾有关的战争,外交部回应

菲总统称不希望卷入任何与台湾有关的战争,外交部回应

澎湃新闻
2026-05-19 15:36:29
重磅:乌克兰摧毁俄罗斯第三大城市叶卡捷琳堡的能源枢纽!

重磅:乌克兰摧毁俄罗斯第三大城市叶卡捷琳堡的能源枢纽!

项鹏飞
2026-05-19 20:31:45
国家电影局介入!电影撤档,主演账号被封,汪涵周冬雨姚晨跑不掉

国家电影局介入!电影撤档,主演账号被封,汪涵周冬雨姚晨跑不掉

谭谈社会
2026-05-19 22:49:47
马斯克前脚刚走,78岁母亲随口一句话,让中国网友集体破防

马斯克前脚刚走,78岁母亲随口一句话,让中国网友集体破防

史行途
2026-05-20 00:13:07
上海交大樊同学,高中保送到交大,又转到高分专业,计划进体制内

上海交大樊同学,高中保送到交大,又转到高分专业,计划进体制内

汉史趣闻
2026-05-19 14:34:42
正常人都看出不对劲了,他们还在“装瞎”

正常人都看出不对劲了,他们还在“装瞎”

走读新生
2026-05-18 20:34:55
泰国内阁决定取消60天免签政策

泰国内阁决定取消60天免签政策

新京报
2026-05-19 19:56:06
黄巢诗火遍全网:千年暴力悲歌的回响,是时代最该警惕的警钟

黄巢诗火遍全网:千年暴力悲歌的回响,是时代最该警惕的警钟

土家铁拳
2026-05-19 21:30:59
英超历史冠军排行:曼联13冠居首,阿森纳4次夺冠位列第四

英超历史冠军排行:曼联13冠居首,阿森纳4次夺冠位列第四

懂球帝
2026-05-20 05:01:11
1-2,热刺4轮不败终结,保级形势不容乐观,最后一轮取胜难度很大

1-2,热刺4轮不败终结,保级形势不容乐观,最后一轮取胜难度很大

侧身凌空斩
2026-05-20 05:09:41
柳州再发5.2级地震,前世界冠军吴柳芳为家乡捐款两万元,称“刚把欠的40万还完,现在刚刚缓过一口气,这次尽我自己所能”

柳州再发5.2级地震,前世界冠军吴柳芳为家乡捐款两万元,称“刚把欠的40万还完,现在刚刚缓过一口气,这次尽我自己所能”

扬子晚报
2026-05-19 10:51:26
博主揭国产芯片大厂乱象,近70%工作靠外包,自研乏力内耗严重

博主揭国产芯片大厂乱象,近70%工作靠外包,自研乏力内耗严重

风向观察
2026-05-19 23:55:25
“体制内都不敢这么喝!”大学生每天一杯瑞幸被举报,哭诉反被嘲

“体制内都不敢这么喝!”大学生每天一杯瑞幸被举报,哭诉反被嘲

妍妍教育日记
2026-05-19 16:26:29
中国U17男足战胜澳大利亚队,时隔22年再次闯入亚洲杯决赛

中国U17男足战胜澳大利亚队,时隔22年再次闯入亚洲杯决赛

澎湃新闻
2026-05-20 05:44:05
200万!华为系“迈巴赫”,6月正式上市!

200万!华为系“迈巴赫”,6月正式上市!

新浪财经
2026-05-19 20:53:18
为啥特朗普抛涉台“四不”说法?鲁比奥用大白话解释了

为啥特朗普抛涉台“四不”说法?鲁比奥用大白话解释了

海峡导报社
2026-05-19 17:44:37
美媒集体震惊:这次访华,才真正见识到中国有多可怕!

美媒集体震惊:这次访华,才真正见识到中国有多可怕!

达文西看世界
2026-05-19 11:49:16
安切洛蒂的赌局:34岁内马尔凭什么挤掉英超20球神锋?

安切洛蒂的赌局:34岁内马尔凭什么挤掉英超20球神锋?

落夜足球
2026-05-19 10:45:08
挺进决赛!U17国足2比0完胜澳大利亚,将与日本队争冠!

挺进决赛!U17国足2比0完胜澳大利亚,将与日本队争冠!

足球报
2026-05-20 04:30:59
2026-05-20 07:52:49
至顶科技 incentive-icons
至顶科技
科技产业媒体与 AI 产业服务机构
18594文章数 49705关注度
往期回顾 全部

科技要闻

马斯克败诉,法院判他起诉OpenAI太晚了

头条要闻

伊朗最新和平方案披露 浓缩铀只能运往俄罗斯

头条要闻

伊朗最新和平方案披露 浓缩铀只能运往俄罗斯

体育要闻

文班亚马:没拿到MVP,就证明自己是MVP

娱乐要闻

姚晨删博难平众怒,为什么她还能蹦哒

财经要闻

白酒榜|汾酒营收净利双增 口子窖"造富"

汽车要闻

焕新极氪009上市41.38万起 齐家版让MPV回归家庭

态度原创

健康
游戏
亲子
房产
军事航空

专家揭秘干细胞回输的安全风险

难道反转了?《GTA6》已在游戏电商平台开放预售!

亲子要闻

妈妈你看!娜塔莎生孩子了!暴力擦边影响心智尚未成熟的未成年人

房产要闻

7516元/㎡,161套一次全甩!海口住宅最低价出现了!

军事要闻

特朗普暂缓打击伊朗 称系应中东三国请求

无障碍浏览 进入关怀版