网易首页 > 网易号 > 正文 申请入驻

景联文AI观察动态速递 第3期

0
分享至



大厂模型动态

1.OpenAI发布了GPT - 5.1(Instant & Thinking),主打“智商情商”双重升级,首次引入「自适应推理」,平衡速度与深度,新模型对话风格更“有人味”,个性化设置大升级。同时发布了首款 AI 浏览器ChatGPT Atlas,其 Agent 模式可“接管”鼠标完成跨网页多步骤任务。未来几周,ChatGPT 新版本将引入“个性”,12 月将推行年龄分级系统。此外,还小范围测试了 ChatGPT 群聊功能。

2.谷歌发布了Gemini 3,相比去年的 Gemini 2 有巨大飞跃,在主流 AI 基准测试中超越前代及竞品。它具有多模态理解能力强、推理能力出色、编码能力优秀等特点,还推出了“生成式 UI”变革搜索,Agent 实用性增强。谷歌还发布了视频模型Veo - 3.1,挑战 OpenAI Sora 2,具备原生音频注入、场景手术刀等关键特性。另外,谷歌的 NotebookLM 新增图像识别功能和 Deep Research 功能。

3.Meta从 2026 年起将“AI 驱动的影响”纳入员工绩效核心指标,鼓励员工使用内部 AI 聊天机器人 Metamate,允许部分求职者在编码面试中使用 AI 助手。

4.阿里千问 APP 公测版上线,以Qwen3模型为底座,将覆盖多个生活场景。

5.小米推出“大模型 + 智能家居”解决方案Xiaomi Miloco,以自研大语言模型MiMo - VL - Miloco - 7B为核心,支持视觉数据的设备端理解保障隐私安全。

6.马斯克的 xAI 发布了Grok 4.1,在 LMArena 排行榜上成绩优异,在情商测试、创意写作等方面表现出色,且减少了幻觉问题。

其他公司模型动态

1.贝佐斯创立的Project Prometheus首轮获 62 亿美元融资,研究将 AI 应用于物理任务。

2.Physical Intelligence发布了最新机器人基础模型π*0.6,采用 Recap 方法提升具身智能成功率和处理效率。

3.MiniMaxM2推出 9.9 元编程套餐,在 OpenRouter 平台 token 调用量全球 Top5。

4.PixVerse上线升级版V5 Fast及「Modify」精修功能,视频生成速度提升超 30%。

5.蚂蚁集团推出全模态通用 AI 助手「灵光」,支持自然语言 30 秒生成小应用。

6.Gambo AI推出“氛围编程”Agent,输入一句话 5 - 10 分钟生成可商业化发布的完整游戏。

7.前 Meta 员工创立的Sandbar发布Stream 智能戒指,专注 AI 语音交互。

最新开源模型(含框架、平台、工具、方案、Agent 开发、Robotics 开发)

1.自研开源大模型VibeThinker仅 15 亿参数,采用“频谱到信号原理”(SSP)方法训练,在国际顶级数学竞赛基准测试上击败参数量是其数百倍的模型,后训练总成本仅 7800 美元,成本效益比达 30 到 60 倍。

2.MiroMind推出开源智能体基座模型MiroThinker v1.0,提出“深度交互 Scaling”维度,支持 256K 上下文和 600 轮工具调用,在 BrowseComp 测试中准确率达 47.1%,逼近 OpenAI DeepResearch 的 51.5%,中文任务 BrowseComp - ZH 超越 DeepSeek - v3.2 达 7.7 个百分点。

3.陈天桥盛大团队推出面向 AI 的长期记忆操作系统EverMemOS,在评测集上成绩优异,超越 SOTA 水平,系统受人脑记忆机制启发,有四层架构,解决纯文本相似度检索难题,已在 Github 开源。

4.腾讯内容算法中心联合清华大学提出ReSeek 框架,重塑 Search Agent 核心逻辑,引入动态自我修正机制避免“一条路走到黑”,在 3B 和 7B 参数规模上达业界领先平均性能。

5.美团 LongCat 团队联合多所顶尖高校推出包含 50 道原创 IMO 级别难题的新基准AMO - Bench,用于评估 LLM 数学推理能力,顶级模型在该基准测试中表现不佳,但展示了提升空间。

6.阿里通义实验室推出自进化 agent 系统AgentEvolver,包含自我提问、自我导航、自我归因三个协同机制,在 AppWorld 和 BFCL - v3 基准测试中表现出色,实现了更高效的探索、更好的样本利用和更快的适应,且代码开源。

7.微软研究院提出全新推理范式AsyncThink,让大语言模型从单打独斗的推理者进化成会带团队的项目经理,在多解 Countdown 任务、数学竞赛推理等方面表现优异,具备跨领域泛化能力。

8.北京大学团队AI - Newton 系统用符号回归方法,无监督、无先验知识下重新发现基础物理定律,由知识库支持,平均识别多个物理概念和定律,为 AI 驱动科学发现提供新范式。

数据加工范式、数据需求态势

1.斑马口语针对 6 - 12 岁儿童英语口语场景深度定制 AI 外教,积累大量孩子发音和真人外教教学数据,构建专项数据集用于 AI 外教学习。

2.ReSeek 框架构建了FictionalHot 数据集,用于公正评估智能体推理能力,消除“数据污染”问题。

3.OpenAI提出训练权重稀疏的 Transformer 模型,从头训练易解释模型以理解更复杂的模型,该方法涉及数据训练和模型优化。

4.RL 赋能搜索涉及多种训练范式和奖励设计,数据在其中用于训练智能体,包括 SFT 冷启动、RL 微调等,奖励函数从单一到多维演进。

报告观点(机构报告、白皮书、调研、高管/学者观点)

1.CB Insights 报告指出 2024 年 AI Agent 创业公司融资总额增长,Voice AI 成增长最快赛道,Coding AI Agents 表现突出,Customer service AI 估值倍数高,Reasoning models 导致成本倒挂,2025 年收购案多,Agent 监控工具成企业刚需。

2.李飞飞认为 AGI 更像营销术语,当前 AI 最大短板是缺乏空间智能,阐述了世界模型三个核心能力,World Labs 发布的世界模型产品 Marble 已在多领域广泛应用,创作时间缩短 40 倍。

3.OpenAI提出训练稀疏模型使模型内部机制更易理解,找出“最小回路”量化可解释性,但研究处早期阶段,稀疏模型小且训练效率低。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
昔日钢铁洪流,今日骡马游行?拉胯的俄胜利日阅兵还能维持多久?

昔日钢铁洪流,今日骡马游行?拉胯的俄胜利日阅兵还能维持多久?

静夜史君
2026-05-03 23:59:38
耻辱!国乒再输瑞典,传来4个坏消息,两主力低迷,王励勤遭质疑

耻辱!国乒再输瑞典,传来4个坏消息,两主力低迷,王励勤遭质疑

眼底星碎
2026-05-04 00:56:44
掘金超市即将开张!戈登约翰逊等人或被交易 湖勇火船成潜在下家

掘金超市即将开张!戈登约翰逊等人或被交易 湖勇火船成潜在下家

罗说NBA
2026-05-04 05:33:46
台当局每年要撒币近15亿收买,斯威士兰这一“金元孤岛”还能撑多久

台当局每年要撒币近15亿收买,斯威士兰这一“金元孤岛”还能撑多久

海峡导报社
2026-05-04 08:09:17
台湾经济狂飙同比增长13.6%,创近39年新高

台湾经济狂飙同比增长13.6%,创近39年新高

凤眼论
2026-05-03 13:15:01
你家楼下的便利店老板们,已经笑不出来了。

你家楼下的便利店老板们,已经笑不出来了。

差评XPIN
2026-05-04 00:03:31
永久底层:硅谷的AI从业者普遍认为,普通人已经“完蛋了”。

永久底层:硅谷的AI从业者普遍认为,普通人已经“完蛋了”。

不懂经1人独角兽
2026-05-02 23:35:50
吓人!5年2.5亿顶薪!签了立刻砸手里

吓人!5年2.5亿顶薪!签了立刻砸手里

篮球教学论坛
2026-05-04 09:11:35
广州警方:庾某已被刑拘

广州警方:庾某已被刑拘

中国基金报
2026-05-03 22:52:43
山西五台山突降风雪,狂风裹着雪粒,驴友抱团搀扶行走,不少人被困搭帐篷过夜,亲历者:差点失温;当地:已护送下山,仍有人要上山被劝返

山西五台山突降风雪,狂风裹着雪粒,驴友抱团搀扶行走,不少人被困搭帐篷过夜,亲历者:差点失温;当地:已护送下山,仍有人要上山被劝返

极目新闻
2026-05-03 22:39:24
太扎心了!“火化不要灰”成热议话题,一组逝者名单多是30岁上下

太扎心了!“火化不要灰”成热议话题,一组逝者名单多是30岁上下

火山詩话
2026-05-03 12:43:57
遍地倒闭、批量合并!央企国企扎堆成立的数科公司,为啥死了大半

遍地倒闭、批量合并!央企国企扎堆成立的数科公司,为啥死了大半

细说职场
2026-05-03 20:11:19
年轻人累死累活挣三四千,老人拿七八千退休金,该如何解决?

年轻人累死累活挣三四千,老人拿七八千退休金,该如何解决?

猫叔东山再起
2026-05-02 10:40:17
亲日辱华、知三当三?这一次,57岁的陈红被儿子丈夫“害”惨了

亲日辱华、知三当三?这一次,57岁的陈红被儿子丈夫“害”惨了

凡知
2026-04-08 14:09:55
第二阶段打出6-3!世锦赛决赛吴宜泽占得先机,领先墨菲3局球

第二阶段打出6-3!世锦赛决赛吴宜泽占得先机,领先墨菲3局球

全景体育V
2026-05-04 05:44:53
中国最孤独的大使:一个人带着一条狗坚守三年,改善生活靠挖野菜

中国最孤独的大使:一个人带着一条狗坚守三年,改善生活靠挖野菜

西楼知趣杂谈
2026-05-02 21:21:03
温碧霞现身草蜢演唱会,疑似没穿内衣露尴尬点,丈夫看手机不理她

温碧霞现身草蜢演唱会,疑似没穿内衣露尴尬点,丈夫看手机不理她

童叔不飙车
2026-05-04 00:07:51
FCC全票封杀!中国实验室被禁,75%市场瞬间归零?反噬来得太快

FCC全票封杀!中国实验室被禁,75%市场瞬间归零?反噬来得太快

大卫聊科技
2026-05-03 12:56:27
国乒男团上上签:逃死亡半区 八强战韩国四强对法国 与日本争冠?

国乒男团上上签:逃死亡半区 八强战韩国四强对法国 与日本争冠?

念洲
2026-05-04 06:42:59
父母离世房产继承引手足矛盾,弟弟指责哥哥:他不配合执行判决

父母离世房产继承引手足矛盾,弟弟指责哥哥:他不配合执行判决

福建第一帮帮团
2026-05-03 19:00:54
2026-05-04 09:36:49
景联文科技
景联文科技
高质量数据生产运营商
403文章数 0关注度
往期回顾 全部

科技要闻

OpenAI“复活”了QQ宠物,网友直接玩疯

头条要闻

牛弹琴:特朗普大怒使出三板斧报复 德国还是怂了

头条要闻

牛弹琴:特朗普大怒使出三板斧报复 德国还是怂了

体育要闻

曼联3-2双杀利物浦!提前三轮锁定欧冠资格 梅努制胜

娱乐要闻

黄晓明五一带娃去游乐场 父子幸福同框

财经要闻

后巴菲特时代,首场股东会透露了啥

汽车要闻

同比大涨190% 方程豹4月销量29138台

态度原创

房产
本地
数码
手机
时尚

房产要闻

五一楼市彻底明牌!塔尖人群都在重仓凯旋新世界

本地新闻

用青花瓷的方式,打开西溪湿地

数码要闻

联合创新推出2410F 2026款显示器:FHD 120Hz屏仅599元

手机要闻

iPhone二十周年纪念版用四曲面 Pro系列跟进

快看!!这个女演员近日暴瘦!!哦,知道了……

无障碍浏览 进入关怀版