![]()
昨天,可灵AI 官宣正式迈入「3.0 时代」,围绕视频与图片两大核心能力进行全面升级,重点提升叙事能力、可控性、一致性与画质表现,并首次引入多模态一体化的原生创作流程。
根据谷歌发布的2025年第四季度财报,其人工智能聊天机器人Gemini的月活跃用户(MAU)已突破7.5亿。这一数字表明Gemini迅速被消费者接受,并已迅速成为人工智能领域的重要参与者。
过去一天,国内外AI行业还有更多热点可以关注,硅基君带你一起看看。
大模型
1)OpenAI「备战负责人」官宣上任,加速布局前沿模型风险防护
昨天,OpenAI CEO 山姆 · 奥特曼(Sam Altman)宣布 Dylan Scand 加入公司,出任全新的「备战负责人」(Head of Preparedness)一职,负责前沿模型的高风险场景评估与缓解工作。
奥特曼称,Scandrett 是该岗位「迄今为止最合适的人选」,并强调他将主导 OpenAI 针对潜在高影响风险的准备与防护工作,包括对前沿 AI 系统可能带来的严重威胁进行评估、建模与应对。
2)面壁智能发布 MiniCPM-o 4.5
昨天,面壁智能正式开源新一代全模态旗舰模型MiniCPM-o 4.5。据介绍,该模型以 9B 参数体量实现全模态、全双工、端到端的交互能力,定位为行业首个支持「即时自由对话」的大模型,旨在让 AI 从传统的「对讲机式」回合交互迈向类人连续感知与主动表达。MiniCPM-o 4.5 的核心升级集中在三方面:
全模态全时感知能力,模型在输出内容的同时仍可持续「看」与「听」,避免信息丢失;
原生全双工交互机制,模型无需依赖VAD 等外部工具即可根据环境变化自主判断发言时机,实现主动提醒、主动评论等能力;
语音生成质量全面提升,音色、情绪与拟人度均更自然,长语音合成稳定性显著增强,同时支持基于数秒样本的声音克隆。
MiniCPM-o 4.5 已在 GitHub、Hugging Face 等平台开源,并提供 int4 与 GGUF 在内的多种量化版本,支持 llama.cpp、Ollama、vLLM、SGLang 等推理框架。
3)可灵 AI 发布 3.0 版本:视频与图片能力全面升级
昨天,可灵AI 官宣正式迈入「3.0 时代」,围绕视频与图片两大核心能力进行全面升级,重点提升叙事能力、可控性、一致性与画质表现,并首次引入多模态一体化的原生创作流程。
可灵AI 表示,本次更新覆盖从生成到编辑的完整链路,旨在让创作者以更低门槛获得电影级叙事体验。更新内容包括视频 3.0、视频 3.0 Omni、图片 3.0、图片 3.0 Omni 四大模块。
AI应用
1)谷歌的Gemini应用月活跃用户已超过7.5亿
根据谷歌发布的2025年第四季度财报,其人工智能聊天机器人Gemini的月活跃用户(MAU)已突破7.5亿。这一数字表明Gemini迅速被消费者接受,并已迅速成为人工智能领域的重要参与者。
上个季度,谷歌公布Gemini的月活跃用户数达到6.5亿,表明其在短时间内实现了显著增长。相比之下,Meta AI的月活跃用户数接近5亿。然而,尽管Gemini正在迅速发展,但仍落后于其最大的竞争对手ChatGPT,后者预计到2025年底的月活跃用户数将达到约8.1亿。
投融资情报
1)Positron 完成 2.3 亿美元融资
据TechCrunch 报道,半导体创业公司 Positron 近日完成 2.3 亿美元 B 轮融资。今年的这笔融资由卡塔尔投资局(QIA)参与,相关人士称资金将用于加速其高速内存芯片的部署。
PS:如果你对AI大模型领域有独特的看法,欢迎扫码加入我们的大模型交流群。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.