每周重要AI事件总结
看这篇就够了
1.中国团队证实AI可自发形成人类级认知
6月9日,中科院自动化所联合脑智卓越中心在《自然-机器智能》发表了一项有趣的研究:他们发现当下热门的“图文双修 ” AI(多模态大语言模型),竟然像人类一样学会了给物品分类。这项由杜长德团队主导,何慧光、常乐研究员指导的工作,让 AI 的 “ 思考方式”研究迈上新台阶。
技术要点
研究团队借鉴了心理学经典的“三选一”测试(比如让 AI 从“猫、狗、香蕉”中挑出不同类),通过分析 470 万次测试结果,绘制出AI的“认知地图”。他们发现 AI 形成了 66 种分类标准,这些标准与人脑处理”人脸""场景"的区域高度吻合。在测试了 Gemini 、通义千问等主流模型后发现,能同时理解图片和文字的 Al ,其分类逻辑比单模态 AI 更接近人类。
重要性
这项研究提供了首个证据,证明 AI 模型无需明确训练即可自发形成类似人类的复杂认知能力,为 AI 认知科学和类人智能系统的开发提供了理论基础。这一发现可能推动 AI 在理解、推理和交互方面的进步,同时也引发了关于 AI 认知极限和伦理的讨论。
2. OpenAI正式发布o3-pro
6月10日,OpenAI 正式发布了 o3-pro ,一款基于其 o3 AI 推理模型的升级版本。o3-pro 通过逐步推理的方式解决复杂问题,在物理学、数学和编程等领域展现出卓越性能。该模型已向 ChatGPT Pro 和 Team 用户开放, Enterprise 和 Edu 用户将于次周获得访问权限,同时通过开发者 API 提供,标志着 OpenAI 在 AI 技术领域的又一重要里程碑。
技术要点
推理能力:o3-pro 采用分步推理机制,显著提升了在复杂任务中的可靠性和准确性,特别适用于需要多步推理的场景,如数学证明和编程任务
工具集成:支持多种工具,包括网络搜索、文件分析、视觉推理、Python编程以及基于记忆的个性化响应,增强了模型的多功能性
性能表现:根据 OpenAI 内部测试,o3-pro 在AIME 2024(数学技能评估)中超越 Google 的 Gemini 2.5 Pro,在 GPQA Diamond(博士级科学知识测试)中击败 Anthropic 的 Claude 4 Opus
用户偏好:专家评估显示,o3-pro 在清晰度、完整性、指令遵循性和准确性方面优于 o3,尤其在科学、教育、编程、商业和写作辅助等领域表现突出
可用性与定价:o3-pro 已向 ChatGPT Pro 和 Team 用户开放,替换了 o1-pro 模型;开发者API定价为每百万输入令牌 20 美元,每百万输出令牌 80 美元(约 750,000 字,相当于《战争与和平》的长度)
限制:响应时间较 o1-pro 更长;暂不支持图像生成或 OpenAI 的 AI 驱动工作空间 Canvas;由于技术问题,ChatGPT 中的临时聊天功能被禁用
重要性
o3-pro 的发布标志着 OpenAI 在 AI 推理能力方面的重大突破。其卓越的基准测试表现和多功能工具集成使其在学术和实际应用中均具有显著优势。这一进展不仅巩固了 OpenAI 在 AI 领域的领先地位,还在与 Google、Anthropic 等竞争对手的较量中占据了有利位置。用户反馈和行业讨论(如X平台上的热议)表明,o3-pro 被视为接近通用人工智能(AGI)的重要一步,引发了广泛关注。o3-pro 的发布还反映了AI技术向更复杂、更可靠方向发展的趋势,可能推动行业在教育、科研和商业领域的创新应用。
山石网科是中国网络安全行业的技术创新领导厂商,由一批知名网络安全技术骨干于2007年创立,并以首批网络安全企业的身份,于2019年9月登陆科创板(股票简称:山石网科,股票代码:688030)。
现阶段,山石网科掌握30项自主研发核心技术,申请560多项国内外专利。山石网科于2019年起,积极布局信创领域,致力于推动国内信息技术创新,并于2021年正式启动安全芯片战略。2023年进行自研ASIC安全芯片的技术研发,旨在通过自主创新,为用户提供更高效、更安全的网络安全保障。目前,山石网科已形成了具备“全息、量化、智能、协同”四大技术特点的涉及基础设施安全、云安全、数据安全、应用安全、安全运营、工业互联网安全、信息技术应用创新、安全服务、安全教育等九大类产品服务,50余个行业和场景的完整解决方案。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.