“AI红利的兑现,需要攻克自主可控、软硬一体、行业纵深和个性化四大关键核心。”
11月6日,在第八届世界声博会暨2025科大讯飞全球1024开发者节上,科大讯飞董事长刘庆峰指出,AI应更“懂人”,在技术飞速演进、能力持续增强的背景下,需让每个人都能借助AI发挥独特价值,推动世界从少数顶尖AI的同质化“内卷”,转向多元化、个性化的AI赋能。
刘庆峰以目前最热的人形机器人与AI智能体(Agent)为例称,首届机器人运动会被广泛吐槽为“玩具级”,正是因为机器人尚不能实现与人的自然交流,也未能将AI能力真正融入实际生活与工业场景。智能体同样面临挑战,尽管部分已实现API(应用接口)联动,但许多仍缺乏规范的账号体系、接口打通方案与行业深度理解,整体成熟度还有待提升。
![]()
11月6日,刘庆峰在开发者节介绍最新技术情况。
基于全国产算力平台,科大讯飞在长思维链强化学习训练效率与MoE模型全链路训练效率方面实现突破,深度推理训练效率从30%提升至84%以上,MoE(混合专家)模型全链路训练效率大幅提升。
在当天的发布会上,科大讯飞正式推出深度推理大模型——讯飞星火X1.5。该模型采用MoE架构,总参数量293B,激活参数30B,推理效率较上一代X1实现翻倍,在语言理解、文本生成、知识问答、逻辑推理、数学能力、代码能力等六大维度对标国际主流模型,数学能力持续领先,支持超130种语言,整体性能达到GPT-5的95%以上。
刘庆峰强调,科大讯飞始终以“自主可控对标国际顶尖、行业模型做到全球第一、多元模型成为世界第二选择”为目标。他表示:“确保不出现代差,就可以在最迫切需要的行业中实现超越”。
科大讯飞还首发了非自回归语音大模型架构,通过并行一次性输出整个文本序列,推理效率得到大幅提升。相比同尺寸自回归模型,效果相对提升16%,推理成本下降520%。
发布会还重点首发了两大核心技术。一是个性化记忆能力,星火X1.5通过构建用户个性化记忆库,实现对用户长期画像、近期反馈、短期对话的综合理解。同时,基于星火语音大模型,仅需一句录音即可复刻任意音色,并用一条指令创造任意风格的声音。
软硬一体方面,科大讯飞当天也发布了多个解决方案。如通过“AI+麦克风阵列技术”,高噪环境下识别准确率达95.08%,识别效果超iPhone 17 Pro的智能办公本;借助“AI+扬声器阵列技术”与自研硬件算法,让车内音效媲美百万豪车的智能座舱音响方案iFLYSOUND。据悉,iFLYSOUND已在19家车企量产落地,出货超100万台。
此前,科大讯飞就曾在投资者互动平台表示,过去几年在受限的有限算力资源条件下,公司关于星火大模型训练和推理成本效率的持续优化做了大量投入。和直接使用英伟达卡上开展的各种工程优化不同,科大讯飞选择了更难的全国产算力路线。自2023年5月起,科大讯飞联合华为先后攻克了万卡高速互联组网、计算通信隐藏、训练推理强交互、高吞吐推理优化以及国产算子优化等一系列难题,将通用大模型、类OpenAI o1的深度推理模型等的训练效率对标英伟达A100均从最初的30%-50%优化达到了85%-95%以上。随着国产算力在底层能力上进一步提升,讯飞星火的训练成本还有较大的下降空间。
根据科大讯飞三季报显示,公司第三季度实现营业收入60.78亿元,同比增长10.02%;归母净利润1.72亿元,同比增长202.40%;扣非净利润2623.89万元,同比增长76.50%;经营性现金流净额8.95亿元,同比增长25.19%,实现了季度净利润与现金流的转正。
刘庆峰强调,人工智能是硬科技,是强技术竞争,但更应是赋能每个人更好融入世界、共创温暖未来的力量。
截至11月6日收盘,科大讯飞股价报收53.6元/股,涨1.57%。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.