阿里巴巴在2025年1月29日通过阿里云发布了通义千问旗舰版模型Qwen2.5-Max,并声称该模型在多个方面超越了DeepSeek。
2月27日,腾讯也发布一款快思考模型,并称其输出答案的速度比深度求索(DeepSeek)的R1模型快。
综合证券时报网、彭博社和《21世纪经济报道》报道,腾讯星期四(2月27日)正式发布新一代基座模型混元Turbo S。
腾讯混元团队介绍,区别于DeepSeek-R1、混元T1等需要“想一下再回答”的慢思考模型,混元Turbo S能够实现“秒回”,更快速输出答案,吐字速度提升一倍,首字时延降低44%。
团队指出,混元Turbo S通过在架构上采用Hybrid-Mamba-Transformer融合模式,降低了训练和推理成本,部署成本随之大幅下降,“持续推动大模型应用门槛降低”。
在定价方面,混元Turbo S输入价格为每百万tokens0.8元,输出价格为百万tokens2元,相比前代混元Turbo模型价格下降数倍。
腾讯还分享了数据,显示混元Turbo S在常用的人工智能(AI)测试中与DeepSeek的V3模型具有竞争力。
团队说,通过长短思维链融合,混元TurboS在保持文科类问题快思考体验的同时,基于自研混元T1慢思考模型合成的长思维链数据,显著改进了理科推理能力,实现模型整体性能明显提升。
中国的大模型现在是百花齐放,但是,其中的一个现象就是都在对标DeepSeek,这也充分肯定了DeepSeek的实力。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.