1月27日,在曦望2026 SGS产品发布会上,范式智能创始人戴文渊与国产GPU厂商曦望联席CEO王湛共同宣布,推出“百万Token一分钱”推理成本计划。双方将以范式智能PhanthyCloud云服务与曦望新一代推理GPU芯片启望S3的深度融合,将大模型推理成本降至每百万Token仅需1分钱,为AI技术的规模化应用提供更经济的解决方案。
![]()
当前,大模型推理成本是制约AI落地的重要因素。行业数据显示,主流大模型服务的输入Token价格约为0.4至2元/百万,输出Token价格约为1至4元/百万。这使得处理长文档、高频交互等场景的成本压力显著,例如,10万字文档的智能总结成本可能超过1元。同时,国产算力生态面临模型适配难、资源利用率低等挑战,部分场景下GPU利用率不足40%。
针对这些问题,范式智能与曦望通过技术合作推出“百万Token一分钱”计划。该计划基于曦望启望S3推理GPU芯片,通过原生支持FP8/FP4低精度推理和定制化架构优化,在典型场景下实现单位Token成本降低约90%。范式智能的PhanthyCloud云服务平台则通过HAMi vGPU社区优化资源调度,提升GPU利用率;依托“信创模盒 ModelHub XC”大模型社区,解决国产芯片与主流模型的兼容问题;结合先知平台,为金融、能源等领域提供业务导向的推理服务。
![]()
![]()
“当推理成本低到可以忽略不计,AI才能真正从‘奢侈品’变为‘日用品’。”范式智能创始人戴文渊表示,“我们与曦望的合作,是践行‘AI for Everyone'使命的关键一步。PhanthyCloud作为算力放大器,让国产芯片的性价比优势在真实业务中充分释放,助力中小企业、政务机构等以极低成本拥抱智能化。”
曦望董事长徐冰指出:“行业正从‘堆参数’转向‘拼成本、拼体验’。启望S3与‘百万Token一分钱’计划的推出,标志着国产推理芯片已具备支撑产业级应用的成熟度。我们期待与范式智能共同推动算力普惠,加速信创生态闭环。”
![]()
这一合作源于范式智能与曦望对行业现状的务实分析。业内专家认为,此举有望成为AI基础设施发展的分水岭,推动行业从“技术验证”全面迈入“规模应用”新阶段。
“百万Token一分钱”计划的目标是降低推理成本。通过PhanthyCloud平台和曦望S3芯片的结合,双方致力于提升国产算力的实际应用价值。未来,范式智能与曦望将继续深化合作,优化技术方案,推动算力普惠,为AI的规模化落地提供支持。
关于曦望
曦望(Sunrise)是中国全栈自研AI算力芯片企业,专注大模型推理GPU研发。2025年芯片交付量突破万片,近一年完成约30亿元战略融资。公司前身为商汤科技大芯片部门,持续推动国产算力生态成熟与普惠。
关于范式智能
范式智能技术集团股份有限公司是全球领先的通用人工智能科技公司,以“AI for Everyone"为使命,致力于通过“AI Agent + 世界模型”技术路线赋能千行百业。公司成立于2014年,业务覆盖企业服务、消费电子、智慧能源、智慧体育等领域,已在全球落地超10,000个AI应用。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.