2026年2月,初创公司Taalas推出首款专用AI推理芯片HC1,将Meta Llama 3.1 8B模型直接固化进硅片,单用户推理速度达17000 tokens/s,成本仅为传统GPU方案的1/20。这种极端专用化路线,是对当前通用算力逻辑的一次硬核挑战。
![]()
一、从通用到极致专用:算力赛道的反向突围
当前AI推理市场几乎被Nvidia的GPU垄断,从H100到最新的Blackwell系列,通用GPU凭借成熟的软件生态占据绝对优势,但架构缺陷也愈发明显:计算单元与存储单元分离的设计,导致每次运算都要从HBM中搬运数据,这一过程消耗了70%以上的功耗和时间,行业称之为「内存墙」。
为突破这一瓶颈,行业投入了大量资源在先进封装、3D堆叠、液冷散热等方向,Nvidia的GB200 NVL72机柜级系统就是典型:72颗GPU通过NVLink互联,单机柜功耗接近120kW,造价超百万美元,只能依赖液冷运行。这种路线本质上是在现有架构上修修补补,并未从根源解决问题。
![]()
Taalas的HC1芯片则选择了完全相反的路径:采用Mask ROM工艺将模型权重直接编码在芯片金属互连层,与计算逻辑共存于同一块硅片,彻底抛弃外部DRAM或HBM。这种存算合一的设计,直接消除了数据搬运的能耗和延迟,让单颗芯片的推理速度达到GPU的近50倍,功耗却仅为1/10,10块HC1组成的服务器总功耗仅2.5kW,标准风冷即可运行。
从行业趋势看,通用算力赛道已陷入内卷,Nvidia的垄断壁垒难以突破,专用化路线反而为初创公司开辟了新的生存空间。就像手机芯片市场,除了高通的通用旗舰芯片,还有联发科专注中低端、苹果封闭生态的专用芯片,AI算力市场也正在走向分化。
二、定制化芯片的可行边界:效率与灵活的博弈
HC1的局限性同样突出:它只能运行Llama 3.1 8B模型,更换模型就需要重新制造芯片,可编程性几乎为零。但这种看似极端的设计,恰恰是为了最大化特定场景的效率——对于需要稳定运行单一模型的垂直场景,比如电商智能客服、车载语音助手,这种牺牲灵活性换效率的模式反而极具吸引力。
![]()
Taalas的定制流程也大幅降低了专用芯片的门槛:借鉴结构化ASIC思路,每次定制新模型仅需更换两层掩模,从拿到模型到生成RTL仅需一周,整体周期目标为两个月。这种快速定制能力,让专用芯片不再是大厂的专属,中小客户也能为自己的核心模型定制算力方案。
值得注意的是,Taalas的CEO Ljubisa Bajic曾是Tenstorrent的联合创始人,而Tenstorrent走的是基于RISC-V的通用AI加速器路线。这种从通用到专用的转向,恰恰反映了行业从业者对通用赛道拥挤度的判断:与其在Nvidia的阴影下抢食通用算力市场,不如在垂直场景打造专属壁垒。
从投入产出比看,Taalas团队仅25人,累计融资超2亿美元,第一款产品仅花费3000万美元,远低于通用芯片的研发成本。这种轻资产的专用化模式,更适合初创公司快速落地产品,验证市场需求。
三、专用算力的未来:混合格局将成主流
随着AI应用落地深化,市场对算力的需求正在分化:研发阶段需要通用GPU支持多模型测试、快速迭代;而大规模部署阶段,垂直场景对成本和功耗的敏感度远高于灵活性,专用芯片的优势将愈发明显。
Taalas对DeepSeek R1 671B大模型的模拟数据显示,30颗HC1芯片协同即可运行该模型,说明专用芯片不仅适用于小模型,也可通过集群方式支持大模型的稳定部署。这意味着,未来算力市场将形成「通用GPU+专用AI芯片」的混合格局:通用算力负责创新探索,专用算力负责规模化落地。
从行业案例看,清微智能的可重构AI芯片累计出货超3000万颗,云端算力卡销量超2万张,已跻身国产算力第一梯队,这证明专用化路线具备广阔的市场空间。而Positron、Groq等专注推理的专用芯片公司,也在逐步挑战Nvidia的市场地位。
对于企业用户而言,未来的算力选型将更加精细化:在研发环境部署通用GPU,在生产环境针对核心模型部署专用芯片,通过混合架构实现效率与成本的最优平衡。这种趋势不仅会打破Nvidia的垄断,也会催生出一批专注垂直场景的AI芯片厂商。
总的来说,Taalas的HC1芯片不是通用算力的替代品,而是开辟了一条全新的专用算力赛道。随着AI应用从实验室走向产业,专用算力的占比将逐步提升,成为未来算力市场不可或缺的组成部分。
#芯片##英伟达##Meta##Meta 发布全新大型语言模型 LLaMA#
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.