网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

台企推AI解码芯片：单卡384GB内存跑700B大模型

2026-05-07 14:08:45　来源: 报错免疫体

北京举报

0

分享至

AI推理的瓶颈正在从算力转向带宽。一家中国台湾的芯片企业给出了新解法。

Skymizer近日发布HTX301加速器，专为大模型推理解码阶段设计。与负责预填充的GPU分工协作，这款芯片试图解决一个被忽视的效率问题：当GPU算力闲置等待数据时，系统整体能效被白白消耗。

技术路线选择了软硬件协同。HTX301基于Skymizer自研的HyperThought平台和LISA指令集架构，定位很清晰——不做通用计算，只啃带宽密集型负载这块硬骨头。

部署形态有两种。SoC集成适合定制场景，更吸睛的是PCIe AIC方案：单卡塞进6颗HTX301芯片，配384GB内存，功耗控制在240W。这个配置能本地运行700B参数的大模型，对需要私有化部署的企业颇具吸引力。

数字背后的取舍值得玩味。384GB内存对应700B模型，意味着压缩或量化在所难免；240W功耗相比动辄上千瓦的GPU集群，能效比是卖点，但性能天花板同样明显。这不是要取代GPU，而是在推理流水线上切走特定环节。

大模型推理正在分层。预填充需要算力暴力，解码阶段更吃内存带宽——HTX301押注的正是这个结构性机会。能否在英伟达生态的缝隙里找到位置，取决于实际延迟数据和软件适配进度。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

从终端到数据中心，联发科正在打造一个“AI王国”

雷科技 2026-05-08 20:08:52
0 跟贴 0
160%、155%、75%，国产AI芯片集体向上

钛媒体APP 2026-05-08 09:56:16
0 跟贴 0

在引发玩家众怒后，微软悄悄删除了Windows玩游戏需要32GB内存的文章

简明科学指南 2026-05-05 23:15:27
0 跟贴 0

独家对话研极微创始人：80人做到近100亿营收后，要把AI摄像头插到田间地头

36氪 2026-01-21 09:10:59
42 跟贴 42
总成本将成为智驾芯片产业竞争的核心焦点

新浪财经 2026-05-08 04:46:07
0 跟贴 0

PS6掌机性能逼近主机！黑科技+24GB内存毫无压力

游民星空 2026-05-07 21:10:30
3 跟贴 3

PS6发售日和定价还没定，索尼可能要改商业模式了

雾野寻踪2 2026-05-08 17:49:39
0 跟贴 0
175年玻璃老厂翻身，靠光纤拿下英伟达超级订单

DeepTech深科技 2026-05-08 10:39:17
0 跟贴 0

36氪首发 | 清华系AI Infra厂商完成数亿元融资，以GPU为核心重构计算机系统架构

36氪 2026-05-08 09:53:06
0 跟贴 0
8000亿的海光信息贵吗？

虎嗅APP 2026-05-08 06:00:10
4 跟贴 4
下一座AI数据中心，可能就挂在你家墙上

DeepTech深科技 2026-05-08 18:19:40
0 跟贴 0
PS5要涨价缺货？索尼把锅甩给了AI

雾野寻踪2 2026-05-08 17:28:16
0 跟贴 0
Switch 2涨价50美元：任天堂扛不住"RAMageddon"了

字节漫游指南 2026-05-08 21:16:28
1 跟贴 1
PS6迎来重磅官方消息！索尼总裁谈发售时间具体规划

游民星空 2026-05-08 18:47:14
1 跟贴 1
从参数到外观：汽车行业的最后一场竞争

基地边缘BaseEdge 2026-05-08 17:48:10
0 跟贴 0
AlphaEvolve交出一周年炸裂成绩单！AI自我改进不再科幻

新智元 2026-05-08 20:27:15
1 跟贴 1
沈逸解码：资本主义的极右翼与法西斯归宿

青色雨音r 2026-05-07 04:27:18
1 跟贴 1
从3D建模到手绘批注，这台超轻薄AI专业创作本全搞定

雷科技 2026-04-15 14:51:10
1 跟贴 1
歼-35"0001编号"战机亮相喷涂英文缩写或量产出口

央视新闻客户端 2026-05-08 08:00:26
7741 跟贴 7741
用上中国智驾芯片，丰田、铃木为何会“变心”？

禾颜阅车 2026-05-08 09:29:41
0 跟贴 0
10万级合资车首搭国产智驾芯片，地平线征程6B量产落地

算力游侠 2026-05-08 20:12:15
0 跟贴 0
纳芯微姚迪：供应链企业进入“应用端+底层架构”创新时期

贝壳财经 2026-05-08 10:24:15
0 跟贴 0
关于中东地区架构与权力的转变，赖岳谦与三妹的观察点，值得参考

伢伢gagako 2026-05-08 00:39:06
0 跟贴 0
三角洲部队内部组织架构！

浩然简史 2026-05-04 19:53:21
0 跟贴 0
无需训练、即插即用，这个解码方法让模型学会谨慎思考

DeepTech深科技 2026-02-23 20:21:48
0 跟贴 0
800V与SiC加速“上车”，隔离驱动芯片打响“本土高端突围战”

至顶头条 2026-05-08 21:22:07
0 跟贴 0
PS6到底什么时候上市？索尼总裁正式回应！

游民星空 2026-05-08 18:47:16
1 跟贴 1
装卸工人的神速操作，仿佛开了加速器，一袋袋货物瞬间码放整齐

七怪看世界 2026-05-07 14:20:41
1 跟贴 1
直击科创板半导体制造、封测公司业绩会：Q1产能满载抢抓AI增量机遇

财联社 2026-05-08 21:17:07
0 跟贴 0
200GB的《GTA6》，正在逼你换硬盘

碳基打工人 2026-05-07 16:40:53
13 跟贴 13
中国科技巨头集体采购华为芯片，NVIDIA份额已清零

快科技 2026-05-06 20:00:04
0 跟贴 0
围剿张雪机车？钱江摩托声明：从未向任何供应链企业下达“封杀令”

看看新闻Knews 2026-05-08 11:34:33
5477 跟贴 5477
持续领跑！商汤大装置稳居中国MaaS市场第一梯队

量子位 2026-05-08 19:05:32
1 跟贴 1
吴新宙：短期内L3与L4两者将并存英伟达加速推进L4普及

新浪财经 2026-05-08 14:40:50
0 跟贴 0
曝《GTA6》容量或接近200GB 标准版PS5用户硬盘告急

3DM游戏 2026-05-07 11:53:04
21 跟贴 21
本轮半导体行情暗藏深意，全球AI算力共振

每日经济新闻 2026-05-07 10:14:17
0 跟贴 0
直播预约 | 数据引擎：具身智能的下一个决胜局

机器之心Pro 2026-05-08 18:52:35
0 跟贴 0
每经科技CEO韩利：企业一定要在AI时代抢占大模型入口重塑品牌价值

每日经济新闻 2026-05-08 21:05:06
0 跟贴 0
10万双手，有多大力量？

正视频 2026-05-04 04:59:39
0 跟贴 0
这个Harness普通人可用！

机器之心Pro 2026-04-21 15:47:04
0 跟贴 0

不管有钱没钱，尽快扔掉家里的这7样东西！不是瞎说，有科学依据

不管有钱没钱，尽快扔掉家里的这7样东西！不是瞎说，有科学依据

家居设计师宅哥

2026-05-04 12:45:59

CPO/光模块：龙头十五强，谁还在低位？

CPO/光模块：龙头十五强，谁还在低位？

普陀动物世界

2026-05-08 09:15:08

雷迪克：雷霆几乎每回合都在犯规，裁判至少得把该吹的给吹了

雷迪克：雷霆几乎每回合都在犯规，裁判至少得把该吹的给吹了

懂球帝

2026-05-08 13:08:05

抗战时期最牛杂牌军：兵力仅1.3万人，机枪却有660挺，哪里来的？

抗战时期最牛杂牌军：兵力仅1.3万人，机枪却有660挺，哪里来的？

饭小妹说历史

2026-03-24 09:31:22

何洁近况令人诧异！暴瘦20斤，换了发色，面相大变，刁磊有福了

何洁近况令人诧异！暴瘦20斤，换了发色，面相大变，刁磊有福了

时间巡查

2026-05-07 19:34:40

皇马“火药桶”巴尔韦德：是铁血图腾，还是更衣室的毁灭者？

皇马“火药桶”巴尔韦德：是铁血图腾，还是更衣室的毁灭者？

星耀国际足坛

2026-05-08 22:01:14

5-0碾压澳大利亚，日本女足豪取亚洲杯3连胜，以头名晋级8强

5-0碾压澳大利亚，日本女足豪取亚洲杯3连胜，以头名晋级8强

侧身凌空斩

2026-05-08 17:22:23

王楚钦、林诗栋、梁靖崑3-0战胜韩国队，国乒男团顺利晋级四强

王楚钦、林诗栋、梁靖崑3-0战胜韩国队，国乒男团顺利晋级四强

潇湘晨报

2026-05-08 21:57:12

理想设计副总裁回应MEGA争议：外观是技术最优解，内饰承认“判断失误”

理想设计副总裁回应MEGA争议：外观是技术最优解，内饰承认“判断失误”

驱动中国

2026-05-08 10:58:21

中国最大二手车平台冲刺IPO，腾讯、京东坐镇

中国最大二手车平台冲刺IPO，腾讯、京东坐镇

华尔街见闻官方

2026-05-07 21:59:05

中国第四艘航母官宣亮相，舷号19或命名江苏号

中国第四艘航母官宣亮相，舷号19或命名江苏号

小蒋爱唠嗑

2026-05-08 07:35:11

于文红宣扬“换血”抗衰，两周内年轻十几岁，晒术后照引网友热议

于文红宣扬“换血”抗衰，两周内年轻十几岁，晒术后照引网友热议

阿伧说事

2026-05-08 19:33:51

吴晨已任中国医学科学院北京协和医学院副院校长

吴晨已任中国医学科学院北京协和医学院副院校长

澎湃新闻

2026-05-08 16:02:26

北京局新任总经理已到位

轨道世界

2026-05-07 23:53:47

局势突变，美伊再起冲突，为何挨揍的却是阿联酋？

局势突变，美伊再起冲突，为何挨揍的却是阿联酋？

孤酒老巷QA

2026-05-08 20:09:02

全红婵近照颠覆往日形象，少女蜕变引发好奇，背后坚持值得深思

全红婵近照颠覆往日形象，少女蜕变引发好奇，背后坚持值得深思

川川八卦说

2026-05-07 17:09:04

休想再回国！中国体坛两大叛徒，夺冠后不承认是国人，报应终到来

休想再回国！中国体坛两大叛徒，夺冠后不承认是国人，报应终到来

南书房

2026-05-04 15:50:05

老人财产转给独生子女：3个最佳时间，早知道少走弯路

老人财产转给独生子女：3个最佳时间，早知道少走弯路

小鹿姐姐情感说

2026-05-05 10:43:52

伦敦世乒赛爆大冷！瑞典男团无缘四强！林昀儒领衔中国台北战日本张本、松岛！

伦敦世乒赛爆大冷！瑞典男团无缘四强！林昀儒领衔中国台北战日本张本、松岛！

好乒乓

2026-05-08 11:12:07

国运来了，贵州发现万亿级宝藏，能用几百年，美日也想分杯羹？

国运来了，贵州发现万亿级宝藏，能用几百年，美日也想分杯羹？

疯狂的小历史

2026-05-07 10:36:33

报错免疫体

一名在需求评审和数据异常中反复横跳的产品运营。

2389文章数 22关注度

往期回顾全部

科技要闻

SK海力士平均奖金600万工服成相亲神器

头条要闻

"大衣哥"再度翻红：五一假期3天跑5场累到"要保命"

头条要闻

"大衣哥"再度翻红：五一假期3天跑5场累到"要保命"

体育要闻

他把首胜让给队友，然后用一年时间还清账单

娱乐要闻

古天乐被曝隐婚生子，新娘竟是她

财经要闻

特朗普全球关税又受阻，也能退款？

汽车要闻

MG 4X实车亮相将于5月11日开启盲订

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

手机

时尚

家居

本地

数码

手机要闻

大疆Osmo Pocket 4P开启预约

海魂衫搭配白色，更解暑！

家居要闻

流动的尺度打破家的形式主义

本地新闻

用苏绣的方式，打开江西婺源

数码要闻

华硕天选7系列发布天选7 Pro/Pro Max已开启预约

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版