口袋级 AI 超算！全球最小，可跑1200亿大模型！|人工智能|神经网络|超级计算机

口袋级 AI 超算！全球最小，可跑1200亿大模型！

分享至

紧凑型人工智能设备正日益走向主流，而一家新兴初创企业则突破技术壁垒，推出了全球最小的人工智能超级计算机，这款设备的纸面参数十分亮眼。

初创公司TiinyAIAI Pocket Lab 搭载全新ARM v9.2 架构核心，可流畅运行 1200 亿参数大语言模型。

边缘人工智能已成为计算产业的新兴赛道，核心优势在于将开源模型部署在本地设备，能够实现更具个性化的任务处理。但这类技术方案通常需要高昂的硬件成本支撑—— 以英伟达 DGX Spark 为例，其售价高达 4000 美元，普通消费者难以负担。

初创公司 Tiiny AI 计划填补这一市场空白，不仅推出了高性价比解决方案，更带来了号称 “全球最小” 的超级计算机——Tiiny 人工智能口袋实验室AI Pocket Lab ）

这款设备的尺寸仅为 14.2×8×2.53 厘米，重量仅 300 克，却能部署 1200 亿参数大语言模型，这一突破堪称业界首创。官方称，适配该设备的大语言模型可满足 “博士级推理、多步骤分析及深度语境理解” 需求。凭借强大的端侧算力，这款口袋实验室不仅面向普通消费者，更能为需开展本地大模型部署实验的科研人员与开发者提供理想平台。

据 Tiiny AI 披露，该设备兼容 GPT-OSS、Llama、通义千问、Deepseek、Mistral 及 Phi 等主流大模型。其核心亮点在于，内置独立神经网络处理单元（NPU），算力可达 190 万亿次运算 / 秒（TOPS）；同时配备 80GB LPDDR5X 高速内存，支持激进量化技术，确保 1200 亿参数模型在本地环境下流畅运行。

此外，Tiiny AI 研发了两项关键技术，让 1200 亿参数模型的端侧落地成为现实：

1.TurboSparse 稀疏激活技术：在神经元层面实现稀疏激活，可在完整保留模型智能的前提下，大幅提升推理效率。

2.PowerInfer 异构推理引擎：这款开源引擎在 GitHub 上已收获超 8000 星标，能够动态分配 CPU 与 NPU 的算力负载，加速大语言模型的高负载运算，以远低于传统方案的功耗，实现媲美服务器级别的性能表现。

依托这两项技术，Tiiny 人工智能口袋实验室得以实现原本需要数千美元专业图形处理器（GPU）才能具备的算力水平。

据悉，该设备将于2026 年国际消费电子展（CES）正式亮相。尽管目前 Tiiny AI 尚未公布具体发售日期与上市信息，但这款口袋超级计算机的市场前景已备受瞩目，其行业首秀的表现值得期待。

AMD 技术峰会邀请报名：FPGA/SoC+x86嵌入式

报名通道即将关闭

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.