Arm宣布,推出新款Cortex-A320,是过去十年里首次对Cortex-A3x级别内核进行更新。
Cortex-A320采用了Armv9.2架构,专门用于满足物联网和边缘AI应用的需求。与Cortex-A520相比,Cortex-A320通过几个微架构优化,实现了50%以上的效率提高。通过高效的分支预测器、预取器和内存系统改进,与上一代Cortex-A35相比,标量性能提高了30%,ML性能提升了十倍,也比广泛使用的Cortex-A53高出六倍。
Cortex-A320是一款无序单发内核,具有32位指令获取和8级流水线,支持64KB L1和512KB L2缓存,可实现单核心到四核心配置,并具备可扩展性,另外提供了256位AMBA5 AXI接口连接外部存储器。由于支持DSU-120T功能,可实现仅配备Cortex-A320内核的集群。
矢量处理单元实现了NEON和SVE2 SIMD(单指令多数据流)技术,既可以在单核复合处理器中单独使用,也可以在双核心或四核心实现中在不同内核之间共享。由于支持BF16等新数据类型,以及增强的点乘和矩阵乘法指令,使得Cortex-A320成为适用于ML应用的最高效Cortex-A内核。
此外,Arm还集成了Cortex-A320 CPU和支持Transformer算子网络的Ethos-U85 NPU,打造出全球首个专为物联网优化的Armv9边缘AI计算平台。相较于去年基于Cortex-M85的平台,新的边缘AI计算平台在ML性能上有八倍的性能提升。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.