网易首页 > 网易号 > 正文 申请入驻

告别 CUDA!GPULlama3.java 横空出世,Java 首次实现原生 GPU 跑大模型

0
分享至

点击下方“JavaEdge”,选择“设为星标”

第一时间关注技术干货!

本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续!

  • 魔都架构师 | 全网30W技术追随者

  • 大厂分布式系统/数据中台实战专家

  • 主导交易系统百万级流量调优 & 车联网平台架构

  • AIGC应用开发先行者 | 区块链落地实践者

  • 以技术驱动创新,我们的征途是改变世界!

  • 实战干货:编程严选网

0 前言

曼彻斯特大学 Beehive Lab 发布 GPULlama3.java,这是首个支持 GPU 自动加速的 Java 原生 Llama3 实现。该项目基于 TornadoVM,让开发者无需编写 CUDA 或原生代码,即可在 Java 中实现LLM的 GPU 推理。这有望彻底改变 Javaer 在企业环境中构建 AI 应用的方式。

1 GPULlama3.java 的核心

TornadoVM —— 一款创新的异构编程框架,它扩展了 OpenJDK 和 GraalVM,使 Java 程序能自动在 GPU、FPGA 以及多核 CPU 加速运行。与传统 GPU 编程方式不同,TornadoVM 无需手动重写 CUDA 或 OpenCL 代码,开发者可完全用 Java 编写逻辑,TornadoVM 负责底层加速。

根据 TornadoVM 官方文档 的介绍,该系统通过扩展 Graal JIT 编译器,添加专用后端,在运行时将 Java 字节码转换为 GPU 可执行代码。只需用@Parallel注解标记方法,TornadoVM 就能将普通 Java 字节码转换为 Graal 中间表示(IR),应用 GPU 优化策略,并生成目标平台代码,如 OpenCL C(跨平台)、PTX(NVIDIA)或 SPIR-V(二进制格式,支持 Intel 显卡)。

// 来自 TornadoVM 文档的 TaskGraph 示例 TaskGraph taskGraph = new TaskGraph("computation")     .transferToDevice(DataTransferMode.FIRST_EXECUTION, data)     .task("process", MyClass::compute, input, output)     .transferToHost(DataTransferMode.EVERY_EXECUTION, output); TornadoExecutionPlan executor = new TornadoExecutionPlan(taskGraph.snapshot()); executor.execute();

根据 TornadoVM 编程指南,开发者可用与硬件无关的 API,在不同硬件平台上运行相同的 Java 代码。TornadoVM 运行时会自动处理所有设备相关的优化、内存管理和数据传输。

2 支持后端

GPULlama3.java 支持三种主要后端,可运行在多种硬件:

  • NVIDIA 显卡:支持 OpenCL 和 PTX 两种后端

  • Intel 显卡:包括 Arc 独显和集成的 HD Graphics,支持 OpenCL

  • Apple Silicon:M1/M2/M3 可通过 OpenCL 运行(但由于 Apple 已弃用 OpenCL,未来将转向 Metal)

项目运行时可通过命令行参数配置:

# 使用 GPU 加速运行(项目 README 示例) ./llama-tornado --gpu --verbose-init --opencl --model beehive-llama-3.2-1b-instruct-fp16.gguf --prompt "Explain the benefits of GPU acceleration."

该项目依赖 Java 的现代功能,具体包括:

  • 要求Java 21 及以上版本,以使用 Vector API 和 Foreign Memory API

  • 支持GGUF 模型格式,方便模型打包与部署

  • 支持量化格式(Q4_0 和 Q8_0),以降低内存占用

GPULlama3.java 基于 Alfonso Peterssen 的原始 LLama3.java 实现 开发,并在此基础引入 TornadoVM GPU 加速功能。正如 Peterssen 在 Devoxx 2024 大会 展示,他的工作首次实现无需原生依赖即可运行 Llama 模型。TornadoVM 团队进一步将其适配为异构加速架构。

3 Java LLM 项目

GPULlama3.java 的发布也使其成为 Java LLM 项目的一员,其他相关项目还包括:

  • JLama:一个现代 Java LLM 推理引擎,支持分布式部署

  • Llama3.java:专注 CPU 优化的纯 Java 实现

正如 Quarkus 官方博客关于 Java LLM 的文章 所指出的,Java 生态系统正不断拓展其 AI/机器学习能力,使开发者能够无需离开 Java 平台就能构建 LLM 驱动的应用程序。

TornadoVM 起源于曼彻斯特大学的研究项目,自 2013 年以来持续发展,目标是让 Java 开发者更容易使用异构计算。该框架目前仍在不断增加后端支持并进行性能优化。

4 当前进度

GPULlama3.java 目前处于测试阶段,团队正在持续优化性能并收集基准测试数据。由于 Apple 弃用 OpenCL,当前在 Apple Silicon 上的性能不佳,TornadoVM 团队正在开发 Metal 后端,以提升兼容性并优化 Transformer 操作。

5 总结

总的来说,GPULlama3.java 的发布标志着 Java 生态在 GPU 加速 LLM 推理方面迈出了重要一步。得益于 TornadoVM 的加持,Java 开发者无需跳出熟悉的开发环境,就能享受到 GPU 加速的强大计算能力。尽管目前仍在开发中,但该项目已展示出 Java 在 AI 应用中无限的可能性,特别是在对安全性、可扩展性与可维护性有高要求的企业级场景下。

对想要在 Java 中尝试 GPU 加速 LLM 推理的开发者而言,该项目已经 开源发布于 GitHub,并配有文档和示例,方便快速上手。

加我好友,一起AI探索交流!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
穿破的外套仅退款后续:女子身份被扒,真容曝光社死,单位被牵连

穿破的外套仅退款后续:女子身份被扒,真容曝光社死,单位被牵连

离离言几许
2026-02-14 15:56:41
太震撼!14日深夜潮州某服务区全是车,网友:一帮穷鬼等高速免费

太震撼!14日深夜潮州某服务区全是车,网友:一帮穷鬼等高速免费

火山詩话
2026-02-15 06:20:14
利雅得胜利2-0客胜哈萨征服,C罗回归后首战破门,叶海亚建功

利雅得胜利2-0客胜哈萨征服,C罗回归后首战破门,叶海亚建功

懂球帝
2026-02-15 03:35:16
王菲将六登春晚,献唱《你我经历的一刻》;此前五次登台首首爆火,去年《世界赠予我的》创收视峰值

王菲将六登春晚,献唱《你我经历的一刻》;此前五次登台首首爆火,去年《世界赠予我的》创收视峰值

扬子晚报
2026-02-15 08:40:17
夫妻开小炒店8年还清债务 今年“挺直腰杆”回老家过年

夫妻开小炒店8年还清债务 今年“挺直腰杆”回老家过年

红星新闻
2026-02-14 15:41:10
34岁东北姑娘拿下81岁全球首富,长的很漂亮,一年抱俩娃身价上亿

34岁东北姑娘拿下81岁全球首富,长的很漂亮,一年抱俩娃身价上亿

云舟史策
2025-09-13 07:37:04
“伏弟魔”烧饼姐想通了:给弟弟买个110平的房,怕弟媳不让她住

“伏弟魔”烧饼姐想通了:给弟弟买个110平的房,怕弟媳不让她住

江山挥笔
2026-02-14 19:00:17
“卢宣传”发布乌克兰大规模进攻消息

“卢宣传”发布乌克兰大规模进攻消息

李未熟擒话2
2026-02-14 19:13:44
2月14日俄乌最新:历史性的演讲

2月14日俄乌最新:历史性的演讲

西楼饮月
2026-02-14 16:44:27
王毅在慕尼黑会见鲁比奥,谈了整整1小时!

王毅在慕尼黑会见鲁比奥,谈了整整1小时!

阿龙聊军事
2026-02-14 21:07:20
视频丨跨大西洋关系裂痕加剧 欧洲高调提“战略自主”

视频丨跨大西洋关系裂痕加剧 欧洲高调提“战略自主”

国际在线
2026-02-15 10:07:34
北漂女高管辞职当守岛人:27天不花钱,颠覆了对车、房的物质执念,精神自由无价

北漂女高管辞职当守岛人:27天不花钱,颠覆了对车、房的物质执念,精神自由无价

大风新闻
2026-02-14 15:17:08
暴跌61%,缩水154亿美元!昔日世界第一新能源车企,真卖不动了?

暴跌61%,缩水154亿美元!昔日世界第一新能源车企,真卖不动了?

百科密码
2026-02-12 15:12:02
现在国内买丰田赛那全世界最便宜,得感谢长城魏建军

现在国内买丰田赛那全世界最便宜,得感谢长城魏建军

源Auto
2026-02-14 18:50:08
苹果iOS 26.3 更新,新界面长这样!

苹果iOS 26.3 更新,新界面长这样!

科技堡垒
2026-02-14 10:34:35
贝克汉姆家小七情人节晒三个哥哥,贝嫂转发温情示好长子布鲁克林

贝克汉姆家小七情人节晒三个哥哥,贝嫂转发温情示好长子布鲁克林

译言
2026-02-15 05:56:09
1947年,毛泽东游白云山,想见见当地道士,县长推脱道士成分复杂

1947年,毛泽东游白云山,想见见当地道士,县长推脱道士成分复杂

明月清风阁
2026-02-13 07:00:10
日媒踢爆:石原里美老公露脸,年收高达1亿,繁忙工作之余还做家务带孩子,这世界上还有这样的男人吗?

日媒踢爆:石原里美老公露脸,年收高达1亿,繁忙工作之余还做家务带孩子,这世界上还有这样的男人吗?

日本物语
2026-02-14 20:44:32
真是人走茶凉!看了三只羊传媒的现状,才明白什么叫兔死狗烹

真是人走茶凉!看了三只羊传媒的现状,才明白什么叫兔死狗烹

聚焦真实瞬间
2026-02-10 20:45:40
狗血!中戏王鑫主动投案,共4位表演系主任落马,闫学晶的天塌了

狗血!中戏王鑫主动投案,共4位表演系主任落马,闫学晶的天塌了

壹月情感
2026-02-13 23:30:13
2026-02-15 10:16:49
JavaEdge incentive-icons
JavaEdge
Java 技术
470文章数 457关注度
往期回顾 全部

科技要闻

字节跳动官宣豆包大模型今日进入2.0阶段

头条要闻

牛弹琴:鲁比奥演讲获热烈掌声 欧洲人又被美国忽悠了

头条要闻

牛弹琴:鲁比奥演讲获热烈掌声 欧洲人又被美国忽悠了

体育要闻

最戏剧性的花滑男单,冠军为什么是他?

娱乐要闻

春晚第五次联排路透 明星积极饭撒互动

财经要闻

谁在掌控你的胃?起底百亿"飘香剂"江湖

汽车要闻

星光730新春促销开启 80天销量破2.6万台

态度原创

本地
教育
旅游
房产
军事航空

本地新闻

下一站是嘉禾望岗,请各位乘客做好哭泣准备

教育要闻

5747是哪个学校?揭秘成都文理学院代码

旅游要闻

春节趣湖南丨别错过!湖南多地博物馆活动上新、逛展有礼

房产要闻

三亚新机场,又传出新消息!

军事要闻

钓鱼岛、黄岩岛、仁爱礁已充满中国年味

无障碍浏览 进入关怀版