网易首页 > 网易号 > 正文 申请入驻

技术大神用纯Rust从零构建了LLM,在GitHub上大火

0
分享至

专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!Python凭借它“人生苦短,我用Python”的潇洒,还有背后庞大的生态库,稳坐AI界的头把交椅,从入门小哥到学术大牛,人人都爱它。而Rust以其“内存安全、零成本抽象、无畏并发”三件法宝,正在受到大公司和开发者们的青睐。

一个用纯Rust从零开始实现完整大语言模型的项目RustGPT,在GitHub上火了,两天星标超过1.4k。该项目没有外部ML框架,仅使用ndarray从头开始构建矩阵运算来实现。


真的从零开始用Rust搓了个GPT

项目复刻了整个LLM的功能链,从预训练、指令微调,一直到你能跟它聊天的交互模式,全给办了。架构非常简单:

整个项目设计得跟乐高积木一样,模块化特别清晰:

  • src/main.rs:总指挥部,负责整个训练流程、数据怎么处理、以及最后怎么跟你聊天。

  • src/llm.rs:核心引擎,大模型的前向传播、反向传播、训练逻辑全在这。

  • src/transformer.rs:Transformer的核心部件,把注意力和前馈网络这两个左膀右臂组装起来。

  • src/self_attention.rs:大名鼎鼎的多头自注意力机制,模型“理解”上下文关系就靠它。

  • src/feed_forward.rs:位置感知前馈网络,让模型处理信息更有层次。

  • src/embeddings.rs:词嵌入层,把文字转化成模型能懂的数学语言。

  • src/output_projection.rs:输出投影层,把模型计算出的数学结果再翻译成人类语言。

  • src/vocab.rs:字典和分词器,模型的“新华字典”。

  • src/layer_norm.rs:层归一化,防止模型训练时“飘了”的稳定器。

  • src/adam.rs:Adam优化器,指导模型如何“学习”得又快又好。

模型的配置参数非常“迷你”,但五脏俱全,能解剖一个完整的大模型。

它的成长之路也跟主流模型一样,分两步走:

预训练阶段先给它“喂”一堆事实性陈述,让它学习世界的基本规律。比如告诉它“太阳东升西落”、“水往低处流”这类知识。

指令微调阶段教它学会“对话”。用一问一答的语料库来训练,让它明白人类是如何交流的。比如“用户:山是怎么形成的?助手:山是地壳板块运动或火山活动形成的……”

等这两步都走完,这个纯Rust打造的模型就能跟你进行简单的常识问答了:

Enter prompt: How do mountains form?Model output: Mountains are formed through tectonic forces or volcanism over long geological time periods.
这不就是个玩具吗?为什么火?

Rust在AI开发应用领域同时弥补了C/C++和Python的一些非常重要的不足之处:

搞算法研究、快速验证想法,Python是永远的神,无人能敌。但模型一旦上线部署,变成一个7x24小时不能宕机、要扛住海量并发的服务,Python的性能瓶颈和全局解释器锁(GIL)就成了阿喀琉斯之踵。这时候,大家通常会请出C++这位“性能救星”来重写核心模块。然而,请神容易送神难。C++带来了极致性能,也带来了内存安全的“诅咒”。缓冲区溢出、悬垂指针这些幽灵般的bug,不仅是工程师的噩梦,更是70%安全漏洞的温床。

Rust的出现,恰好就站在这两者之间,提供了一个近乎完美的“第三选项”。它承诺给你媲美C++的运行速度和内存控制力,却通过所有权系统在编译时就彻底消灭了内存安全问题,让你“无畏并发”;同时,它又拥有现代化的包管理工具(Cargo)和友好的编译器,开发体验远胜于C++。

Rust的这种重要补充,使整个Rust社区都被点燃了,高质量的LLM相关项目越来越多。

咱们来看看几位重量级选手:

1. mistral.rs,一个快到没朋友的推理引擎

这项目的目标非常明确:就是要快,快到极致。


为了把硬件性能榨干,它对各种加速器的支持也做到了极致:


2. Hugging Face的candle框架

它的定位是“一个为Rust设计的极简机器学习框架,专注于性能和易用性”。


“极简”和“易用”这两个词,直击Rust学习曲线陡峭的痛点。candle是怎么做的呢?

它把API设计得和PyTorch非常像,大大降低了Python开发者迁移过来的学习成本;后端全覆盖,CPU、CUDA、WASM,你想在哪跑,它就支持在哪跑;模型库丰富;针对云端部署场景,它解决了传统大型框架实例化慢、资源消耗大的问题,特别适合Serverless (无服务器) 架构。

除了这两大明星项目,还有像rustformers/llmkalosm以及各种llama.cpp的Rust绑定,整个生态已经发展成了一片繁荣的景象。

Rust到底牛在哪?

  1. 内存安全:一行代码,干掉70%的安全漏洞

这可能是Rust最硬核的特性,没有之一。微软研究院 (Microsoft Research) 有个惊人的统计数据,微软每年修复并分配CVE (通用漏洞披露) 的安全漏洞中,70%的根源是内存安全问题

用C/C++写过代码的同学,肯定都经历过被指针折磨的日日夜夜:缓冲区溢出、悬垂指针、野指针……这些问题就像代码里的“幽灵”,平时看不见摸不着,一旦出事就是系统崩溃或者被黑客攻击。

Rust的解决方案堪称釜底抽薪。它设计了一套独特的“所有权(Ownership)”、“借用(Borrowing)”和“生命周期(Lifetimes)”机制。这套组合拳的核心思想是,在编译代码的时候,编译器就会像一个极其严格的图书管理员,检查你每一寸内存的使用是否合规。任何可能导致内存问题的代码,连编译都通不过,直接给你打回去重写。

  1. 无畏并发:为高并发推理量身打造的“八核大脑”

大模型的服务,天生就是高并发场景。Python的GIL (全局解释器锁) 在这里就显得特别尴尬,它就像一个十字路口的独裁交警,不管你有多少个车道(CPU核心),一次只允许一辆车通过,导致多线程性能大打折扣。

而Rust的并发模型,被社区骄傲地称为“无畏并发(Fearless Concurrency)”。所有权系统杜绝数据竞争,从根源上避免了并发编程中最常见的bug。顶级的异步编程支持,让编写高并发、高吞吐量的网络服务变得既简单又高效。例如它支持“自动张量并行”,可以把一个大模型拆分到多个GPU或CPU上协同工作。

  1. 零成本抽象:让你写得爽,跑得也快

这是Rust另一个让C++开发者羡慕嫉妒恨的特性。所谓“零成本抽象”,意思就是你可以使用很多高级、优雅的语言特性(比如迭代器、泛型、模式匹配),但这些特性在编译之后,会被优化成和手写的C/C++代码一样高效的机器码,不会带来任何运行时的性能损失。

在一项文件I/O操作的测试中,Rust的速度比Python快了好几个数量级,这就是零成本抽象最直观的体现。Rust用一种近乎天才的设计,同时解决了性能、安全、开发体验这三个在传统编程语言中难以调和的“不可能三角”。

巨头们是怎么用Rust的?

当一项技术开始被行业巨头们认真研究和投入资源时,就说明它已经脱离了“小众玩具”的范畴,真正具备了改变产业格局的潜力。我们来看看科技圈的“五常”们,都是怎么看待和布局Rust的。

微软对Rust的爱,几乎是写在脸上的。毕竟自家产品深受C/C++内存安全问题的毒害,他们比谁都渴望一个更安全的替代品。微软研究院 (Microsoft Research) 搞了个项目,用LLM来帮你修复Rust代码的编译错误。特别是那些让新手头疼的所有权、生命周期问题,AI能自动给出修改建议,准确率高达74%。这简直是在用魔法打败魔法,极大地降低了Rust的学习门槛。


他们把还LLM和一个叫Verus的形式验证工具结合起来,让AI自动为你的Rust代码生成“数学上正确”的证明。


谷歌则是从最核心的安卓系统开始,大规模地引入Rust。而且把内部用了多年的comprehensive-rust培训课程开源了。这套课程覆盖了从基础到并发,再到安卓开发的方方面面,已经培训了数千名原本写C++和Java的工程师。当一家公司开始花大力气对员工进行“换脑”式培训时,其战略决心可见一斑。

亚马逊对Rust的应用,则体现了其“云+端”的业务特色。负责Echo智能音箱等硬件产品的团队,正在研究如何用Rust来提升设备端AI功能的可靠性和性能。AWS的全托管LLM服务Bedrock,早早就提供了官方的Rust SDK,鼓励开发者用Rust来构建云上的AI应用。

Meta则在探索一个非常前沿的方向:WebLLM。这个项目旨在利用Rust和WebGPU技术,把大模型和聊天机器人直接塞进你的浏览器里运行。

Rust要在AI领域取代Python和C++吗?

Python的地位依然是无法撼动的。它那无与伦比的灵活性、极低的上手门槛和浩如烟海的科学计算库,使其成为AI算法研究、模型探索、快速原型验证的“利剑”。科学家和算法工程师们,依然会用Python来挥洒创意,探索AI的边界。Python是“想法”变成“模型”最快的路径。

C++是AI世界的“幕后英雄”。所有主流的深度学习框架,其核心计算层无一例外都是用C++编写的。它能最大限度地压榨硬件性能,与GPU、CUDA进行最底层的交互。在模型训练这个需要极致算力的环节,以及那些已经存在了数十年的庞大工业软件生态中,C++的地位依然稳固。它是“性能”的最终保障。

那么,Rust的角色是什么?它精准地切入了Python和C++之间的那个巨大“真空地带”——性能、安全与开发效率的交叉口

当模型训练好,需要部署成一个7x24小时稳定运行、能抗住高并发的服务时,Rust的内存安全、无畏并发和高性能,简直是完美的解决方案。它比Python快,比C++安全,开发体验还更好。

模型需要被塞进手机、汽车、无人机这些资源受限的设备里时,Rust的低内存占用、无GC (垃圾回收) 的特性就成了巨大的优势。它编译出的二进制文件小,运行效率高,是端侧AI的理想选择。

你想让AI模型直接在浏览器里跑起来时,Rust是目前唯一能高效、安全地编译到WebAssembly (网页汇编) 的系统级语言。

Python负责“生孩子”:搞研究,做实验,快速迭代模型。C++负责“打地基”:写最底层的计算库,与硬件死磕。Rust负责“建房子和搞物业”:把模型部署成安全、可靠、高效的服务,并把它推广到各种各样的设备上。

Rust通过降低硬件门槛,让大模型在低端或边缘硬件也能流畅跑起来;它通过提升开发效率和安全性,让企业能更有信心地将AI应用于金融、医疗等核心业务。

理解Python的灵活,敬畏C++的深邃,并拥抱Rust带来的现代化工程能力,或许才是AI开发者最佳选择。

参考资料:

https://github.com/tekaratzas/RustGPT

https://github.com/EricLBuehler/mistral.rs

https://github.com/huggingface/candle

https://www.microsoft.com/en-us/research/publication/rustassistant-using-llms-to-fix-compilation-errors-in-rust-code

https://www.amazon.science/publications/verifying-dynamic-trait-objects-in-rust

https://cjwebb.com/aws-bedrock-with-rust

https://dev.to/hamzakhan/vs-rust-vs-python-the-ultimate-showdown-of-speed-and-simplicity-for-2024-2afi

https://www.pullrequest.com/blog/rust-safety-writing-secure-concurrency-without-fear

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
印尼华人,正在“再汉化”

印尼华人,正在“再汉化”

诗意世界
2025-09-19 19:10:25
她这次造型大翻车?

她这次造型大翻车?

奋斗在韩国
2025-09-19 19:41:06
口交不入刑,教材当废纸:丹阳案背后的黑色幽默

口交不入刑,教材当废纸:丹阳案背后的黑色幽默

有戏
2025-09-17 17:48:36
河北省商务厅厅长张泽峰,新职明确

河北省商务厅厅长张泽峰,新职明确

鲁中晨报
2025-09-19 17:57:06
云海肴创始人赵晗去世,年仅40岁,毕业于人大,死因让人感到可惜

云海肴创始人赵晗去世,年仅40岁,毕业于人大,死因让人感到可惜

凯旋学长
2025-09-19 14:26:37
暴走团老人路上训练,交警劝不听,货车司机“不想走那就别走了”

暴走团老人路上训练,交警劝不听,货车司机“不想走那就别走了”

源远讲堂
2025-07-31 18:13:50
退休大爷迎娶28岁女子,3年后得子,亲子鉴定后大爷却被气晕厥

退休大爷迎娶28岁女子,3年后得子,亲子鉴定后大爷却被气晕厥

晓艾故事汇
2025-09-19 17:16:51
马特乌斯:瓜帅带队还是10多年前的风格,太慢了其他队不再害怕

马特乌斯:瓜帅带队还是10多年前的风格,太慢了其他队不再害怕

直播吧
2025-09-19 14:04:09
氢氟酸新后续:受害者不是去散步,律师发声,恐难追究丢弃人刑责

氢氟酸新后续:受害者不是去散步,律师发声,恐难追究丢弃人刑责

云景侃记
2025-09-19 16:14:00
勇士内乱!大逼宫啊,三大球星联合施压,逼管理层续约库明加

勇士内乱!大逼宫啊,三大球星联合施压,逼管理层续约库明加

球童无忌
2025-09-20 01:24:05
2-0!2-1!欧冠刺激1夜:巴萨曼城开门红 新军首秀1-4惨败

2-0!2-1!欧冠刺激1夜:巴萨曼城开门红 新军首秀1-4惨败

叶青足球世界
2025-09-19 05:00:46
近况才曝就突传噩耗!封杀近4年,赵薇被毁了的,不止事业和婚姻

近况才曝就突传噩耗!封杀近4年,赵薇被毁了的,不止事业和婚姻

阿伧说事
2025-07-24 08:04:53
2010年,柳州女神莫菁不雅照事件,后来男友入狱,她怎样了?

2010年,柳州女神莫菁不雅照事件,后来男友入狱,她怎样了?

阿胡
2025-03-14 12:24:33
朱时茂没想到,《731》上映仅1天,陈佩斯因一特殊举动口碑暴涨

朱时茂没想到,《731》上映仅1天,陈佩斯因一特殊举动口碑暴涨

小丸子的娱乐圈
2025-09-19 13:32:48
郭凯敏二婚妻子现身,颜值爆表身份厉害,儿子是谁你知道吗?

郭凯敏二婚妻子现身,颜值爆表身份厉害,儿子是谁你知道吗?

橙星文娱
2025-09-19 15:10:21
失去“王储”位置,徐文婧连续3站无冠,中国女单面临“闹饥荒”

失去“王储”位置,徐文婧连续3站无冠,中国女单面临“闹饥荒”

真理是我亲戚
2025-09-19 15:55:37
女优望乃留衣闪亮出道!童颜丰满身材每周2次

女优望乃留衣闪亮出道!童颜丰满身材每周2次

葫芦哥爱吐槽
2025-09-20 02:59:45
人民日报亲自揭示全红婵真实境遇,郭晶晶的观点非常正确!

人民日报亲自揭示全红婵真实境遇,郭晶晶的观点非常正确!

乡野小珥
2025-09-19 14:39:18
一路走好!9月不到一半,又有4位名人传死讯,最大96岁,最小14岁

一路走好!9月不到一半,又有4位名人传死讯,最大96岁,最小14岁

春秋论娱
2025-09-19 16:17:34
糖尿病到最后都是咋去世的?医生叹息:去世前,一般都有2个症状

糖尿病到最后都是咋去世的?医生叹息:去世前,一般都有2个症状

宝哥精彩赛事
2025-09-10 16:48:27
2025-09-20 06:03:00
侃故事的阿庆
侃故事的阿庆
几分钟看完一部影视剧,诙谐幽默的娓娓道来
270文章数 6008关注度
往期回顾 全部

科技要闻

直击iPhone 17开售:消费者偏爱银色橙色

头条要闻

山东入室被抢男婴到15岁没见过汽车 养家从不让他出门

头条要闻

山东入室被抢男婴到15岁没见过汽车 养家从不让他出门

体育要闻

从轮椅到铜牌 他熬了7年:下个目标唱国歌!

娱乐要闻

全智贤被全面抵制!相关代言评论区沦陷

财经要闻

习近平同美国总统特朗普通电话

汽车要闻

对话周光:一个技术理想主义者的“蜕变”

态度原创

教育
时尚
家居
公开课
军事航空

教育要闻

分层教学就是搞歧视?家长和老师激烈争论

卡其裤+蓝衬衫,简单高级

家居要闻

公共艺术 限时体验打造

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

卫星图像显示以军坦克集结加沙城周围

无障碍浏览 进入关怀版