网易首页 > 网易号 > 正文 申请入驻

Keras 3.0一统江湖!大更新整合PyTorch、JAX,全球250万开发者在用了

0
分享至

新智元报道

编辑:编辑部

【新智元导读】今天,备受广大开发者欢迎的深度学习框架Keras,正式更新了3.0版本,实现了对PyTorch和JAX的支持,同时性能提升,还能轻松实现大规模分布式训练。

刚刚,Keras 3.0正式发布!

经过5个月的公开Beta测试,深度学习框架Keras 3.0终于面向所有开发者推出。

全新的Keras 3对Keras代码库进行了完全重写,可以在JAX、TensorFlow和PyTorch上运行,能够解锁全新大模型训练和部署的新功能。

「Keras之父」François Chollet在最新版本发布之前,也是做了多次预告。目前,有250+万的开发者都在使用Keras框架。

重磅消息:我们刚刚发布了 Keras 3.0! 在 JAX、TensorFlow 和 PyTorch 上运行 Keras 使用 XLA 编译更快地训练 通过新的 Keras 分发 API 解锁任意数量的设备和主机的训练运行 它现在在 PyPI 上上线

开发者甚至可以将Keras用作低级跨框架语言,以开发自定义组件,例如层、模型或指标。

只需一个代码库,这些组件便可用在JAX、TensorFlow、PyTorch中的原生工作流。

再次让Keras成为多后端

最初的Keras可以在Theano、TensorFlow、CNTK,甚至MXNet上运行。

2018年,由于Theano和CNTK已停止开发,TensorFlow似乎成为了唯一可行的选择,于是,Keras将开发重点放在了TensorFlow上。

而到了今年,情况发生了变化。

根据2023年StackOverflow开发者调查,和2022年Kaggle机器学习和数据科学调查等显示,

TensorFlow拥有55%到60%的市场份额,是ML在生产领域的首选。

而PyTorch拥有40%到45%的市场份额,是ML在研究领域的首选。

与此同时,JAX虽然市场份额要小得多,但已被Google DeepMind、Midjourney、Cohere等生成式AI领域的顶级参与者所接受。

于是,开发团队对Keras代码库进行了完全重写,新诞生的Keras 3.0基于模块化后端架构进行了重构,有能力在任意框架上运行。

同时新的Keras也保证了兼容性,比如在使用TensorFlow后端时,你可以简单地使用 import keras_core as keras 来替换from tensorflow import keras

——现有的代码将毫无问题地运行,而且由于 XLA 编译,通常性能略有提高。

Keras vs. TensorFlow

小编在这里给大家举一个例子,说明如何从TensorFlow的代码转换成Keras的形式。

TensorFlow Core Implementation

Keras implementation

相比之下,我们可以清楚地看到Keras带来的简洁性。

TensorFlow可以对每个变量进行更精细的控制,而Keras提供了易用性和快速原型设计的能力。

对于一些开发者来说,Keras省去了开发中的一些麻烦,降低了编程复杂性,节省了时间成本。

Keras 3.0新特性

Keras最大的优势在于,通过出色的UX、API设计和可调试性可实现高速开发。

而且,它还是一个经过实战考验的框架,并为世界上一些最复杂、最大规模的ML系统提供支持,比如Waymo自动驾驶车、YouTube推荐引擎。

那么,使用新的多后端Keras 3还有哪些额外的优势呢?

- 始终为模型获得最佳性能。

在基准测试中,发现JAX通常在GPU、TPU和CPU上提供最佳的训练和推理性能,但结果因模型而异,因为非XLA TensorFlow在GPU上偶尔会更快。

它能够动态选择为模型提供最佳性能的后端,而无需对代码进行任何更改,这意味着开发者可以以最高效率进行训练和服务。

- 为模型解锁生态系统可选性。

任何Keras 3模型都可以作为PyTorch模块实例化,可以作为 TensorFlow SavedModel 导出,也可以作为无状态 JAX 函数实例化。

这意味着开发者可以将Keras 3模型与PyTorch生态系统包,全系列TensorFlow部署和生产工具(如TF-Serving,TF.js和TFLite)以及JAX大规模TPU训练基础架构一起使用。使用 Keras 3 API 编写一个 model.py ,即可访问 ML 世界提供的一切。

- 利用JAX的大规模模型并行性和数据并行性。

Keras 3包含一个全新的分布式 API,即keras.distribution 命名空间,目前已在JAX后端实现(即将在TensorFlow和PyTorch后端实现)。

通过它,可以在任意模型尺度和聚类尺度上轻松实现模型并行、数据并行以及两者的组合。由于它能将模型定义、训练逻辑和分片配置相互分离,因此使分发工作流易于开发和维护。

- 最大限度地扩大开源模型版本的覆盖面。

想要发布预训练模型?想让尽可能多的人能够使用它吗?如果你在纯TensorFlow或PyTorch中实现它,它将被大约一半的社区使用。

如果你在Keras 3中实现了它,那么任何人都可以立即使用它,无论他们选择的框架是什么(即使他们自己不是Keras用户)。在不增加开发成本的情况下实现2倍的影响。

- 使用来自任何来源的数据管道。

Keras 3 / fit() / evaluate() predict() 例程与 tf.data.Dataset 对象、PyTorch DataLoader 对象、NumPy 数组、Pandas 数据帧兼容——无论你使用什么后端。你可以在 PyTorch DataLoader 上训练 Keras 3 + TensorFlow 模型,也可以在tf.data.Dataset上训练Keras 3 + PyTorch模型。

预训练模型

现在,开发者即可开始使用Keras 3的各种预训练模型。

所有40个Keras应用程序模型( keras.applications 命名空间)在所有后端都可用。KerasCV和KerasNLP中的大量预训练模型也适用于所有后端。

其中包括:

- BERT - OPT - Whisper - T5 - Stable Diffusion - YOLOv8
跨框架开发

Keras 3能够让开发者创建在任何框架中都相同的组件(如任意自定义层或预训练模型),它允许访问适用于所有后端的 keras.ops 命名空间。

Keras 3包含NumPy API的完整实现,——不是「类似 NumPy」,而是真正意义上的 NumPy API,具有相同的函数和参数。比如 ops.matmul、ops.sum、ops.stack、ops.einsum 等函数。

Keras 3还包含NumPy中没有的,一组特定于神经网络的函数,例如 ops.softmax, ops.binary_crossentropy, ops.conv等。

另外,只要开发者使用的运算,全部来自于keras.ops ,那么自定义的层、损失函数、优化器就可以跨越JAX、PyTorch和TensorFlow,使用相同的代码。

开发者只需要维护一个组件实现,就可以在所有框架中使用它。

Keras架构

下面,我们来稍稍理解一下Keras的机制和架构。

在Keras中,Sequential 和 Model 类是模型构建的核心,为组装层和定义计算图提供了一个框架。

Sequential 是层的线性堆栈。它是Model 的子类,专为简单情况而设计,模型由具有一个输入和一个输出的线性层堆栈组成。

Sequential 类有以下一些主要特点:

简单性:只需按照要执行的顺序列出图层即可。 自动前向传递:当向Sequential模型添加层时,Keras会自动将每一层的输出连接到下一层的输入,从而创建前向传递,而无需手动干预。 内部状态管理:Sequential管理层的状态(如权重和偏置)和计算图。调用compile时,它会通过指定优化器、损失函数和指标来配置学习过程。 训练和推理:Sequential类提供了fit、evaluate和predict等方法,分别用于训练、评估和预测模型。这些方法在内部处理训练循环和推理过程。

Model类与函数式API一起使用,提供了比Sequential更大的灵活性。它专为更复杂的架构而设计,包括具有多个输入或输出、共享层和非线性拓扑的模型。

Model 类的主要特点有:

层图:Model允许创建层图,允许一个层连接到多个层,而不仅仅是上一个层和下一个层。 显式输入和输出管理:在函数式API中,可以显式定义模型的输入和输出。相比于Sequential,可以允许更复杂的架构。 连接灵活性:Model类可以处理具有分支、多个输入和输出以及共享层的模型,使其适用于简单前馈网络以外的广泛应用。 状态和训练管理:Model类管理所有层的状态和训练过程,同时提供了对层的连接方式,以及数据在模型中的流动方式的更多控制。

Model 类和 Sequential类都依赖于以下机制:

层注册:在这些模型中添加层时,层会在内部注册,其参数也会添加到模型的参数列表中。 自动微分:在训练过程中,Keras使用后端引擎(TensorFlow等)提供的自动微分来计算梯度。这一过程对用户而言是透明的。 后端执行:实际计算(如矩阵乘法、激活等)由后端引擎处理,后端引擎执行模型定义的计算图。 序列化和反序列化:这些类包括保存和加载模型的方法,其中涉及模型结构和权重的序列化。

从本质上讲,Keras中的Model和Sequential类抽象掉了定义和管理计算图所涉及的大部分复杂性,使用户能够专注于神经网络的架构,而不是底层的计算机制。

Keras 自动处理各层如何相互连接、数据如何在网络中流动以及如何进行训练和推理操作等错综复杂的细节。

对于Keras的大更新,有网友使用下面的图片表达自己的看法:

虽然小编也不知道为什么要炸TensorFlow。

还有网友表示刚好可以用上:

另一位网友发来贺电,「在PyTorch之上使用Keras是一项了不起的成就!」

当然也有网友唱反调,「我想知道为什么有人会使用Keras + Torch而不是普通的 Torch,因为Torch与Tensorflow不同,它有一组很好的API」。

此时Tensorflow的内心:啊对对对,你们说得都对。

参考资料:

https://twitter.com/fchollet/status/1729512791894012011

https://keras.io/keras_3/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
女乘客情绪激动,暴雨中两次强行开门!“她说要去深圳湾”,司机立即报警

女乘客情绪激动,暴雨中两次强行开门!“她说要去深圳湾”,司机立即报警

南方都市报
2026-05-11 21:36:42
9.3亿罚款+全球禁售?扒一扒“杜卡迪起诉张雪机车”背后的惊天谣言!

9.3亿罚款+全球禁售?扒一扒“杜卡迪起诉张雪机车”背后的惊天谣言!

沙雕小琳琳
2026-05-12 19:22:21
早报:美国总统特朗普对中国进行国事访问;降噪耳机受害者出现;FIFA官网没有中文模式惹恼中国网友

早报:美国总统特朗普对中国进行国事访问;降噪耳机受害者出现;FIFA官网没有中文模式惹恼中国网友

岸标财经
2026-05-13 03:32:55
黔江奔驰撞人后续,6名伤者身份首曝,肇事女医师处理结果出了

黔江奔驰撞人后续,6名伤者身份首曝,肇事女医师处理结果出了

坠入二次元的海洋
2026-05-13 01:11:15
研究表明:性生活次数不达标,不管男女容易早衰且癌症风险增高!

研究表明:性生活次数不达标,不管男女容易早衰且癌症风险增高!

黯泉
2026-05-03 20:25:37
摩洛哥姑娘嫁江苏农村小伙,婚礼全程开心大笑,摄影师感慨:拍了七年婚礼没见过这样的

摩洛哥姑娘嫁江苏农村小伙,婚礼全程开心大笑,摄影师感慨:拍了七年婚礼没见过这样的

可达鸭面面观
2026-05-10 13:46:52
伊朗:已将高浓缩铀送往第三国!若谈判失败,伊朗会将其取回

伊朗:已将高浓缩铀送往第三国!若谈判失败,伊朗会将其取回

AI商业论
2026-05-11 08:36:11
雅迪爱玛不香了?内行人透露:最值得买的6个高性价比电动车品牌

雅迪爱玛不香了?内行人透露:最值得买的6个高性价比电动车品牌

老特有话说
2026-05-12 15:40:47
阔腿裤彻底失宠了,今年流行的是“豆角裤”,洋气百搭还显腿直

阔腿裤彻底失宠了,今年流行的是“豆角裤”,洋气百搭还显腿直

去山野间追风
2026-05-12 18:09:09
国家一级女演员陈丽云被逮捕!

国家一级女演员陈丽云被逮捕!

许三岁
2026-03-28 09:24:30
刚刚,四川突发地震!

刚刚,四川突发地震!

吉刻新闻
2026-05-12 21:53:03
为啥建议尽量用现金支付?3个现实原因,看完你也会揣现金出门

为啥建议尽量用现金支付?3个现实原因,看完你也会揣现金出门

老特有话说
2026-05-10 21:01:02
妻子参加同学聚会,我扮服务员潜入,见妻子被求婚她答应,我鼓掌

妻子参加同学聚会,我扮服务员潜入,见妻子被求婚她答应,我鼓掌

千秋历史
2026-05-11 20:35:52
“你儿子比农村土狗还好养!”中学男孩全碳水饮食,吃出可怜面相

“你儿子比农村土狗还好养!”中学男孩全碳水饮食,吃出可怜面相

妍妍教育日记
2026-05-12 17:35:01
U17国足晋级世少赛!21年首次,生死战完胜卡塔尔,连破3魔咒

U17国足晋级世少赛!21年首次,生死战完胜卡塔尔,连破3魔咒

奥拜尔
2026-05-13 01:55:29
白人女性与黑人女性的体味差异,网友真实分享引发热议

白人女性与黑人女性的体味差异,网友真实分享引发热议

特约前排观众
2025-12-22 00:20:06
2-0!恭喜中国男足,时隔21年再进世少赛,宋凯完成2大突破

2-0!恭喜中国男足,时隔21年再进世少赛,宋凯完成2大突破

何老师呀
2026-05-13 02:57:36
21年首次晋级世少赛!U17国足一雪前耻,2026五大目标已完成

21年首次晋级世少赛!U17国足一雪前耻,2026五大目标已完成

奥拜尔
2026-05-13 01:56:27
记者:麦基和斯佩尔曼这俩大爷的态度 北京未来很难过上海这一关

记者:麦基和斯佩尔曼这俩大爷的态度 北京未来很难过上海这一关

狼叔评论
2026-05-13 01:50:16
为何说年龄超过80岁的人:即便身体健康,也没有多少来日方长?

为何说年龄超过80岁的人:即便身体健康,也没有多少来日方长?

芹姐说生活
2026-05-10 14:11:36
2026-05-13 04:27:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
15194文章数 66863关注度
往期回顾 全部

科技要闻

宇树发布载人变形机甲,定价390万元起

头条要闻

特朗普称将同中方讨论对台军售和黎智英案 外交部回应

头条要闻

特朗普称将同中方讨论对台军售和黎智英案 外交部回应

体育要闻

骑士终于玩明白了?

娱乐要闻

白鹿风波升级!掉粉20万评论区沦陷

财经要闻

利润再腰斩 京东干外卖后就没过过好日子

汽车要闻

吉利银河“TT”申报图曝光 电动尾翼+激光雷达

态度原创

游戏
家居
本地
手机
时尚

活久见!电棍与香锅怒喷被撸圈开除后和解,祝Mlxg母亲节日快乐

家居要闻

极简主义下的居住场域与空间

本地新闻

用苏绣的方式,打开江西婺源

手机要闻

Android推新功能“暂停点” 助用户摆脱刷手机上瘾

普通人真该学学如何穿搭!多穿裙子比裤子更时髦,大方提气质

无障碍浏览 进入关怀版