网易首页 > 网易号 > 正文 申请入驻

百度文心4.5来袭!英特尔Day0即支持端侧部署

0
分享至

今天,百度正式发布文心大模型4.5系列开源模型。英特尔OpenVINOTM与百度飞桨多年来一直保持着紧密的合作。在此次文心系列模型的发布过程中,英特尔借助OpenVINOTM在模型发布的第零日即实现对文心端侧模型的适配和在英特尔酷睿Ultra平台上的端侧部署。
OpenVINOTM工具套件是由英特尔开发的开源工具套件,旨在优化和加速深度学习模型的推理性能,支持跨平台部署并充分利用英特尔硬件资源。OpenVINOTM助力行业中广泛的先进模型在英特尔人工智能产品和解决方案中的性能,应用在AI PC、边缘AI和更多人工智能的使用场景当中。
从2021年开始,百度飞桨和英特尔OpenVINOTM进行深入合作,双方进行深度适配,为开发者提供了更有效更便捷的AI开发工具链。经过双方适配的众多模型,如PaddleOCR,PaddleSeg,PaddleDection等,在金融、医疗、智能智造等领域被广泛应用,开发者可以直接将飞桨模型用OpenVINOTM推理和部署,或通过OpenVINOTM的模型优化器转化为IR格式,进一步部署和推理。
今天,百度基于多年积累的雄厚的AI技术实力,为业界带来了开源的文心4.5系列大模型。英特尔宣布OpenVINOTM已经对0.3B参数量的稠密模型成功适配,并在英特尔酷睿Ultra平台上成功部署且获得了优异的推理性能。
英特尔助力百度文心大模型的首次亮相,共同为行业带来全新的人工智能体验。接下来,英特尔将持续与百度保持紧密合作,适配更多的文心系列模型,携手拓宽AI技术的新边界。
快速上手指南 (Get Started)
第一步,环境准备
基于以下命令可以完成模型部署任务在Python上的环境安装。
python -m venv py_venv
./py_venv/Scripts/activate.bat
pip install --pre -U openvino-genai --extra-index-url https://storage.openvinotoolkit.org/simple/wheels/nightly
pip install nncf
pip install git+https://github.com/openvino-dev-samples/optimum-intel.git@ernie
第二步,模型下载和转换
在部署模型之前,我们首先需要将原始的PyTorch模型转换为OpenVINOTM的IR静态图格式,并对其进行压缩,以实现更轻量化的部署和最佳的性能表现。通过Optimum提供的命令行工具optimum-cli,我们可以一键完成模型的格式转换和权重量化任务:
optimum-cli export openvino --model baidu/ERNIE-4.5-0.3B-PT --task text-generation-with-past --weight-format fp16 --trust-remote-code ERNIE-4.5-0.3B-PT-OV
开发者可以根据模型的输出结果,调整其中的量化参数,包括:
--model: 为模型在HuggingFace上的model id,这里我们也提前下载原始模型,并将model id替换为原始模型的本地路径,针对国内开发者,推荐使用ModelScope魔搭社区作为原始模型的下载渠道,具体加载方式可以参考ModelScope官方指南:https://www.modelscope.cn/docs/models/download
--weight-format:量化精度,可以选择fp32,fp16,int8,int4,int4_sym_g128,int4_asym_g128,int4_sym_g64,int4_asym_g64
--group-size:权重里共享量化参数的通道数量
--ratio:int4/int8权重比例,默认为1.0,0.6表示60%的权重以int4表,40%以int8表示
--sym:是否开启对称量化
第三步,模型部署
针对ERNIE-4.5系列的文本生成类模型,我们可以使用Optimum-Intel进行任务部署和加速。Optimum-Intel可以通过调用OpenVINOTM runtime后端,以实现在Intel CPU及GPU平台上的性能优化,同时由于其兼容Transformers库,因此我们可以直接参考官方示例,将其迁移至Optimum-Intel执行。
from transformers import AutoTokenizer
from optimum.intel import OVModelForCausalLM
model_path = "ERNIE-4.5-0.3B-PT-OV"
# load the tokenizer and the model
tokenizer = AutoTokenizer.from_pretrained(model_path, trust_remote_code=True)
model = OVModelForCausalLM.from_pretrained(model_path, trust_remote_code=True)
# prepare the model input
prompt = "Give me a short introduction to large language model."
messages = [
{"role": "user", "content": prompt}
]
text = tokenizer.apply_chat_template(
messages,
tokenize=False,
add_generation_prompt=True
)
model_inputs = tokenizer([text], add_special_tokens=False, return_tensors="pt").to(model.device)
# conduct text completion
generated_ids = model.generate(
model_inputs.input_ids,
max_new_tokens=1024
)
output_ids = generated_ids[0][len(model_inputs.input_ids[0]):].tolist()
# decode the generated ids
generate_text = tokenizer.decode(output_ids, skip_special_tokens=True).strip("\n")
print("generate_text:", generate_text)
输入结果参考:
generate_text: "Large Language Models (LLMs) are AI-powered tools that use natural language processing (NLP) techniques to generate human-like text, answer questions, and perform reasoning tasks. They leverage massive datasets, advanced algorithms, and computational power to process, analyze, and understand human language, enabling conversational AI that can understand, interpret, and respond to a wide range of inputs. Their applications range from customer support to academic research, from language translation to creative content generation."

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
这张照片是2014年张雪峰和他的妻子李丽婧,在清华大学拍的结婚照

这张照片是2014年张雪峰和他的妻子李丽婧,在清华大学拍的结婚照

喜欢历史的阿繁
2026-04-11 06:47:10
真实的酒吧夜店女孩,只是看起来很漂亮

真实的酒吧夜店女孩,只是看起来很漂亮

微微热评
2026-04-13 12:18:55
詹妮弗・劳伦斯纽约出街 波西米亚混搭运动风松弛感拉满

詹妮弗・劳伦斯纽约出街 波西米亚混搭运动风松弛感拉满

述家娱记
2026-04-16 17:28:15
男子被安全送回,又自行取车坠亡,家属向6名酒友,索赔29万!

男子被安全送回,又自行取车坠亡,家属向6名酒友,索赔29万!

川渝视觉
2026-04-19 21:58:34
新疆油气资源潜力巨大:或超越中东,新疆油气新篇章即将开启

新疆油气资源潜力巨大:或超越中东,新疆油气新篇章即将开启

叮当当科技
2026-04-20 18:13:19
震惊!月薪3000、26岁株洲女子征婚,要对方月入2.5万、存款200万

震惊!月薪3000、26岁株洲女子征婚,要对方月入2.5万、存款200万

火山詩话
2026-04-18 13:20:01
自然资源部:日本地震或在震源周围引发局地海啸,但不会对我国沿岸造成影响

自然资源部:日本地震或在震源周围引发局地海啸,但不会对我国沿岸造成影响

界面新闻
2026-04-20 16:13:03
景甜为顶级富豪代Y生子!?

景甜为顶级富豪代Y生子!?

八卦疯叔
2026-04-18 09:48:56
满油满电可跑2105km!2026款比亚迪海狮05上市:9.79万起

满油满电可跑2105km!2026款比亚迪海狮05上市:9.79万起

快科技
2026-04-20 21:58:15
我发现一个残酷真相:孩子长大后,最怨恨的不是管太严的父母……

我发现一个残酷真相:孩子长大后,最怨恨的不是管太严的父母……

新东方家庭教育
2026-04-20 11:10:07
大量硼砂,别再给家里人吃了!这10类食物最易掺硼砂,超危险

大量硼砂,别再给家里人吃了!这10类食物最易掺硼砂,超危险

笑熬浆糊111
2026-04-13 00:05:12
河南新乡21岁男生失联10天,自称去安徽跑外卖,最后现身云南边境,警方已介入调查

河南新乡21岁男生失联10天,自称去安徽跑外卖,最后现身云南边境,警方已介入调查

极目新闻
2026-04-20 21:15:49
市场上这5种鱼,目前无法人工养殖,都是野生鱼,肉厚刺少营养高

市场上这5种鱼,目前无法人工养殖,都是野生鱼,肉厚刺少营养高

秀厨娘
2026-04-15 10:25:17
女生主动起来有多黏人?网友:这些女的太开放了

女生主动起来有多黏人?网友:这些女的太开放了

带你感受人间冷暖
2026-01-27 00:20:06
今日!CCTV16直播中超,CCTV5斯诺克,网络转NBA+女篮世界杯抽签

今日!CCTV16直播中超,CCTV5斯诺克,网络转NBA+女篮世界杯抽签

晚池
2026-04-21 01:02:00
410次开房记录流出:央企“女老虎”陶荔芳,背后还有多少同伙

410次开房记录流出:央企“女老虎”陶荔芳,背后还有多少同伙

深度报
2025-12-14 22:36:54
曝全红婵回广东队恢复训练!亚运会选拔赛复出 周继红力保她为国出战?

曝全红婵回广东队恢复训练!亚运会选拔赛复出 周继红力保她为国出战?

喜欢历史的阿繁
2026-04-20 12:53:08
【美股盘前】美伊第二轮谈判前景不明,三大期指走低,布油涨6%;迈威尔科技涨5.6%,据称正与谷歌洽谈开发两款新芯片;太空概念股走低,AST SpaceM...

【美股盘前】美伊第二轮谈判前景不明,三大期指走低,布油涨6%;迈威尔科技涨5.6%,据称正与谷歌洽谈开发两款新芯片;太空概念股走低,AST SpaceM...

每日经济新闻
2026-04-20 18:03:12
斯诺克6席16强诞生!中国德比上演,70后巅峰对决,囧哥3-6或翻车

斯诺克6席16强诞生!中国德比上演,70后巅峰对决,囧哥3-6或翻车

刘姚尧的文字城堡
2026-04-20 21:02:20
江苏一地最新人事任免

江苏一地最新人事任免

一口娱乐
2026-04-20 13:42:23
2026-04-21 05:32:49
GEEK极客 incentive-icons
GEEK极客
中国最具影响力的创意生活杂志
1272文章数 2646关注度
往期回顾 全部

科技要闻

HUAWEI Pura X Max发布 售价10999元起

头条要闻

19岁女孩挪用自家1700万当"榜一大姐" 亲爹带女儿自首

头条要闻

19岁女孩挪用自家1700万当"榜一大姐" 亲爹带女儿自首

体育要闻

阿森纳已拼尽全力,但你早干嘛去了...

娱乐要闻

《八千里路云和月》田家泰暗杀

财经要闻

利润暴跌7成,字节到底在做什么

汽车要闻

把天门山搬进厂?开仰望U8冲上45度坡的那刻 我腿软了

态度原创

艺术
本地
亲子
房产
数码

艺术要闻

沙特官宣:全球最大单体建筑,延期十年!网友:又是画饼?

本地新闻

12吨巧克力有难,全网化身超级侦探添乱

亲子要闻

【孤独症科普】啥是孤独症,哪些孩子易发生,如何应对?

房产要闻

大规模商改住!海口西海岸,这波项目要赢麻了!

数码要闻

REDMI 显示器 G Pro 27U 2026轻体验:电竞利器 桌面上的“小钢炮”

无障碍浏览 进入关怀版