网易首页 > 网易号 > 正文 申请入驻

大模型微调,实战,附代码

0
分享至

大家好,我是Ai学习的老章

分享一篇文章,我用Gemini做了精翻

本地微调Gemma 3 270M模型

谷歌发布了Gemma 3 270M,这是一个用于超高效本地AI的新模型!

只需0.5GB内存就可以在本地运行它。

今天,来学习如何微调这个模型,让它在下棋和预测下一步棋方面变得智能。

技术栈:

  • 使用Unsloth进行高效微调。

  • 使用HuggingFace transformers在本地运行。

加载模型

首先使用Unsloth加载Gemma 3 270M及其分词器。


定义LoRA配置

将使用LoRA进行高效微调。


为此,使用Unsloth的PEFT并指定:

  • 模型

  • LoRA低秩(r)

  • 用于微调的层(target_modules)

加载数据集

将微调Gemma 3,使其在下棋方面非常智能。


给定一系列先前的棋步(缺少一步)和最终结果,它必须预测出缺少的那一步。

为了做到这一点,使用了来自HuggingFace的ChessInstruct数据集。

准备数据集

接下来,使用对话式数据集来微调Gemma 3。


standardize_data_formats方法将数据集转换为用于微调的正确格式!

定义训练器

在这里,通过指定训练配置(如学习率、模型、分词器等)来创建一个训练器对象。


训练

完成这些后,开始训练。

损失通常会随着步骤的增加而减少,这意味着模型正在被正确地微调。


最后,这张图片展示了在微调前后提示LLM的情况:


经过微调后,模型能够找到确切的缺失棋步,而不是随机生成一些棋步。

很简单,不是吗?

原文:https://blog.dailydoseofds.com/p/fine-tuning-gemma-3-270m-locally

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
满载40吨黄金的日本“阿波丸”,中国打捞上岸后,所有人都愣住了

满载40吨黄金的日本“阿波丸”,中国打捞上岸后,所有人都愣住了

鉴史录
2026-01-23 10:46:34
Shams:老鹰送出克雷伊奇,换来开拓者中锋杜普-里斯和两个次轮

Shams:老鹰送出克雷伊奇,换来开拓者中锋杜普-里斯和两个次轮

懂球帝
2026-02-02 01:32:24
江诗丹顿手表1元起拍,因“未达到保留价”流拍,拍卖公司人员回应:起拍价是处置单位设定

江诗丹顿手表1元起拍,因“未达到保留价”流拍,拍卖公司人员回应:起拍价是处置单位设定

红星资本局
2026-02-01 15:24:17
订单暴增!年夜饭私厨上门服务火了,价格涨到三倍仍供不应求

订单暴增!年夜饭私厨上门服务火了,价格涨到三倍仍供不应求

上观新闻
2026-02-02 06:49:12
一场虚荣的“抓周宴”被群嘲,网友:普通家庭,才靠许愿逃避现实

一场虚荣的“抓周宴”被群嘲,网友:普通家庭,才靠许愿逃避现实

妍妍教育日记
2026-01-16 17:07:38
徒手登顶台北101!美国运动员手指粗得像香肠:我不想死 也很害怕

徒手登顶台北101!美国运动员手指粗得像香肠:我不想死 也很害怕

念洲
2026-02-01 14:37:30
“好标准的技校脸”,技校女生大合照火了,网友:能把老实人打傻

“好标准的技校脸”,技校女生大合照火了,网友:能把老实人打傻

妍妍教育日记
2026-01-30 20:54:12
利物浦压哨重磅签约 7000万欧敲定20岁天才中卫 近半年已花5.53亿

利物浦压哨重磅签约 7000万欧敲定20岁天才中卫 近半年已花5.53亿

我爱英超
2026-02-02 07:22:32
85岁老人被指漏水到楼下,自砸地板证清白全程公证,结果:没渗漏;“冤枉”业主物业该担何责?律师说法

85岁老人被指漏水到楼下,自砸地板证清白全程公证,结果:没渗漏;“冤枉”业主物业该担何责?律师说法

大风新闻
2026-02-01 20:16:03
我不配全明星?伦纳德刷新个人纪录,快船大胜太阳,狄龙空砍23分

我不配全明星?伦纳德刷新个人纪录,快船大胜太阳,狄龙空砍23分

毒舌NBA
2026-02-02 11:40:19
最高法院出裁定。储户大额存款消失银行不担责的裁判惯例将终结

最高法院出裁定。储户大额存款消失银行不担责的裁判惯例将终结

新类型案例解读1
2026-02-01 19:13:33
全程频繁捂嘴,台词含糊不清,视帝佟大为坐镇都带不动这个拖油瓶

全程频繁捂嘴,台词含糊不清,视帝佟大为坐镇都带不动这个拖油瓶

流云随风去远方
2026-01-31 13:12:51
央视春晚第三次联排!近十年最强阵容,网友:今年春晚总算有救了

央视春晚第三次联排!近十年最强阵容,网友:今年春晚总算有救了

杨仔述
2026-01-31 18:16:31
一人睡遍整个娱乐圈?司晓迪打响了2026年第一炮

一人睡遍整个娱乐圈?司晓迪打响了2026年第一炮

阅毒君
2026-01-05 07:05:06
2016年肯尼亚单方面撕毁与中企的合作合同,拒不赔付176亿违约金,还逼迫中方退还43亿

2016年肯尼亚单方面撕毁与中企的合作合同,拒不赔付176亿违约金,还逼迫中方退还43亿

史海孤雁
2026-02-01 17:32:24
我升任市长后,参加初恋婚礼被嘲讽,临走时司机一句话全场静寂

我升任市长后,参加初恋婚礼被嘲讽,临走时司机一句话全场静寂

墨染尘香
2025-11-21 19:43:57
一个残酷的真相:夜空中7000颗星星,全都位于银河系范围内

一个残酷的真相:夜空中7000颗星星,全都位于银河系范围内

观察宇宙
2026-01-31 20:29:00
阿伦生涯之夜!29分钟轰40+17连刷新高 完爆克林根骑士官方晒海报

阿伦生涯之夜!29分钟轰40+17连刷新高 完爆克林根骑士官方晒海报

颜小白的篮球梦
2026-02-02 12:19:43
Kimi公开喊话百度:搜官网前4条全是广告!有网友称被坑199元

Kimi公开喊话百度:搜官网前4条全是广告!有网友称被坑199元

新浪财经
2026-02-01 16:43:37
金价急跌之下,银行密集提示风险,部分实物金全线售罄

金价急跌之下,银行密集提示风险,部分实物金全线售罄

第一财经资讯
2026-02-01 20:36:14
2026-02-02 12:31:00
机器学习与Python社区 incentive-icons
机器学习与Python社区
机器学习算法与Python
3245文章数 11083关注度
往期回顾 全部

科技要闻

元宝发10亿红包,阿里千问:我跟30亿

头条要闻

30岁男子如厕时猝死 妻子回忆事发前5天丈夫疼痛细节

头条要闻

30岁男子如厕时猝死 妻子回忆事发前5天丈夫疼痛细节

体育要闻

澳网男单决赛,属于阿尔卡拉斯的加冕仪式

娱乐要闻

周杰伦带王俊凯陈奕迅聚餐 畅聊音乐

财经要闻

国六货车被迫"换头" 每次收费超200元

汽车要闻

岚图汽车1月交付10515辆 同比增长31%

态度原创

艺术
家居
教育
时尚
军事航空

艺术要闻

马斯克花5万买的折叠屋,是预制住宅的未来吗?

家居要闻

现代几何彩拼 智焕童梦居

教育要闻

牛津荣登榜首!2026QS欧洲大学排名公布!

普通人衣服没必要买太多,准备好这些单品,简单实用又耐看

军事要闻

委内瑞拉外长会见美外交使团团长

无障碍浏览 进入关怀版