网易首页 > 网易号 > 正文 申请入驻

再获国际认可 作业帮大模型PoFT技术被AAAI 2025录用

0
分享至

【TechWeb】日前,第39届国际人工智能大会(AAAI 2025)如期召开。凭借显著的创新性和应用价值,作业帮研发的“偏好导向监督微调(PoFT)”技术被大会成功收录,技术覆盖深度学习、机器学习、自然语言处理、知识计算等多个前沿技术领域。作为中国计算机学会推荐的A类国际学术会议,AAAI收录的全球人工智能领域的顶尖学术成果,都经过了多轮严格评审。

在智能教育应用中,大语言模型的核心价值在于“理解指令并作出精准响应”。比如讲解数学题时,模型需兼顾解题步骤的严谨性与语言表达的通俗性,这就要求模型必须经过充分的“对齐训练”。但高质量教学类配对数据的构建成本极高,传统监督微调(SFT)技术采用的“交叉熵”损失函数平等对待所有训练样本,既无法突出核心知识点的学习权重,也容易让模型吸收低质内容,进而出现题目理解偏差、解答质量低下、表述不清等问题。

针对这一痛点,作业帮PoFT技术提出了创新性的解决方案,其核心思路是“以多模型为专家对学习数据进行权重打分”,让目标模型“有判断、有重点地高效学习”。在训练过程中,要求目标模型对同一数据的“置信度”(即模型自认回答正确的概率),必须超越这些标杆模型的平均水平,以此确保学习效果的可靠性。

与此同时,PoFT还具备良好的兼容性:既可结合现有数据过滤技术(如IFD、Instag)——先过滤明显劣质数据,再通过PoFT优化学习权重,进一步改善性能;也可与偏好对齐算法(如DPO)组成“两步训练”流程。在AlpacaEval 2.0基准测试中,PoFT+DPO组合方案的胜率较传统DPO高出2.74个百分点,尤其在复杂教学场景中过拟合风险显著降低。

教育应用对模型的容错率要求极低——例如同一数学题可能有多种解法,模型需精准识别“步骤更简洁”“逻辑更清晰”等细微偏好。若因学习低质量数据导致解析错误,极易误导学生。PoFT的做法是通过“标杆模型打分”机制,使模型优先学习优质数据,精准捕捉教学过程中的特殊偏好。目前,PoFT技术已经应用于智能解析、个性化辅导等产品中。

此次PoFT技术成功入选AAAI 2025,不仅体现了作业帮在大模型优化领域的技术实力,也为智能教育场景的模型适配提供了新思路,即无需依赖高成本优质数据,也可实现模型性能的稳定提升。据了解,作业帮自成立以来,一直致力于用技术手段解决教育痛点,在语音识别、自然语言处理、图像和OCR识别、大数据、云原生、音视频等技术领域持续探索,关键技术曾先后获得中国信通院应用优秀案例、卓越创新案例、MIT全球十大突破技术等多项国内外顶级奖项。(七喜)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
百万苏军压境,毛主席深夜召见四大元帅:徐向前刚进门,听完第一句话腿都软了

百万苏军压境,毛主席深夜召见四大元帅:徐向前刚进门,听完第一句话腿都软了

历史回忆室
2026-03-19 18:03:08
为嫁给美国人,56岁南京大妈奔赴美国,2年后嫁给70岁美国老头

为嫁给美国人,56岁南京大妈奔赴美国,2年后嫁给70岁美国老头

情感艺术家
2026-03-08 22:07:38
以色列多地遭导弹袭击 军事冲突以来超4000人送医

以色列多地遭导弹袭击 军事冲突以来超4000人送医

财联社
2026-03-20 23:38:20
腊肉先泡水还是先煮?10年大厨:第1步错了,难怪腊肉又咸又硬!

腊肉先泡水还是先煮?10年大厨:第1步错了,难怪腊肉又咸又硬!

思思夜话
2026-03-18 12:11:32
访美结束,高市笑颜不再,回国前说出唯一遗憾,东京对华豪赌开始

访美结束,高市笑颜不再,回国前说出唯一遗憾,东京对华豪赌开始

牛锅巴小钒
2026-03-21 03:49:12
突发!朱雨玲退赛,刚赢王曼昱的日本黑马替补参赛!大藤沙月首度回应取胜原因

突发!朱雨玲退赛,刚赢王曼昱的日本黑马替补参赛!大藤沙月首度回应取胜原因

最爱乒乓球
2026-03-21 00:06:48
金刻羽给特朗普献计:现有政策全部反过来,就能锁住中国发展

金刻羽给特朗普献计:现有政策全部反过来,就能锁住中国发展

福建平子
2026-03-21 09:14:00
1938年农妇巧遇林伯渠,打听失散10年丈夫,说出名字后被请到延安

1938年农妇巧遇林伯渠,打听失散10年丈夫,说出名字后被请到延安

比利
2026-03-20 19:17:56
小米su7 10 万销量算拉胯,发布半小时无销量战报

小米su7 10 万销量算拉胯,发布半小时无销量战报

小柱解说游戏
2026-03-20 14:43:20
劝告邱毅:不要在错误的道路越走越远

劝告邱毅:不要在错误的道路越走越远

寻墨阁
2026-03-20 16:55:09
田曦薇算不算中了基因彩票?父母颜值普通,却生出这么出挑的长相

田曦薇算不算中了基因彩票?父母颜值普通,却生出这么出挑的长相

可乐谈情感
2026-03-21 01:29:39
哈萨克斯坦80%石油宁愿绕远卖欧洲,为何就是不卖隔壁中国?真相让人意外

哈萨克斯坦80%石油宁愿绕远卖欧洲,为何就是不卖隔壁中国?真相让人意外

文史明鉴
2026-03-19 23:10:12
杀人诛心!以色列宣告“斩首行动”完工,伊朗瞬间被打回46年前?

杀人诛心!以色列宣告“斩首行动”完工,伊朗瞬间被打回46年前?

浯江孤舟
2026-03-02 09:16:12
社交潜规则:没有人有义务透过你邋遢的外表,去发现你优秀的内在

社交潜规则:没有人有义务透过你邋遢的外表,去发现你优秀的内在

清风拂心
2026-03-18 10:08:19
鲍威尔向特朗普宣战,深夜投下2个重磅炸弹,美元美股再遭双杀

鲍威尔向特朗普宣战,深夜投下2个重磅炸弹,美元美股再遭双杀

兴史兴谈
2026-03-20 22:01:14
他是恶贯满盈的特务,41岁逃到台湾,84岁在大街上说共产党的好话

他是恶贯满盈的特务,41岁逃到台湾,84岁在大街上说共产党的好话

元哥说历史
2026-03-20 18:35:03
大胜!杜兰特25+6申京15+10,湖人弃将拉胯,谢泼德14+4全队第三

大胜!杜兰特25+6申京15+10,湖人弃将拉胯,谢泼德14+4全队第三

鱼崖大话篮球
2026-03-21 10:29:19
一路走好?赵本山灵堂、大衣哥跳楼身亡、刘晓庆去世,谣言太荒唐

一路走好?赵本山灵堂、大衣哥跳楼身亡、刘晓庆去世,谣言太荒唐

李橑在北漂
2026-03-19 00:04:07
“内存暴涨”100天,千元机被迫死亡

“内存暴涨”100天,千元机被迫死亡

硅星人
2026-03-20 09:42:49
等到你曾孙辈,国内人口就剩4亿?生育率暴跌比韩国还快

等到你曾孙辈,国内人口就剩4亿?生育率暴跌比韩国还快

说话之外
2026-03-20 21:39:21
2026-03-21 11:12:49
TechWeb incentive-icons
TechWeb
做有态度的互联网资讯。
16686文章数 43072关注度
往期回顾 全部

科技要闻

宇树招股书拆解,人形机器人出货量第一!

头条要闻

特朗普招呼中国派军舰去护航 让西方媒体大呼出人意料

头条要闻

特朗普招呼中国派军舰去护航 让西方媒体大呼出人意料

体育要闻

6年前的一场悲剧,造就了“法国瓦尔迪”

娱乐要闻

总台首届电影盛典,“沈马”CP再合体

财经要闻

通胀警报拉响,加息潮要来了?

汽车要闻

小鹏汽车2025年Q4盈利净赚3.8亿 全年营收767亿

态度原创

教育
游戏
本地
旅游
手机

教育要闻

小升初求面积,学会方法,直接口算

《生化维罗妮卡RE》稳了!曝卡普空王牌组合操刀

本地新闻

春色满城关不住|绍兴春日顶流,这片樱花海藏不住了

旅游要闻

跟着“滇超”去旅行 | 大理↔迪庆:白族风情撞上藏地烟火

手机要闻

iPhone Fold:参数细节全揭秘!iPhone18 Plus:或明年春季来!

无障碍浏览 进入关怀版