网易首页 > 网易号 > 正文 申请入驻

再获国际认可 作业帮大模型PoFT技术被AAAI 2025录用

0
分享至

【TechWeb】日前,第39届国际人工智能大会(AAAI 2025)如期召开。凭借显著的创新性和应用价值,作业帮研发的“偏好导向监督微调(PoFT)”技术被大会成功收录,技术覆盖深度学习、机器学习、自然语言处理、知识计算等多个前沿技术领域。作为中国计算机学会推荐的A类国际学术会议,AAAI收录的全球人工智能领域的顶尖学术成果,都经过了多轮严格评审。

在智能教育应用中,大语言模型的核心价值在于“理解指令并作出精准响应”。比如讲解数学题时,模型需兼顾解题步骤的严谨性与语言表达的通俗性,这就要求模型必须经过充分的“对齐训练”。但高质量教学类配对数据的构建成本极高,传统监督微调(SFT)技术采用的“交叉熵”损失函数平等对待所有训练样本,既无法突出核心知识点的学习权重,也容易让模型吸收低质内容,进而出现题目理解偏差、解答质量低下、表述不清等问题。

针对这一痛点,作业帮PoFT技术提出了创新性的解决方案,其核心思路是“以多模型为专家对学习数据进行权重打分”,让目标模型“有判断、有重点地高效学习”。在训练过程中,要求目标模型对同一数据的“置信度”(即模型自认回答正确的概率),必须超越这些标杆模型的平均水平,以此确保学习效果的可靠性。

与此同时,PoFT还具备良好的兼容性:既可结合现有数据过滤技术(如IFD、Instag)——先过滤明显劣质数据,再通过PoFT优化学习权重,进一步改善性能;也可与偏好对齐算法(如DPO)组成“两步训练”流程。在AlpacaEval 2.0基准测试中,PoFT+DPO组合方案的胜率较传统DPO高出2.74个百分点,尤其在复杂教学场景中过拟合风险显著降低。

教育应用对模型的容错率要求极低——例如同一数学题可能有多种解法,模型需精准识别“步骤更简洁”“逻辑更清晰”等细微偏好。若因学习低质量数据导致解析错误,极易误导学生。PoFT的做法是通过“标杆模型打分”机制,使模型优先学习优质数据,精准捕捉教学过程中的特殊偏好。目前,PoFT技术已经应用于智能解析、个性化辅导等产品中。

此次PoFT技术成功入选AAAI 2025,不仅体现了作业帮在大模型优化领域的技术实力,也为智能教育场景的模型适配提供了新思路,即无需依赖高成本优质数据,也可实现模型性能的稳定提升。据了解,作业帮自成立以来,一直致力于用技术手段解决教育痛点,在语音识别、自然语言处理、图像和OCR识别、大数据、云原生、音视频等技术领域持续探索,关键技术曾先后获得中国信通院应用优秀案例、卓越创新案例、MIT全球十大突破技术等多项国内外顶级奖项。(七喜)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
意外!阿奇姆彭刚从河南队离开,就转身加盟津门虎?于根伟乐开花

意外!阿奇姆彭刚从河南队离开,就转身加盟津门虎?于根伟乐开花

罗掌柜体育
2026-01-08 06:10:03
四大人气股巅峰对决!利欧股份等谁是真王者?数据说真相

四大人气股巅峰对决!利欧股份等谁是真王者?数据说真相

慧眼看世界哈哈
2026-01-08 10:26:01
隆力奇旗下羊奶粉涉嫌传销,卖货“拉人头”遭多人举报

隆力奇旗下羊奶粉涉嫌传销,卖货“拉人头”遭多人举报

南方都市报
2026-01-08 16:19:37
画火吴营村日入800万,却喂不饱村民贪婪!他要逃离,太寒心

画火吴营村日入800万,却喂不饱村民贪婪!他要逃离,太寒心

鋭娱之乐
2026-01-04 21:37:14
折磨人的生理反应有哪些?网友:排卵期就想穿性感一点

折磨人的生理反应有哪些?网友:排卵期就想穿性感一点

带你感受人间冷暖
2026-01-04 00:10:07
我老了,它却变年轻了,新一代奥迪A6L实车曝光

我老了,它却变年轻了,新一代奥迪A6L实车曝光

热点科技
2026-01-06 16:15:08
血染赛场!3+3+2+2!杨瀚森,真进步了!

血染赛场!3+3+2+2!杨瀚森,真进步了!

刺猬篮球
2026-01-08 17:15:46
美国扣押一艘与委内瑞拉有关、悬挂俄罗斯旗帜的石油运输船,外交部回应

美国扣押一艘与委内瑞拉有关、悬挂俄罗斯旗帜的石油运输船,外交部回应

环球网资讯
2026-01-08 15:38:17
六小天鹅承载国足未来,U23亚洲杯成世界杯梦想启航点

六小天鹅承载国足未来,U23亚洲杯成世界杯梦想启航点

中山印象体育摄影师
2026-01-08 14:42:13
30年前,大陆最美的两个女人,都是绝色美人

30年前,大陆最美的两个女人,都是绝色美人

TVB的四小花
2026-01-08 12:36:56
去文凭时代要到来?罗振重磅预言,3年内高中生或可进大厂拿高薪

去文凭时代要到来?罗振重磅预言,3年内高中生或可进大厂拿高薪

通文知史
2026-01-07 20:35:03
陈羽凡现状:低调生活,50岁胖到认不出,17岁儿子1米8长得像妈

陈羽凡现状:低调生活,50岁胖到认不出,17岁儿子1米8长得像妈

小莜读史
2025-12-08 20:29:11
冲击最佳新秀!19岁啊,打CBA这么猛

冲击最佳新秀!19岁啊,打CBA这么猛

刺猬篮球
2026-01-08 23:09:47
曝2026春晚彩排路透!小品领军人物确认回归,网友:终于等到这天

曝2026春晚彩排路透!小品领军人物确认回归,网友:终于等到这天

有范又有料
2026-01-07 10:43:16
大龄剩女崩溃的瞬间是什么?网友:连舔狗都不跟她吃饭了

大龄剩女崩溃的瞬间是什么?网友:连舔狗都不跟她吃饭了

另子维爱读史
2025-11-29 07:35:28
斯普利特不再迷信五小阵容,杨瀚森终于获得出头之日!

斯普利特不再迷信五小阵容,杨瀚森终于获得出头之日!

爱体育
2026-01-08 23:14:57
美国评出世界空军前三甲,中国在迫近式追赶,已经无力再拉开距离

美国评出世界空军前三甲,中国在迫近式追赶,已经无力再拉开距离

小熊侃史
2026-01-05 10:37:37
yoyo突然澄清、敬文紧跟发声,沉默两年的东方甄选旧事又翻车

yoyo突然澄清、敬文紧跟发声,沉默两年的东方甄选旧事又翻车

橙星文娱
2026-01-08 13:02:06
拜合拉木对阵伊拉克U23首发登场,预选赛3场4球+帽子戏法

拜合拉木对阵伊拉克U23首发登场,预选赛3场4球+帽子戏法

懂球帝
2026-01-08 20:55:12
汤唯大学时期的照片,难怪当年李安梁朝伟会选她当女主角!

汤唯大学时期的照片,难怪当年李安梁朝伟会选她当女主角!

南方城市网
2026-01-06 12:08:30
2026-01-09 00:23:00
TechWeb incentive-icons
TechWeb
做有态度的互联网资讯。
15178文章数 43049关注度
往期回顾 全部

科技要闻

智谱拿下“全球大模型第一股”,凭什么

头条要闻

19岁小伙在柬疑被16万转卖 与母亲视频时按"酒窝"求救

头条要闻

19岁小伙在柬疑被16万转卖 与母亲视频时按"酒窝"求救

体育要闻

世乒赛银牌得主,说自己梦里都是孙颖莎

娱乐要闻

抗战剧《马背摇篮》首播,获观众好评

财经要闻

微软CTO韦青:未来人类会花钱"戒手机"

汽车要闻

从量变到"智"变 吉利在CES打出了五张牌

态度原创

亲子
时尚
数码
家居
军事航空

亲子要闻

流感退潮后RSV“接棒”,通过飞沫、近距离接触、污染物品传播,警惕普通感冒迅速发展成肺炎,小月龄婴儿需重点防护

珍珠专场|| 无论18岁还是80岁,总是会为它再一次心动

数码要闻

华硕2026款超大屏核显本Vivobook 18面世,至高锐龙AI 9 465

家居要闻

理性主义 冷调自由居所

军事要闻

特朗普提出将美国军费提升至1.5万亿美元

无障碍浏览 进入关怀版