网易首页 > 网易号 > 正文 申请入驻

上海交大突破:AI精准学习人类审美偏好

0
分享至

来源:市场资讯

(来源:科技行者)


这项由上海交通大学、上海人工智能实验室、中国科学技术大学和复旦大学联合开展的研究发表于2025年10月,论文编号为arXiv:2510.01982v1。研究团队开发了一套名为G?RPO的全新技术框架,专门用于让AI绘画模型更好地理解和满足人类的审美偏好。

要理解这项研究的意义,我们可以把AI绘画过程想象成一个学习画画的学生。传统方法就像给学生一张完整的作品后说"画得好"或"画得不好",但学生并不知道具体哪一笔画得好,哪一笔需要改进。这种模糊的反馈让学习过程变得缓慢而低效。

研究团队发现了现有AI绘画训练方法的两个关键问题。第一个问题是"奖励信号稀疏",就好比一位厨师做菜时,只有等整道菜完成后才能品尝,无法在烹饪过程中及时调整火候和调料。第二个问题是"评估不够全面",类似于只从一个角度评判一幅画作,而忽视了从不同距离、不同光线下观看的效果。

针对这些挑战,研究团队提出了创新的"颗粒化GRPO"解决方案。这套方案包含两个核心技术:单步随机采样策略和多粒度优势集成模块。

单步随机采样策略的工作原理就像给绘画过程装上了"定点导航系统"。传统方法在整个绘画过程中都会随机添加变化,就像在每个路口都可能随机转向,最终很难判断哪个转向决策导致了最终的结果。而新方法只在特定的一个关键步骤引入随机性,其他步骤都按照确定路径进行。这样一来,最终结果的好坏就能明确归因于那个关键步骤的决策,从而提供精准的学习信号。

多粒度优势集成模块则像是给作品安装了"多倍镜检查系统"。当评估一个绘画方向的优劣时,传统方法只看最终完成的作品,就像只看建筑的外观。而新方法会在不同的完成阶段都进行评估——有时看半成品,有时看粗稿,有时看精细版本,然后综合所有这些不同"分辨率"下的评估结果。这种多角度评估让AI能够更全面地理解什么样的绘画方向真正符合人类偏好。

研究团队在实验中使用了Flux.1-dev这一业界领先的流模型作为基础,并在包含103,700个训练提示和400个测试提示的HPSv2数据集上进行验证。实验涵盖了多个维度的评估指标,包括语义对齐度、视觉连贯性、美学质量和整体图像品质等。

实验结果显示,G?RPO在各项指标上都取得了显著改进。在核心的HPS-v2.1评估指标上,新方法相比现有的DanceGRPO基线方法实现了6.52%的相对提升。更重要的是,这种改进不仅体现在训练时使用的评估标准上,在其他独立的评估标准上也表现出色,证明了方法的泛化能力。

为了验证技术的稳健性,研究团队还测试了在不同推理步数下的表现。无论是50步、20步还是10步的快速生成模式,G?RPO都保持了一致的性能优势。这意味着这项技术不仅在高质量慢速生成场景下有效,在需要快速响应的实际应用中同样表现出色。

从视觉效果对比来看,使用G?RPO生成的图像在细节保真度和文本提示遵循性方面都有明显改善。比如在生成"国际象棋棋子表情"的复杂场景时,新方法能够准确捕捉到提示中描述的微妙表情差异。在生成"环保海报"等需要精确布局的图像时,新方法也能更好地理解和实现左右分割的空间要求。

这项研究的技术创新还体现在训练效率的提升上。由于单步随机采样策略中的多个样本可以共享同一个起始点的计算结果,整个训练过程变得更加高效。这就像批量生产时可以共用某些生产线设备,降低了整体成本。

研究团队特别关注了"模型偏好操纵"这一AI训练中的常见问题。传统方法容易让AI学会"投其所好"——专门迎合某个特定评估标准的偏好,但在其他标准下表现糟糕。G?RPO通过多粒度评估有效缓解了这个问题,让AI学到的是更加通用和真实的人类审美偏好。

从应用前景来看,这项技术的影响将是深远的。对于内容创作者而言,更精准的AI绘画助手能够更好地理解创作意图,减少反复调整的时间成本。对于普通用户来说,AI绘画工具将变得更加智能和贴心,能够生成更符合个人喜好的作品。

技术的可扩展性也值得关注。研究显示,多粒度优势集成的思路可以轻松适配不同数量的评估层次。实验表明,使用一层、两层或三层不同粒度的评估都能带来性能提升,为实际部署时的计算资源配置提供了灵活性。

说到底,这项研究解决的是AI如何更好地理解人类偏好这一根本问题。通过提供更精准、更全面的学习信号,G?RPO让AI绘画模型能够像一个真正用心的学生一样,从每一次练习中获得有价值的指导,不断改进自己的技能。这不仅是技术上的进步,更是AI与人类协作方式的优化,为未来更多AI应用的人性化发展提供了有价值的参考路径。

Q&A

Q1:G?RPO技术是什么?它解决了AI绘画的什么问题?

A:G?RPO是上海交大团队开发的AI绘画优化技术,主要解决两个问题:一是传统方法只能在整个绘画完成后给出好坏评价,无法精确指导每个绘画步骤的改进;二是评估维度单一,无法全面判断绘画质量。新技术就像给AI安装了"定点导航"和"多倍镜检查"系统,让学习过程更精准高效。

Q2:这项技术相比现有方法有什么具体改进?

A:G?RPO在核心评估指标上实现了6.52%的性能提升,而且这种改进不仅体现在训练标准上,在其他独立评估标准上也表现出色。更重要的是,技术在不同速度的生成模式下都保持稳定性能,生成的图像在细节保真度和文本遵循性方面都有明显改善。

Q3:普通用户什么时候能用上这项技术?会对AI绘画应用产生什么影响?

A:虽然论文没有明确商业化时间表,但技术已在业界主流的Flux.1-dev模型上验证有效。对普通用户而言,这意味着未来的AI绘画工具将更智能,能更准确理解用户需求,生成更符合个人喜好的作品,同时减少反复调整的时间成本。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
法尔克:皇马考虑今夏以1.6亿至1.65亿欧元求购奥利塞

法尔克:皇马考虑今夏以1.6亿至1.65亿欧元求购奥利塞

懂球帝
2026-04-09 22:07:04
现在卖掉房子,是“愚蠢”还是“明智”?王健林一语道破,明白了

现在卖掉房子,是“愚蠢”还是“明智”?王健林一语道破,明白了

猫叔东山再起
2026-04-10 09:30:06
郑告蒋家后代:蒋介石逝哪葬哪,是对全体中国人民的最好安排!

郑告蒋家后代:蒋介石逝哪葬哪,是对全体中国人民的最好安排!

扶苏聊历史
2025-12-26 16:08:12
正式投诉!巴萨就欧冠重大误判上诉欧足联,要求公开裁判沟通录音

正式投诉!巴萨就欧冠重大误判上诉欧足联,要求公开裁判沟通录音

夜白侃球
2026-04-10 09:33:49
条条大路通罗马!不当明星的文章,在上海开饭店,女儿也为他宣传

条条大路通罗马!不当明星的文章,在上海开饭店,女儿也为他宣传

揽星河的笔记
2026-04-09 17:36:27
毕业生破1270万!2026下半年开始,大部分家庭将直面“4大难题”

毕业生破1270万!2026下半年开始,大部分家庭将直面“4大难题”

复转这些年
2026-04-05 18:00:42
“他们就在这里!”美议员曝外星人接触细节:时间地点全对得上

“他们就在这里!”美议员曝外星人接触细节:时间地点全对得上

有牙的兔纸
2026-04-09 22:47:21
哈登危险!尼克斯112-106胜凯尔特人,布伦森25+10,唐斯16+12+4

哈登危险!尼克斯112-106胜凯尔特人,布伦森25+10,唐斯16+12+4

小徐讲八卦
2026-04-10 11:31:20
英媒称俄军舰护送受制裁油轮通过英吉利海峡 克宫回应:俄有权自卫防范“海盗行为”

英媒称俄军舰护送受制裁油轮通过英吉利海峡 克宫回应:俄有权自卫防范“海盗行为”

财联社
2026-04-09 19:20:04
体育总局公布本科保送拟推荐名单:赵睿上体,曾凡博北科大

体育总局公布本科保送拟推荐名单:赵睿上体,曾凡博北科大

懂球帝
2026-04-10 12:19:08
开拓者已就续约事宜与斯普利特进行了讨论

开拓者已就续约事宜与斯普利特进行了讨论

林子说事
2026-04-10 12:40:41
陈丽华有三子为何收养王镰?是和迟重瑞一起收养的吗?

陈丽华有三子为何收养王镰?是和迟重瑞一起收养的吗?

据说说娱乐
2026-04-10 12:24:17
中国股市唯一赚钱最快的方法:持有一只股,保留50%仓位,长期做T

中国股市唯一赚钱最快的方法:持有一只股,保留50%仓位,长期做T

股经纵横谈
2026-04-09 18:01:46
湖人3配角价值突显!肯纳德攻守全输出,史密斯连爆,布朗尼进步

湖人3配角价值突显!肯纳德攻守全输出,史密斯连爆,布朗尼进步

篮球资讯达人
2026-04-10 13:52:22
周总理只是让他去经商,为党赚取经费,他却给组织赚回个商业帝国

周总理只是让他去经商,为党赚取经费,他却给组织赚回个商业帝国

鹤羽说个事
2026-04-02 23:00:01
大批航班被取消,五一出行旅客最先遭殃

大批航班被取消,五一出行旅客最先遭殃

环球旅讯
2026-04-09 17:23:24
深夜发声,邱彪下课山东?表态心凉了,下家3选1,辽宁在列

深夜发声,邱彪下课山东?表态心凉了,下家3选1,辽宁在列

东球猫猫
2026-04-10 11:18:27
父子互送助攻创历史!布朗尼10+3+2四战两次上双 逐步坐稳轮换

父子互送助攻创历史!布朗尼10+3+2四战两次上双 逐步坐稳轮换

醉卧浮生
2026-04-10 12:30:47
佛系超巨!约基奇8次出手便拿下三双,掘金豪取生涯首次10连胜!

佛系超巨!约基奇8次出手便拿下三双,掘金豪取生涯首次10连胜!

田先生篮球
2026-04-09 13:27:44
李宗仁晚年吐露,红军长征取得胜利,全靠老蒋这步神助攻

李宗仁晚年吐露,红军长征取得胜利,全靠老蒋这步神助攻

晓张说
2026-04-09 17:25:40
2026-04-10 15:28:49
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
2824816文章数 6527关注度
往期回顾 全部

科技要闻

马斯克狂发大火箭也养不起AI 年亏50亿美元

头条要闻

牛弹琴:巴基斯坦被以色列激怒了 这是一个不祥的信号

头条要闻

牛弹琴:巴基斯坦被以色列激怒了 这是一个不祥的信号

体育要闻

17岁赚了一百万美元,25岁被CBA裁员

娱乐要闻

夏克立婚内出轨 曾参加《爸爸去哪儿》

财经要闻

爱尔眼科一院长被指猥亵 总部:已被停职

汽车要闻

搭载第二代刀片电池及闪充技术 腾势N8L闪充版预售35万起

态度原创

游戏
数码
旅游
时尚
本地

KK官方对战平台CS1.6传奇联赛瑞士轮收官:八强席位即将揭晓

数码要闻

微星推出Cubi NUC TWG系列商用迷你主机,可选无风扇被动散热款

旅游要闻

亚洲游客抛弃中东,扎堆邮轮与短途游

直播|| 春夏百元级首饰,最爱逛的一定有他家!

本地新闻

12吨巧克力有难,全网化身超级侦探添乱

无障碍浏览 进入关怀版