网易首页 > 网易号 > 正文 申请入驻

苹果新研究:设计师亲自训练AI生成更优质界面

0
分享至


几个月前,苹果研究团队发布了一项关于训练AI生成功能性UI代码的有趣研究。

与设计质量不同,该研究重点确保AI生成的代码能够实际编译,并在界面功能和外观方面大致匹配用户的提示要求。

研究成果是UICoder,这是一个开源模型系列。

现在,负责UICoder的部分团队发布了一篇新论文,题为《从设计师反馈改进用户界面生成模型》。

在论文中,研究人员解释说,现有的人类反馈强化学习(RLHF)方法并不是训练大语言模型可靠生成优质UI设计的最佳方法,因为这些方法"与设计师的工作流程不匹配,忽略了用于批评和改进UI设计的丰富理由"。

为解决这个问题,他们提出了不同的路径。他们让专业设计师使用评论、草图甚至直接编辑来直接批评和改进模型生成的UI,然后将这些前后变化转换为用于微调模型的数据。

这使他们能够基于具体的设计改进来训练奖励模型,有效地教会UI生成器偏好更好地反映真实世界设计判断的布局和组件。

总共有21名设计师参与了这项研究。

研究人员收集了1460个标注,然后将其转换为配对的UI"偏好"示例,对比原始模型生成的界面与设计师改进版本。

这反过来被用于训练奖励模型以微调UI生成器。

关于生成器模型,苹果使用Qwen2.5-Coder作为UI生成的主要基础模型,后来将同样的设计师训练奖励模型应用到较小和较新的Qwen变体上,以测试该方法在不同模型大小和版本之间的泛化能力。

有趣的是,正如研究作者自己指出的,该框架最终看起来很像传统的RLHF管道。他们认为,区别在于学习信号来自设计师原生工作流程(评论、草图和直接修订),而不是点赞/点踩或简单排名数据。

那么,这真的有效吗?根据研究人员的说法,答案是肯定的,但有重要注意事项。

总体而言,在设计师原生反馈(特别是草图和直接修订)上训练的模型产生的UI设计质量明显高于基础模型和仅使用传统排名或评级数据训练的版本。

事实上,研究人员注意到他们表现最好的模型(使用草图反馈微调的Qwen3-Coder)超越了GPT-5。更令人印象深刻的是,这最终仅源自设计师的181个草图标注。

至于注意事项,研究人员注意到主观性在什么构成良好界面方面起着很大作用。

在研究中,这种差异表现为对哪些设计实际更好的分歧。当研究人员独立评估设计师排名的相同UI配对时,他们只有49.2%的时间同意设计师的选择,几乎是抛硬币的概率。

另一方面,当设计师通过绘制改进草图或直接编辑UI提供反馈时,研究团队同意这些改进的频率要高得多:草图为63.6%,直接编辑为76.1%。

换句话说,当设计师能够具体展示他们想要改变什么,而不仅仅是在两个选项之间选择时,更容易就什么是"更好"达成一致。

Q&A

Q1:苹果研究团队提出的新训练方法有什么特点?

A:苹果研究团队让专业设计师使用评论、草图甚至直接编辑来直接批评和改进模型生成的UI,然后将这些前后变化转换为用于微调模型的数据。这种方法来自设计师原生工作流程,而不是简单的点赞/点踩或排名数据。

Q2:新方法训练的模型效果如何?

A:使用设计师原生反馈训练的模型产生的UI设计质量明显高于基础模型和传统方法训练的版本。表现最好的模型Qwen3-Coder甚至超越了GPT-5,而这仅源自设计师的181个草图标注。

Q3:设计师反馈方式的有效性如何?

A:研究发现,当设计师仅在两个选项间排名时,研究人员只有49.2%的时间同意其选择。但当设计师通过草图或直接编辑提供具体反馈时,同意率分别提升至63.6%和76.1%。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
涉深海稀土泥,日本首相发声

涉深海稀土泥,日本首相发声

上观新闻
2026-02-09 15:17:03
多地已撤下黄灯笼!

多地已撤下黄灯笼!

瓜哥的动物日记
2026-02-08 19:24:54
《太平年》大结局:钱弘俶被毒杀,赵匡胤郭荣多遗憾

《太平年》大结局:钱弘俶被毒杀,赵匡胤郭荣多遗憾

暖心萌阿菇凉
2026-02-09 19:55:25
究竟什么是“赤马红羊劫”?赤马红羊对谁不利?且看如何应对!

究竟什么是“赤马红羊劫”?赤马红羊对谁不利?且看如何应对!

神奇故事
2026-02-07 23:12:06
1993年,92岁的周培源爬到妻子的床边,用尽力气喊:我爱你!

1993年,92岁的周培源爬到妻子的床边,用尽力气喊:我爱你!

千秋文化
2026-01-15 22:29:47
3-2!国安击败中超新土豪,球队大腿连场进球,主力边卫又受重伤

3-2!国安击败中超新土豪,球队大腿连场进球,主力边卫又受重伤

体坛鉴春秋
2026-02-09 22:10:48
又不缺土地,为什么全世界只有中国,在疯狂地修建高层住宅?

又不缺土地,为什么全世界只有中国,在疯狂地修建高层住宅?

张鼋卤说体育
2026-02-07 12:45:26
千问工具箱小程序被微信限制

千问工具箱小程序被微信限制

每日经济新闻
2026-02-09 22:43:05
意甲最新积分战报:亚特兰大险胜,罗马追上来,尤文位置岌岌可危

意甲最新积分战报:亚特兰大险胜,罗马追上来,尤文位置岌岌可危

足球狗说
2026-02-10 08:11:04
霍福德带超模妻子和儿子观战超级碗!娇妻生6娃身材颜值依旧抗打

霍福德带超模妻子和儿子观战超级碗!娇妻生6娃身材颜值依旧抗打

Emily说个球
2026-02-10 05:20:03
苦吞12连败!三巨头无人问津!NBA最惨球队诞生,威少真香

苦吞12连败!三巨头无人问津!NBA最惨球队诞生,威少真香

世界体育圈
2026-02-09 16:16:46
北大才女李天乐:赴美留学,入职顶尖药企,用金属铊毒杀清华丈夫

北大才女李天乐:赴美留学,入职顶尖药企,用金属铊毒杀清华丈夫

谈史论天地
2026-02-07 08:20:07
2026年教育部7大信号,高中或划片招生,升学择校格局要变天了

2026年教育部7大信号,高中或划片招生,升学择校格局要变天了

老特有话说
2026-02-09 23:36:15
颠覆国家的性交易!元斌爱妻新戏超敢拍 韩网口碑狂烧:背脊发凉

颠覆国家的性交易!元斌爱妻新戏超敢拍 韩网口碑狂烧:背脊发凉

ETtoday星光云
2026-02-09 17:50:06
替补逆袭成超巨有多难?满打满算NBA就5人做到,榜一统治一个时代

替补逆袭成超巨有多难?满打满算NBA就5人做到,榜一统治一个时代

毒舌NBA
2026-02-09 12:11:23
刘少奇从山东回来,对毛主席说:罗荣桓的资历在分局仅排倒数第二

刘少奇从山东回来,对毛主席说:罗荣桓的资历在分局仅排倒数第二

抽象派大师
2026-02-09 21:52:31
严查“开票经济”!国家动真格,虚增GDP的游戏该停了

严查“开票经济”!国家动真格,虚增GDP的游戏该停了

财经无忌
2026-02-02 12:00:46
北宋为何死活收不回燕云十六州?不是宋军太弱,是这6个死局无解

北宋为何死活收不回燕云十六州?不是宋军太弱,是这6个死局无解

老吴教育课堂
2026-02-09 17:42:50
世体:当今足坛已形成共识,巴萨出顶级中场&法国出顶级中卫

世体:当今足坛已形成共识,巴萨出顶级中场&法国出顶级中卫

懂球帝
2026-02-09 13:20:13
身材和舞姿都是顶流,就问谁不喜欢?

身材和舞姿都是顶流,就问谁不喜欢?

贵圈真乱
2026-02-02 12:07:25
2026-02-10 08:55:00
至顶头条 incentive-icons
至顶头条
记录和推动数字化创新
16033文章数 49690关注度
往期回顾 全部

科技要闻

Claude搅动硅谷,AI开始抢企业软件饭碗了?

头条要闻

牛弹琴:想营造有利于"拜鬼"的环境 高市早苗是在妄想

头条要闻

牛弹琴:想营造有利于"拜鬼"的环境 高市早苗是在妄想

体育要闻

不会打篮球,如何入选詹娜前男友第一阵容

娱乐要闻

央视电影活动名场面!明星站位太讲究

财经要闻

退保黑灰产仍在“隐秘角落”顶风接单

汽车要闻

长安将搭钠电池 好比汽车要装柴油机?

态度原创

时尚
本地
房产
数码
军事航空

冬季穿衣越简单越实用!从这些日常穿搭中收获灵感,大方又自然

本地新闻

围观了北京第一届黑色羽绒服大赛,我笑疯了

房产要闻

海南又一千亿级赛道出现,京东、华润、中石化等巨头率先杀入!

数码要闻

苹果MacBook新品爆料:A18 Pro芯片+12.9英寸LCD屏

军事要闻

以军持续在约旦河西岸多地发动突袭

无障碍浏览 进入关怀版