网易首页 > 网易号 > 正文 申请入驻

苹果新AI论文:微调Qwen3-Coder,生成UI能力逆袭GPT-5

0
分享至

IT之家 2 月 6 日消息,科技媒体 9to5Mac 今天(2 月 6 日)发布博文,报道称苹果公示最新 AI 研究论文,利用生成式 AI 优化 App 界面(UI)开发,经过特定方法微调的 Qwen3-Coder 模型,在 UI 生成能力上击败了 GPT-5。

IT之家援引博文介绍,该论文由苹果 UICoder 团队发表,主要是探索生成式 AI 如何更高效地融入 App 开发流程。

论文指出目前主流的“人类反馈强化学习”(RLHF)并不适合 UI 设计领域。传统的 RLHF 通常要求人类对 AI 生成的结果进行简单的“点赞 / 点踩”或排序。

然而,这种二元评价体系忽略了设计背后的复杂逻辑,也无法体现设计师的工作流。简单来说,AI 只知道“这个不好”,却不知道“哪里不好”或“怎么改才好”。

苹果为了解决上述问题,招募了 21 位拥有 2 至 30 年经验的专业设计师参与实验。不同于以往的打分模式,设计师需要直接通过撰写评论、绘制草图甚至直接修改代码来优化 AI 生成的界面。


团队收集了 1460 条此类深度注释,并将“修改前”与“修改后”的对比数据输入到一个奖励模型中。该模型通过学习截图和自然语言描述,学会了像人类设计师一样判断 UI 的美观度与功能性。

实验数据显示,基于“草图反馈”训练的模型表现最为优异。令人惊讶的是,仅依靠 181 个草图注释进行微调,该模型就实现了对 GPT-5 的超越。研究团队表示,这证明了“少而精”的专家级反馈能让小参数模型在特定领域展现出超越大模型的潜力。


研究还揭示了一个关键现象:设计审美具有高度主观性。在单纯的排序任务中,研究人员与设计师的观点一致率仅为 49.2%,几乎等同于抛硬币。

然而,当设计师通过草图或直接编辑来表达意图后,双方的一致率分别飙升至 63.6% 和 76.1%。这表明,在定义“什么是更好的设计”时,具体的视觉修改(Show)远比抽象的评分(Tell)更具共识价值,这也是未来 AI 辅助设计工具进化的核心方向。

参考

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
简直是大快人心!奥委会当年刁难北京,现在只能自食恶果

简直是大快人心!奥委会当年刁难北京,现在只能自食恶果

史行途
2026-03-26 07:36:04
真的太孤独了!山东47岁母亲称已怀胎8月,两女远嫁却极力反对…

真的太孤独了!山东47岁母亲称已怀胎8月,两女远嫁却极力反对…

火山詩话
2026-03-25 13:41:56
为什么中国要发射东风-41,必须要提前告知俄罗斯,这是咋回事?

为什么中国要发射东风-41,必须要提前告知俄罗斯,这是咋回事?

阿器谈史
2026-03-19 18:11:39
太突然!董事长汤建,因心梗意外去世

太突然!董事长汤建,因心梗意外去世

每日经济新闻
2026-03-25 18:21:26
中国军事专家送日本3句话,太绝了,真不是吓唬他们

中国军事专家送日本3句话,太绝了,真不是吓唬他们

安安说
2026-03-26 11:21:19
个人公众号“千问”停更近10年,近期接连遭阿里投诉均被驳回,号主:规避风险不发AI文章,如果我不发声,账号就不保了

个人公众号“千问”停更近10年,近期接连遭阿里投诉均被驳回,号主:规避风险不发AI文章,如果我不发声,账号就不保了

中国能源网
2026-03-25 13:53:05
全国最大比亚迪中心落地常州,预计今年5月中旬正式运营

全国最大比亚迪中心落地常州,预计今年5月中旬正式运营

财闻
2026-03-26 12:53:13
世乒赛选拔落幕,国乒8人确定,王艺迪梁靖崑温瑞博无缘

世乒赛选拔落幕,国乒8人确定,王艺迪梁靖崑温瑞博无缘

格斗联盟
2026-03-26 13:01:14
老师穿短裙蕾丝袜上课,学生连头都不敢抬!老师穿衣底线到底在哪

老师穿短裙蕾丝袜上课,学生连头都不敢抬!老师穿衣底线到底在哪

小羽叨叨叨
2026-03-26 13:24:34
美伊冲突,已经出现了3个赢家,10个输家,都是谁?

美伊冲突,已经出现了3个赢家,10个输家,都是谁?

七号说三国
2026-03-25 21:11:29
看哭无数人!张雪峰001号员工万霞,一句不离不弃胜过千言万语

看哭无数人!张雪峰001号员工万霞,一句不离不弃胜过千言万语

枫红染山径
2026-03-26 10:37:28
暴赚144亿美元!美乌没辙,朝鲜兵工厂24小时全开,狂扫中国机床

暴赚144亿美元!美乌没辙,朝鲜兵工厂24小时全开,狂扫中国机床

知法而形
2026-03-24 15:57:37
华野掉头打整编25师,黄百韬气得想枪毙快纵司令张绪滋:你真该杀

华野掉头打整编25师,黄百韬气得想枪毙快纵司令张绪滋:你真该杀

历史龙元阁
2026-03-25 13:35:14
曾因污言秽语被封禁的张雪峰,凭什么让郑大悼念,新华社发讣告?

曾因污言秽语被封禁的张雪峰,凭什么让郑大悼念,新华社发讣告?

观察者海风
2026-03-25 22:10:33
毛主席有多明智?成立新疆生产建设兵团,七十年后谁都得服

毛主席有多明智?成立新疆生产建设兵团,七十年后谁都得服

诺言卿史录
2026-03-26 09:06:41
张雪峰公司对联已拆!一个月前注册近40枚“姩菡”商标,捐款千万

张雪峰公司对联已拆!一个月前注册近40枚“姩菡”商标,捐款千万

离离言几许
2026-03-25 15:07:06
大门紧闭!中国终止邀请日本出席高级会议,日企深感不安

大门紧闭!中国终止邀请日本出席高级会议,日企深感不安

青辉
2026-03-26 15:27:51
法系在华销冠车型降价20%,车名叫凡尔赛

法系在华销冠车型降价20%,车名叫凡尔赛

第一财经资讯
2026-03-26 10:16:14
周一围夫妇带仨孩子上山挖笋,45岁朱丹身体真好,才3月穿短裤了

周一围夫妇带仨孩子上山挖笋,45岁朱丹身体真好,才3月穿短裤了

乐悠悠娱乐
2026-03-26 10:57:57
俄罗斯人想不明白:为什么强大的中国,几千年都不要西伯利亚?

俄罗斯人想不明白:为什么强大的中国,几千年都不要西伯利亚?

贱议你读史
2026-03-26 00:07:41
2026-03-26 16:00:49
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
336056文章数 607090关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

上海妈妈寻亲27年悬赏市区一套房:不用尽孝 要个拥抱

头条要闻

上海妈妈寻亲27年悬赏市区一套房:不用尽孝 要个拥抱

体育要闻

35岁替补门将,凭什么入选英格兰队?

娱乐要闻

张雪峰家人首发声 不设追思会丧事从简

财经要闻

黄仁勋:芯片公司的时代已经结束了

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

家居
时尚
数码
本地
军事航空

家居要闻

傍海而居 静观蝴蝶海

皮衣+裙,高级到炸

数码要闻

三星更新870 EVO系列SATA SSD:最高8TB 定价超1万元

本地新闻

救命,这只酱板鸭已经在我手机复仇了一万遍

军事要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

无障碍浏览 进入关怀版