网易首页 > 网易号 > 正文 申请入驻

苹果新AI论文:微调Qwen3-Coder,生成UI能力逆袭GPT-5

0
分享至

IT之家 2 月 6 日消息,科技媒体 9to5Mac 今天(2 月 6 日)发布博文,报道称苹果公示最新 AI 研究论文,利用生成式 AI 优化 App 界面(UI)开发,经过特定方法微调的 Qwen3-Coder 模型,在 UI 生成能力上击败了 GPT-5。

IT之家援引博文介绍,该论文由苹果 UICoder 团队发表,主要是探索生成式 AI 如何更高效地融入 App 开发流程。

论文指出目前主流的“人类反馈强化学习”(RLHF)并不适合 UI 设计领域。传统的 RLHF 通常要求人类对 AI 生成的结果进行简单的“点赞 / 点踩”或排序。

然而,这种二元评价体系忽略了设计背后的复杂逻辑,也无法体现设计师的工作流。简单来说,AI 只知道“这个不好”,却不知道“哪里不好”或“怎么改才好”。

苹果为了解决上述问题,招募了 21 位拥有 2 至 30 年经验的专业设计师参与实验。不同于以往的打分模式,设计师需要直接通过撰写评论、绘制草图甚至直接修改代码来优化 AI 生成的界面。


团队收集了 1460 条此类深度注释,并将“修改前”与“修改后”的对比数据输入到一个奖励模型中。该模型通过学习截图和自然语言描述,学会了像人类设计师一样判断 UI 的美观度与功能性。

实验数据显示,基于“草图反馈”训练的模型表现最为优异。令人惊讶的是,仅依靠 181 个草图注释进行微调,该模型就实现了对 GPT-5 的超越。研究团队表示,这证明了“少而精”的专家级反馈能让小参数模型在特定领域展现出超越大模型的潜力。


研究还揭示了一个关键现象:设计审美具有高度主观性。在单纯的排序任务中,研究人员与设计师的观点一致率仅为 49.2%,几乎等同于抛硬币。

然而,当设计师通过草图或直接编辑来表达意图后,双方的一致率分别飙升至 63.6% 和 76.1%。这表明,在定义“什么是更好的设计”时,具体的视觉修改(Show)远比抽象的评分(Tell)更具共识价值,这也是未来 AI 辅助设计工具进化的核心方向。

参考

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
花椒立大功?研究发现:花椒可在36小时清除75%老化细胞?

花椒立大功?研究发现:花椒可在36小时清除75%老化细胞?

荷兰豆爱健康
2026-02-06 16:22:50
大范围回暖春节前到来,华南过年时要热哭?分析:大雨雪降温可能

大范围回暖春节前到来,华南过年时要热哭?分析:大雨雪降温可能

中国气象爱好者
2026-02-06 13:41:05
沪银、沪金,再度大幅下跌

沪银、沪金,再度大幅下跌

第一财经资讯
2026-02-06 09:21:40
纪委国家监委密集通报 四名中管干部被严肃处理

纪委国家监委密集通报 四名中管干部被严肃处理

看看新闻Knews
2026-02-06 15:03:21
比尔盖茨前妻梅琳达:我不是小绵羊,忍了32年,终于能上致命一击

比尔盖茨前妻梅琳达:我不是小绵羊,忍了32年,终于能上致命一击

呼呼历史论
2026-02-06 18:06:19
天气 | 天津鹅毛大雪!最新雪情!狂跌至-12°C!

天气 | 天津鹅毛大雪!最新雪情!狂跌至-12°C!

天津广播
2026-02-06 08:10:48
固始新娘事件后续:多方发声曝猛料,身份被扒是老师,结局亮了

固始新娘事件后续:多方发声曝猛料,身份被扒是老师,结局亮了

和平声浪
2026-02-06 10:17:10
侄女在我家吃住9年,出嫁后断联,去年我住院她出现,我羞愧万分

侄女在我家吃住9年,出嫁后断联,去年我住院她出现,我羞愧万分

人间百态大全
2026-02-06 07:11:07
有钱了!曝中赫集团获80亿资金,北京国安能否过上好日子?

有钱了!曝中赫集团获80亿资金,北京国安能否过上好日子?

体坛鉴春秋
2026-02-05 21:00:54
悲催!东莞一200多人工厂倒闭,声明请求当地解决员工工资问题…

悲催!东莞一200多人工厂倒闭,声明请求当地解决员工工资问题…

火山诗话
2026-02-06 06:14:30
卢靖姗:我对韩庚的评分太高,生完孩子后,他永远回家先亲我

卢靖姗:我对韩庚的评分太高,生完孩子后,他永远回家先亲我

秀语千寻
2026-02-05 23:52:24
爱泼斯坦那座岛上,真的“吃人”吗?

爱泼斯坦那座岛上,真的“吃人”吗?

基本常识
2026-02-05 23:02:46
花4000万买别墅、850万装修的杨慧,被判14年3个月

花4000万买别墅、850万装修的杨慧,被判14年3个月

中国青年报
2026-02-05 22:25:35
订婚宴上婆婆骂我下三滥,我笑着问公公:你儿子做过亲子鉴定吗?

订婚宴上婆婆骂我下三滥,我笑着问公公:你儿子做过亲子鉴定吗?

千秋文化
2026-01-29 21:30:14
朱棣怎么都想不到,他死后才2年,亲手栽培儿子被最疼爱孙儿烧死

朱棣怎么都想不到,他死后才2年,亲手栽培儿子被最疼爱孙儿烧死

史之韵
2026-02-06 13:53:16
杨鸣离职后状态极佳,黑眼圈消失,解说完NBA还将参加杯赛开幕式

杨鸣离职后状态极佳,黑眼圈消失,解说完NBA还将参加杯赛开幕式

篮球资讯达人
2026-02-06 15:13:48
为啥很多人说共情前要保护好自己?网友:太奇葩了,这些人

为啥很多人说共情前要保护好自己?网友:太奇葩了,这些人

带你感受人间冷暖
2026-01-25 00:15:06
受贿数额特别巨大 重庆市政协原副主席段成刚被提起公诉

受贿数额特别巨大 重庆市政协原副主席段成刚被提起公诉

新京报
2026-02-06 11:05:19
-8℃!大雪到暴雪!安徽最新天气

-8℃!大雪到暴雪!安徽最新天气

51庐江网
2026-02-06 10:35:01
高市生死关头,特朗普高调喊话日本:下个月,我要在白宫见到她

高市生死关头,特朗普高调喊话日本:下个月,我要在白宫见到她

娱乐小可爱蛙
2026-02-06 17:21:23
2026-02-06 19:24:49
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
328560文章数 606973关注度
往期回顾 全部

科技要闻

独角兽版图巨变:SpaceX奔万亿 中美差在哪

头条要闻

爱泼斯坦案文件牵出更多欧美政商名流

头条要闻

爱泼斯坦案文件牵出更多欧美政商名流

体育要闻

西甲射手榜第2,身价不到姆巴佩1/40

娱乐要闻

微博之夜红毯好精彩,堪比婚礼现场

财经要闻

爱尔眼科董事长旗下7家精神病院骗保

汽车要闻

宝马"本命年"关键词:20款新车与"新世代"耐力赛

态度原创

亲子
房产
艺术
游戏
军事航空

亲子要闻

宝蓝和爸爸做了漂亮的蛋糕为叔叔过生日。看看叔叔喜欢那一个~

房产要闻

新春三亚置业,看过这个热盘再说!

艺术要闻

Kristin Vestgard:挪威当代画家

水大哥队安勿念,TES零封JDG打出完美一战,网友:这波比放不了!

军事要闻

美国“肯尼迪”号核动力航母完成首次海试

无障碍浏览 进入关怀版