网易首页 > 网易号 > 正文 申请入驻

霍华德大学研究团队揭秘大牌服装背后的隐藏密码

0
分享至


这项由霍华德大学与Adobe Research联合完成的研究发表于2026年,论文以预印本形式公开,arXiv编号为2604.26186,有兴趣深入了解的读者可通过该编号查询完整论文。

每当你翻开一本时尚杂志,看到那些令人叹为观止的秀场照片时,你有没有想过:即使遮住品牌标签,有没有一种方法能从一件衣服本身"读出"它出自哪个设计师之手,属于哪个年代,甚至偏爱什么颜色?这个问题听起来像是在考验顶级时尚编辑的眼力,但霍华德大学与Adobe Research的研究团队,用一套名为FASH-iCNN的AI系统,把这件事变成了可以量化、可以验证的科学。

这项研究的出发点,其实藏着一个不那么显眼却值得认真对待的问题。当下的时尚AI系统,无论是给你推荐"和你风格相似的单品",还是帮你搭配穿搭方案,背后都在悄悄学习某些特定设计师、特定杂志、特定历史时期的审美逻辑。问题在于,这些系统从不告诉你它参考了谁的品味、哪个时代的风潮。你收到的建议,可能深深打上了Chanel 2010年代的烙印,或者Alexander McQueen某位创意总监的个人偏好,但你完全看不出来,也无从选择是否接受这种"文化继承"。

FASH-iCNN做的事情,就是把这层隐形的文化逻辑变得透明可见。给它一张服装照片,它能告诉你:这件衣服出自哪个时装屋,属于哪个年代,呈现的是哪种颜色传统。更重要的是,它不只是给出答案,还能解释这个答案背后依赖的是服装的哪些视觉特征——是颜色、纹理、轮廓,还是缝线边缘?这套研究在时装AI领域开辟了一条新路:把"文化出身"作为核心信号来研究,而不是把它当作背景噪音过滤掉。

一、八万七千张秀场照片,一座可以解读的时尚档案库

要训练一套能识别时装屋"审美基因"的AI,首先需要一个足够丰富、足够系统的数据库。研究团队选择的素材来源是《Vogue》杂志的秀场图片——这个选择本身就很有说头。

《Vogue》自1892年创刊以来,始终是全球最具影响力的时尚媒体之一。它的秀场图片并非随意拍摄,而是经过严格的编辑流程筛选:每个季度,各大时装屋发布系列,模特穿着由创意团队精心挑选和搭配的服装走台,杂志编辑再从中挑选具有代表性的影像刊发。换句话说,这些照片里的每一件衣服、每一种配色、每一个廓形,都是经过层层审美决策沉淀下来的结果,是设计师、造型师、编辑共同意志的产物。

研究团队收集了横跨1991年至2024年、涵盖15个顶级时装屋的87,547张秀场图片。经过质量筛选后,保留84,596张;进一步筛选出能提取到清晰人脸区域的图片,得到77,269张;最终从中分割出服装区域的有效图片为65,541张。这些数字背后,是研究团队用专业工具逐一处理的技术工作:人脸区域由MediaPipe工具提取,服装区域则由一种叫SegFormer的语义分割模型来识别和裁剪。

每张图片都被打上了一套细致的标签。颜色方面,研究团队用一种叫k-means聚类的算法(可以理解为"自动找出图片中最主要的几种颜色")提取了每件服装的六格主色板,然后把这些颜色映射到两套命名体系上:一套是来自语言学研究的"柏林-凯基础色彩词"(Berlin-Kay),包含红、橙、黄、绿、蓝、紫、粉、棕、白九个大类,就像我们日常说"这件衣服是红色的";另一套是更精细的CSS命名颜色体系,包含54到69个具体色名,比如"砖红色(firebrick)"、"金菊黄(goldenrod)"、"蓟紫(thistle)",类似于你在设计软件里看到的那种精确颜色名称。此外,每位模特的肤色也被量化为1到10级的"蒙克肤色等级",并记录了设计师、季节、年份等元数据。

这个数据库有一个非常突出的特点:68.3%的图片以低饱和度颜色为主,也就是黑色或灰色占据主导。这在高端时装界其实很正常,毕竟黑色是许多大牌的"信仰色"。但这也给研究带来了挑战——如果AI只会预测"黑色",准确率看起来很高,却什么也没学会。为此,研究团队专门筛选出以有色调颜色为主的约24,500张图片,作为所有颜色预测实验的专用子集。值得一提的是,白色被保留为一个独立的颜色类别,因为在时装界,一身纯白是明确的审美选择,而不是"没有颜色"。

二、衣服本身就是一本"身份证"——AI如何从布料读出品牌、年代和颜色

数据准备好了,研究团队要回答的核心问题是:一张仅仅显示服装的照片,能告诉我们多少关于这件衣服"出身"的信息?

结论出乎意料地清晰:非常多。

首先来看时装屋识别。研究团队训练了一个专门看服装图片的AI模型,让它在14个时装屋(15个中的一个因为样本不足被排除)之间做选择。这个模型的最终成绩是:78.2%的准确率。听起来像是一个普通的百分比,但对比一下背景才显出它的含金量——如果随机猜测,正确率大约只有9.3%。也就是说,这套AI的判断能力,是纯猜测的将近8.5倍。这意味着,不同时装屋的服装,在视觉上确实有可以被系统性识别的差异,不是人类的直觉幻觉,而是客观存在的视觉指纹。

然后是时间识别。同样只看服装图片,模型在四个年代(1991-2000、2001-2010、2011-2020、2021-2024)的分类上达到了88.6%的准确率,而随机猜测的基准线只有45.2%。更令人印象深刻的是精确到年份的识别:面对34年(1991-2024年)中每一年的分类任务,模型的准确率达到58.3%,而随机猜测的概率仅为2.9%。更有说服力的数字是:73.2%的情况下,模型的预测年份误差在两年以内,平均误差仅为2.2年。也就是说,它看一眼衣服,大概率能猜中这件衣服出自哪个年代,前后误差不超过两三年。

颜色识别方面,研究团队为每个时装屋单独训练了"专属颜色模型",训练和测试都在同一个品牌内部进行。成绩同样亮眼:Calvin Klein Collection的模型在九大颜色类别中达到93.4%的准确率,Chanel达到91.0%,Alexander McQueen达到82.3%,Balenciaga则是75.95%。

这里有个值得细说的地方:Balenciaga的绝对准确率虽然最低,但它的"提升幅度"(比只猜最常见颜色的模型高出了29.1个百分点)却是最大的。这说明Balenciaga的配色更多元、更难规律化,AI学到的不是"这个品牌总用黑色"这种简单规律,而是真正掌握了它色彩选择的复杂逻辑。Calvin Klein Collection则恰恰相反:它以极度克制的无彩色系(黑白灰)著称,配色有明确规律,所以AI学得又准又快。这种差异对实际应用来说很重要——高提升幅度意味着模型真的在"学习",而不是在"投机取巧"。

三、颜色、纹理、轮廓——究竟是哪个视觉通道在泄露品牌秘密?

知道AI能识别出来只是第一步。更有趣的问题是:它靠什么识别出来的?是颜色?是布料的纹理质感?是服装的整体轮廓?还是缝线和接缝的走向?

为了回答这个问题,研究团队设计了一个精巧的实验。他们把同一件服装的图片处理成四种不同版本,就像对同一份菜肴做四种不同程度的"信息剥离":第一种是完整彩色图,色彩、纹理、轮廓全都保留;第二种是灰度图,去掉色彩,但保留明暗层次(亮度)和纹理;第三种是剪影图,把服装变成一块纯色填充的形状,只保留整体轮廓;第四种是边缘图,只保留服装的轮廓线和接缝线,其他全部消除。然后,他们分别用这四种版本训练独立的AI模型,观察每一种"削减信息"的操作对识别准确率的影响。

结果揭示出一条清晰的规律:完整彩色图的时装屋识别准确率是78.2%,换成灰度图之后,准确率降到67.6%,下降了10.6个百分点。这说明颜色对品牌识别是有贡献的,但贡献并不巨大。真正让准确率"断崖式下跌"的,是从灰度图变成剪影图这一步:准确率从67.6%一下跌到30.0%,足足下降了37.6个百分点。这意味着,当纹理和明暗层次信息消失、只剩下形状时,模型识别品牌的能力大幅丧失。

换句话说,服装的纹理质感和明暗层次,才是各个时装屋视觉身份的核心载体。颜色只是"锦上添花",而轮廓形状本身的信息量其实相当有限——边缘图和剪影图的准确率几乎相同(30.7% vs 30.0%),说明填充了颜色的形状相比纯轮廓线并没有提供多少额外信息。

这个发现从日常经验角度看也很直觉:你在百米外看到一个人,看不清颜色,却能从走路姿势和身形猜出大概是谁,对时装屋来说,这个"姿势和身形"的等价物,正是布料的纹理和光影。

有趣的是,同样这四种图片,在颜色预测任务上呈现出完全相反的规律。颜色预测的准确率随图片信息的减少而下降,但有一个重要的补偿机制在起作用——这就是人脸输入的价值。

四、人脸是"背景知识"——当主要信息不足时,它的价值才真正显现

FASH-iCNN是一个多模态系统,除了服装图片这个核心输入之外,它还可以选择性地接收模特的人脸图片作为辅助输入。研究团队想知道的是:这张人脸,在什么情况下真正有帮助?

实验结果给出了一个非常清晰的答案:人脸输入的价值,与服装图片的信息丰富程度成反比。当服装是完整彩色图时,加入人脸输入几乎毫无用处,颜色预测准确率反而微降了0.6个百分点。但当服装只剩下灰度图时,人脸输入让准确率提升了9.2个百分点;换成剪影图,提升了20.8个百分点;换成边缘图,提升了20.5个百分点。

这个规律就像是:如果你手里拿着一份详细的地图,额外的路人指路对你帮助不大;但如果你只有一张模糊的草图,任何额外的线索都弥足珍贵。人脸图片之所以能在信息稀少的情况下帮助预测颜色,是因为时装秀场有一个不成文的规律:造型师在为特定服装搭配模特时,会考虑模特的外貌与服装风格的协调性,而这种协调性本身就隐含了关于服装颜色和风格的线索。

更有意思的是一个"透明化"发现:只用人脸图片(不看服装)来预测时装屋,准确率高达96.6%——但这个数字是有水分的。研究团队发现,这是因为测试集里有些模特在训练集里出现过,AI实际上是在识别"这个人是谁"而不是"这件衣服出自哪里",这叫做"身份泄漏"。当使用更严格的按时间划分的测试方式(训练时只用早期数据,测试时用晚期数据)时,准确率会大幅下降。此外,研究还发现,给人脸输入再加上一个"设计师标签"的辅助信息,颜色预测准确率只提升了0.2个百分点。这说明人脸图片本身已经隐含了大量关于拍摄场景、品牌风格和造型偏好的信息,额外标签几乎不带来新知识。

五、从"这件衣服是蓝色的"到"这件衣服是矢车菊蓝"——三级颜色预测流水线

颜色预测是FASH-iCNN最核心的功能之一,而研究团队并没有简单地让AI直接给出一个颜色答案,而是设计了一套三层递进的"颜色漏斗"。

这套流水线的逻辑是:先确定大方向,再缩小范围,最后精确定位。第一层是柏林-凯基础色彩词分类,也就是判断这件衣服属于九大颜色类别中的哪一类——比如"蓝色系"。第二层是在确定了大类之后,进一步从CSS命名颜色中找到更精确的色名——比如"矢车菊蓝(cornflowerblue)"。第三层是在CSS颜色的基础上,给出一个精确的CIELAB颜色坐标,这是一种模拟人眼感知颜色的数学坐标系,可以精确到"这种蓝色比那种蓝色略偏绿一点点"的程度。

衡量颜色预测准确性的指标是ΔE00(读作"Delta E零零"),这是一个描述两种颜色在人眼感知上差距多少的数值,数值越低意味着预测颜色与真实颜色越接近,低于1表示人眼几乎无法察觉差异,低于3表示差异轻微。

不用任何约束、直接预测CIELAB坐标时,ΔE00为15.0,错误率相当高——就像你说一件衣服是"蓝色"结果它其实是"紫色"。只用CSS颜色的中心点来预测时,ΔE00降到9.70,颜色精度大幅提升。使用完整的三层流水线(柏林-凯→CSS→CIELAB)时,ΔE00进一步降至9.10,比无约束基线减少了39%的感知误差。如果假设前两层分类完全正确(研究团队称之为"oracle"理想上限),ΔE00可以进一步降到5.74,说明这套流水线框架的理论上限还有提升空间,主要瓶颈在于前两层的分类精度,而不是最后一步的回归计算本身。

六、单色预测能做到,多色调色板却是另一回事

系统能准确预测一件服装的主色调,但如果想预测一件服装的完整调色板(比如主色之外还有哪些配色),结果就大相径庭了。

研究团队系统性地测试了这个方向。数据集中每件服装都有六格颜色标注,分别记为c1到c6,c1是主色,之后依次是次要颜色。当训练AI预测c1时,准确率是44.53%,ΔE00中位数为3.09,在"感知相近"的范围内;换成c2时,准确率降到38.55%,ΔE00升到5.39;到c3时,ΔE00已经是10.38;c4更是高达16.77。到第四格颜色,预测误差已经完全超出了合理的颜色匹配容忍范围,基本上是在"瞎猜"。

研究团队还尝试了另外两种方法。一种是把问题变成"多标签分类":不再预测各格颜色的顺序,而是预测这件衣服的调色板里出现了哪些颜色(91个CSS色名,任意组合)。这种方法对预测"有没有这种颜色"的准确率还不错(预测一个颜色时准确率85.8%),但预测多个颜色时准确率快速下滑,而且无法告诉你哪个颜色是主色。另一种方法是"锚点辅助续预测":把已知的主色c1作为提示,让AI预测c2。这种方法让c2的预测准确率提高了4.6个百分点,但到c5时提升效果完全消失,证明次要颜色之间的关联性非常弱。

这个结论说明,时装服装的完整调色板预测,在目前技术条件下仍是一个未解决的难题。研究团队诚实地将这个局限性写入论文,并解释为什么系统只输出主色:因为这是数据信号真正支撑的能力边界,而不是系统设计的偷懒。

七、这套系统到底有什么用,局限在哪里

FASH-iCNN设计的颜色输出有三个层次的实用性,可以服务不同需求的用户。对于只是想了解"这件衣服属于哪种风格传统"的普通用户,系统给出的时装屋归属和年代判断,以及对应的命名颜色传统,就已经很有参考价值。对于想深入理解某件服装颜色渊源的用户,可以沿着"柏林-凯色族→CSS具体色名"这条线索追溯。对于需要做出精确配色决策的设计师或造型师,系统提供的CIELAB坐标则能直接用于色彩管理工具。

这套分层输出,是把"文化溯源"和"色彩精度"融合在一起的尝试,这在纯粹的推荐系统或纯粹的颜色识别工具中都是看不到的。

系统未来的一个重要扩展方向,是把这套框架移植到非西方时装档案或区域性服饰文化上。相同的技术结构,完全可以用来学习完全不同的文化审美逻辑,生成在文化内容上截然不同但在技术结构上完全一致的"文化透明型"预测系统。

说到底,FASH-iCNN真正在做的事情,是把时装AI从一个"给你推荐东西但不告诉你为什么"的黑盒,变成一个"给你看见推荐背后的文化逻辑"的工具。每一件衣服都是某个时代、某个创意总监、某种审美传统共同签名的文化产品。过去,AI把这个签名藏了起来,用其影响你的品味却不声张。FASH-iCNN做的,是把那个签名重新展示出来,让你能够看见、思考、甚至选择是否接受它的影响。

这并不是一个完美的系统,它的颜色精度还有提升空间,它的数据视野还局限在西方奢侈时尚圈,它的多色板预测还是个难题。但它把"文化透明性"作为AI设计原则来认真对待,本身就是一种值得关注的尝试。下次当你打开一个穿搭推荐APP,你或许会多想一步:这个建议,背后藏着谁的审美基因?

Q&A

Q1:FASH-iCNN系统是如何判断一件衣服出自哪个时装屋的?

A:FASH-iCNN通过分析服装图片的视觉特征来识别时装屋身份。研究发现,布料纹理和明暗层次是最关键的识别信号,而不是我们通常以为的颜色。去掉颜色信息只会让准确率下降约10个百分点,但去掉纹理信息会让准确率大跌近38个百分点。简单说,不同品牌的布料质感和光影处理方式,才是它们最独特的"视觉指纹"。

Q2:FASH-iCNN颜色预测的三层流水线具体是怎么工作的?

A:系统采用"从粗到细"的三步走策略。第一步判断服装属于哪个大色类,比如"蓝色系";第二步在蓝色系里锁定一个更精确的CSS命名颜色,比如"矢车菊蓝";第三步给出这个颜色在感知色彩坐标系里的精确数值。这种层层约束的方式比直接猜最终数值的方式,颜色误差减少了约39%。

Q3:FASH-iCNN为什么只预测主色而不预测完整调色板?

A:研究团队系统测试后发现,服装次要颜色与主色之间几乎没有规律性关联。从第四格颜色开始,预测误差就已经完全超出合理范围,相当于随机猜测。这不是系统设计的缺陷,而是数据本身揭示的信号边界:服装调色板中除主色以外的颜色,目前用单张图片无法可靠预测。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
骂中国最凶,过中国领空最勤,新法落地后日本航司机票先涨两千四

骂中国最凶,过中国领空最勤,新法落地后日本航司机票先涨两千四

回京历史梦
2026-05-07 12:35:20
骑士曾谈判交易字母哥!雄鹿狮子大开口:索要莫布利+全部首轮签

骑士曾谈判交易字母哥!雄鹿狮子大开口:索要莫布利+全部首轮签

罗说NBA
2026-05-08 06:19:08
今年五一,全球旅游业傻眼了,中国人长假不再“爆买”全球了

今年五一,全球旅游业傻眼了,中国人长假不再“爆买”全球了

魔都姐姐杂谈
2026-05-07 12:53:33
斯诺克最新世界排名:吴宜泽创新高,32强中国占10席,常冰玉第48

斯诺克最新世界排名:吴宜泽创新高,32强中国占10席,常冰玉第48

球场没跑道
2026-05-07 11:43:43
新物种广西两头蛇被发现

新物种广西两头蛇被发现

大象新闻
2026-05-07 10:14:04
保险公司回应“VIP答谢游乱象”:已启动调查工作

保险公司回应“VIP答谢游乱象”:已启动调查工作

新浪财经
2026-05-07 17:51:38
特朗普:美三艘军舰遭袭 要求伊朗“迅速签署协议”

特朗普:美三艘军舰遭袭 要求伊朗“迅速签署协议”

新华社
2026-05-08 07:09:02
张水华团队误判!已铁定无缘亚运会,排名比她靠后选手却保留机会

张水华团队误判!已铁定无缘亚运会,排名比她靠后选手却保留机会

杨华评论
2026-05-07 01:59:53
提气!安徽省委书记给“一把手”们敲了钟

提气!安徽省委书记给“一把手”们敲了钟

米师傅安装
2026-05-08 00:43:01
雅马哈放弃的日本人,张雪找来当宝!让张雪机车少走10年弯路!

雅马哈放弃的日本人,张雪找来当宝!让张雪机车少走10年弯路!

趣味萌宠的日常
2026-05-07 19:51:53
闻泰复牌“戴帽” 披露整改方案 市场仍不买账?

闻泰复牌“戴帽” 披露整改方案 市场仍不买账?

中国经营报
2026-05-07 20:13:53
虽然赢不了中国队,却赢得了全世界球迷的心!

虽然赢不了中国队,却赢得了全世界球迷的心!

杨晨大神
2026-04-20 12:06:28
今天,年轻人为什么喜欢马克思

今天,年轻人为什么喜欢马克思

中央编译出版社
2026-05-06 17:01:49
徐志胜红了,但是他没有忘本,五一节去参加了大学女同学的婚礼!

徐志胜红了,但是他没有忘本,五一节去参加了大学女同学的婚礼!

乐悠悠娱乐
2026-05-05 10:56:43
解锁和谐性爱的秘密:那令人沉醉的三种极致体验

解锁和谐性爱的秘密:那令人沉醉的三种极致体验

精彩分享快乐
2026-05-08 07:05:07
张庭直播忘了开美颜,56岁真实脸吓坏网友:这谁顶得住?

张庭直播忘了开美颜,56岁真实脸吓坏网友:这谁顶得住?

南万说娱26
2026-05-07 10:18:42
黑龙江2名失踪女孩已遇难,家人哭得死去活来,知情人透露更多

黑龙江2名失踪女孩已遇难,家人哭得死去活来,知情人透露更多

魔都姐姐杂谈
2026-05-07 13:33:32
美军空袭伊朗港口,美方:对伊军事设施实施了定点打击,美导弹驱逐舰编队在穿越霍尔木兹海峡时,伊发射了多枚导弹,美采取自卫反击行动

美军空袭伊朗港口,美方:对伊军事设施实施了定点打击,美导弹驱逐舰编队在穿越霍尔木兹海峡时,伊发射了多枚导弹,美采取自卫反击行动

扬子晚报
2026-05-08 07:13:49
回血的深圳,消失的中产

回血的深圳,消失的中产

壹地产
2026-05-07 19:20:26
美股高开低走 三大指数集体收跌

美股高开低走 三大指数集体收跌

财联社
2026-05-08 04:02:13
2026-05-08 07:59:00
科技行者 incentive-icons
科技行者
科技正在如何变革商业世界
8262文章数 563关注度
往期回顾 全部

科技要闻

月之暗面完成20亿美元融资,估值突破200亿

头条要闻

媒体:三星"败退"中国市场有两个原因 先别急着庆祝

头条要闻

媒体:三星"败退"中国市场有两个原因 先别急着庆祝

体育要闻

巴黎再进欧冠决赛,最尴尬的情况还是发生了

娱乐要闻

Lisa主持!宁艺卓观看脱衣秀风波升级

财经要闻

人均年薪406万,这家ST公司惊呆市场!

汽车要闻

雷克萨斯全新纯电三排SUV 全新TZ全球首发

态度原创

本地
艺术
亲子
手机
旅游

本地新闻

用青花瓷的方式,打开西溪湿地

艺术要闻

21 岁徐悲鸿画的 “天价仙女”,被网友骂 “生无可恋”

亲子要闻

八部门发文改善保障儿童用药供应,有望解决四大痛点

手机要闻

颜值封神直击果粉内心!iPhone Fold 全新外观曝光,看完瞬间被圈粉

旅游要闻

江门长堤业态焕新 有商户五一营收倍增

无障碍浏览 进入关怀版