网易首页 > 网易号 > 正文 申请入驻

从Python小白到AI核心:被AI改变的华人青年

0
分享至

GPT Image2全网刷屏,但效果究竟为什么这么好?

研究负责人陈博远揭秘:底层架构已彻底重构。



但他又拒绝回答是否采用扩散模型或自回归技术,只是神秘的将其描述为“通用模型”或“图像领域的GPT”。





这样突破性的成果,核心团队只有13人。

整个团队的负责人Gabriel Goh晒出了的团队成员AI全家福。



评论区有网友感叹:怎么全是亚洲人?



GPT Image 2究竟是什么架构?

OpenAI恐怕很长一段时间都不会公布了,但从核心团队成员的学术经历可以看出一些痕迹。

陈博远是团队的Research Lead,他和另一位成员Kiwhan Song在MIT读博时有同一位导师Vincent Sitzmann。



他博士期间的代表作Diffusion Forcing: Next-token Prediction Meets Full-Sequence Diffusion入选了NeurIPS 2024。

这项研究提出Diffusion Forcing这一全新序列生成训练范式,将逐token独立噪声级扩散与因果下一个token预测结合,融合自回归模型的可变长度生成与全序列扩散模型的长程引导优势。



他在谷歌实习期间还以共同一作身份发表了SpatialVLM。

通过过自动构建互联网规模的3D空间推理 VQA 数据集(1000 万图像、20 亿 QA 对),为视觉语言模型赋予定量 / 定性空间推理能力,可从单张 2D 图像输出米制距离、尺寸、方位等精确数值。

这项研究把思维链空间推理应用到了具身智能领域。



在谷歌实习期间,他开发的指令微调技术后续还被Gemini 2.0采用。

他在高中参加科研夏令营时,还不懂Python的基本语法,那时结识的谷歌DeepMind资深研究员夏斐把他引入了AI世界。

夏斐两次邀请他到DeepMind完成高质量实习,这些经历使陈博远积累了大规模模型训练的工程经验,也为他理解多模态系统的数据需求提供了宝贵视角。



中科大博士毕业的Jianfeng Wang,在GPT Image 2团队负责的是另一个让人惊叹的能力:指令遵循和理解世界。



旧模型画的永远时钟永远指向10:10,源于网络上的钟表广告图,几乎清一色都是10:10。

这是因为钟表厂商找心理学家做过实验,认为这有助于刺激消费者买表的意愿。



他让新模型画2:25、3:30、9:10、7:45,全部精准。



这只是开胃菜。

更多复杂的空间布局,苹果在中心、杯子在右边、书在上面、相机在左边、篮球在下面。模型全部精准执行。



在加入OpenAI 之前,他在微软工作近9年。在微软期间就与OpenAI团队在DALLE-3上有合作。

世界知识理解能力的大幅提升,对象的语义内容和功能结构 有正确的理解

JianFeng Wang在演示视频结尾说:GPT Image 2正在消除你的意图和模型产出之间的差距。

真正做到你想要什么,模型就给你什么。

Yuguang Yang在GPT Image 2的发布活动中演示了生成信息图和PPT。





他的经历可以说是团队成员中最丰富的,每换一个工作都是跨界,但都聚焦机器学习。

他本科在浙大竺可桢学院学的工程,博士在约翰斯霍普金斯大学期间学的是计算化学物理与机器学习。

他第一份全职工作是量化分析师,在清华做访问研究员期间亚牛的的是用于纳米机器人的强化学习和控制算法。

后来他在亚马逊做过Alexa语音研究。

2025年初加入OpenAI后,除了图像生成还参与过ChatGPT智能体项目。



他在个人账号上介绍GPT Image 2的信息图生成能力,可以为科研人员节省大量时间。



还反复提醒大家,要做信息图不要忘记选择思考模式。



从团队成员Kenji Hata的自我介绍中得知,GPT Image 1.0也就是GPT-4o的图像生成部分。



有一个人从DALL-E开始参与了OpenAI多模态系列研究的全程。

他就是GPT Image 2.0团队负责人Gabriel Goh。

从2019年加入OpenAI,他的早期研究更篇理论,专注于可解释性和凸优化等等。

从DALL-E开始慢慢转向了图像生成。



看到另一位团队成员Weixin Liang的研究履历,GPT Image 2的技术底色又揭开了一角。

他在Meta实习期间的代表作Mixture-of-Transformers,引入模态解耦的MoE和解耦注意力,显著降低多模态模型预训练的计算成本。



他博士毕业自斯坦福,本科也毕业自浙大竺可桢学院,不过比Yuguang Yang要晚好几年。

Weixin Liang与陈博远一样都是25年博士刚毕业就加入OpenAI,迅速成为团队的核心成员。



其他GPT Image 2.0团队成员还包括:

Ayaan Haque,之前在Luma AI 工作,参与过Luma的视频生成基础模型Dream Machine的训练。

Bing Liang,在Google干了5年多,参与Imagen3、Veo、Gemini Multimodal,2025年跳到OpenAI做图像生成研究。

Mengchao Zhong,本科上海交通大学校友,硕士毕业于得克萨斯农工大学,在Pinterest和Airtable做过软件工程师,在OpenAI负责多模态产品的工程。

Dibya Bhattacharjee,耶鲁大学,2015年IPhO铜牌,CIE A-Level数学和生物全球最高分。

Kiwhan Song是25年10月最晚加入的,除了做研究之外,他还是团队里的提示词大师,大家看到的官方演示图很多都出自他手。……

从最早的DALL-E到今天的GPT Image 2.0,这只团队先后解决了。画得出来、画得清楚、画得好看、画得准。

尽管近年来OpenAI的人才流动很大,但OpenAI还是那个能不断吸引各种有个性的人才,不限制专业、欢迎跨界,信奉自下而上涌现式研究的公司。

从一个小团队开始,有了突破后公司倾斜更多资源,直到改变世界。

曾经,GPT-4o图像生成模仿吉卜力风格生成的头像席卷了全世界。

如今GPT Image 2.0的团队成员,都把自己头像换成了这种奇脖子画风。



那么这种画风的提示词是什么?团队成员也公布了出来

声明:个人原创,仅供参考

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
特权60天期限将至,特朗普必须撤回美军?是战是和只剩7天决定!

特权60天期限将至,特朗普必须撤回美军?是战是和只剩7天决定!

薛小荣
2026-04-23 17:21:37
一婚嫁初恋,二婚嫁洋富豪,和儿子在国内生活,63岁仍接商演赚钱

一婚嫁初恋,二婚嫁洋富豪,和儿子在国内生活,63岁仍接商演赚钱

冷紫葉
2026-04-25 14:26:03
正在直播!斯诺克世锦赛:八强再出二,丁俊晖vs赵心童二阶段开打

正在直播!斯诺克世锦赛:八强再出二,丁俊晖vs赵心童二阶段开打

金风说
2026-04-25 17:13:42
女人偷情的高峰时期通常是什么时候?

女人偷情的高峰时期通常是什么时候?

思絮
2026-04-25 22:35:08
《八千里路云和月》大结局:丁玉娇的良人从不是万福,而是田家泰

《八千里路云和月》大结局:丁玉娇的良人从不是万福,而是田家泰

怂熊剧场
2026-04-26 16:18:01
暴跌11℃!即将大反转,南京人注意了,这波很猛!

暴跌11℃!即将大反转,南京人注意了,这波很猛!

鲁中晨报
2026-04-26 11:56:06
刘晓庆助理古柯直播爆料细节,称对方曾承诺离婚,王晓玉始终陪伴

刘晓庆助理古柯直播爆料细节,称对方曾承诺离婚,王晓玉始终陪伴

一盅情怀
2026-04-26 15:34:49
城市更新大潮来了!中央定调:20年房龄老房子,2026年起或又吃香

城市更新大潮来了!中央定调:20年房龄老房子,2026年起或又吃香

混沌录
2026-04-20 16:38:07
北京一大学副书记,拟获提拔!曾任清华大学副部长、校办主任…

北京一大学副书记,拟获提拔!曾任清华大学副部长、校办主任…

双一流高校
2026-04-27 00:09:28
研究表明:性生活越频繁,射精和勃起问题越少!

研究表明:性生活越频繁,射精和勃起问题越少!

黯泉
2026-04-05 20:40:12
记者:为争取休息时间,津门虎队在京津德比赛后连夜驱车返津

记者:为争取休息时间,津门虎队在京津德比赛后连夜驱车返津

懂球帝
2026-04-26 10:17:07
烈火之后的清泉:那些让灵魂“高潮”后想喝水的技巧,太爽了

烈火之后的清泉:那些让灵魂“高潮”后想喝水的技巧,太爽了

精彩分享快乐
2026-04-23 07:20:03
从古至今,能赚大钱的生意其实就四种

从古至今,能赚大钱的生意其实就四种

流苏晚晴
2026-04-12 14:55:21
啥也没干满盘皆输?伊朗战争最大的输家出现,国运“彻底”凄惨了

啥也没干满盘皆输?伊朗战争最大的输家出现,国运“彻底”凄惨了

叹知
2026-04-27 01:17:12
土以要开打?埃尔多安威胁攻打以色列后,不到1天,卡茨强势出招

土以要开打?埃尔多安威胁攻打以色列后,不到1天,卡茨强势出招

老谢谈史
2026-04-14 17:08:45
爸爸梦到已故儿子说脚被刺扎了,立马驱车来到孩子墓前,眼前的一幕让人惊呆了!

爸爸梦到已故儿子说脚被刺扎了,立马驱车来到孩子墓前,眼前的一幕让人惊呆了!

张晓磊
2026-04-10 11:24:23
非史实:太平公主质问玄宗:我助你登上皇位为何如今却要我的命?

非史实:太平公主质问玄宗:我助你登上皇位为何如今却要我的命?

卡西莫多的故事
2026-01-09 11:00:33
外国姐姐的焦虑:想瘦成小只,奈何压力太大

外国姐姐的焦虑:想瘦成小只,奈何压力太大

飛娱日记
2026-04-09 10:03:55
以牙还牙,中国打响反制第一枪,一举切断美欧命脉,美欧坐立难安

以牙还牙,中国打响反制第一枪,一举切断美欧命脉,美欧坐立难安

古史青云啊
2026-04-25 08:46:23
难怪美国一点不慌,原来真有内鬼输血!1200吨战略物资被悄悄贱卖

难怪美国一点不慌,原来真有内鬼输血!1200吨战略物资被悄悄贱卖

老谢谈史
2026-04-26 21:27:25
2026-04-27 03:23:00
梦想的现实
梦想的现实
梦想的现实
937文章数 82关注度
往期回顾 全部

科技要闻

涨价浪潮下,DeepSeek推动AI“价格战”

头条要闻

特朗普内阁又一女部长落马:强迫男下属为其提供性服务

头条要闻

特朗普内阁又一女部长落马:强迫男下属为其提供性服务

体育要闻

森林狼3比1掘金:逆境中杀出了多孙穆?!

娱乐要闻

仅次《指环王》的美剧,有第二季

财经要闻

事关新就业群体,中办、国办发文

汽车要闻

预售19.38万元起 哈弗猛龙PLUS七座版亮相

态度原创

教育
房产
健康
亲子
公开课

教育要闻

超燃暴击!孩子们为啥都乐翻天了?!这所人附系学校揭秘

房产要闻

新一轮教育大爆发来了!海口,开始疯狂建学校!

干细胞如何让烧烫伤皮肤"再生"?

亲子要闻

爸爸买的餐椅太好了,早知道早买了#餐椅 #宝宝板凳 #宝宝吃饭 #宝妈推荐

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版