![]()
早上好,我是洛小山。
你有没有想过,如果一百多年前,那些国之瑰宝没有遭遇劫难,它们今天会是什么样子?
如果圆明园没有付之一炬,敦煌的经卷没有流散四方,我们或许就不必隔着残垣断壁、泛黄故纸与手绘线稿,去想象它们曾经的色彩与荣光。
长久以来,为了回答这个横亘百年的「如果」,我们只能依靠史料的碎片和艺术家的想象。
直到可控生图技术的出现,为我们提供了一种全新的可能:用算力,去尝试缝合历史深处的遗憾。
上次我用AI修复敦煌壁画后,我的朋友黄教授,向我提出了一个更具挑战的课题:壁画是二维的,那么结构更复杂、史料更分散的三维建筑,AI 能否能做好?
正是这个提议,我启动了复原海晏堂的想法。
我想亲眼看看,文献中描述的那个「中西合璧,华丽壮观」的景象,到底离我们有多远。
也想探索一下,AI 除了聊天、创意绘图之外,还可以做哪些有意义的事?
![]()
请看我用AI复原的,海晏堂的春夏秋冬。
![]()
![]()
![]()
![]()
视频:
非常震撼,在复原的过程中,我心潮澎湃。
但这背后,并非一次简单的输入提示词出图。
为了得到这四张图,我参考了海量的资料,
![]()
生成了上百张效果图与参考图…
![]()
![]()
为什么会这么多?
因为在没有给 AI 明确指出里面所有细节的时候,它生成的结果大概率是这样的:
根据这张照片,结合你对中式与西洋建筑的理解,重构这张图片。
![]()
这样的…
根据这张照片,结合你对西洋建筑的理解,尝试复原这张图片,要写实、照片拍摄。
![]()
这样的…
根据这张照片,结合你对西式建筑的理解,尝试复原这张图片,要写实、使用佳能照片拍摄。
![]()
看起来似乎都对了,
实际呢?
他们都不对。
因为,他们不符合史实。
比如,这些AI生成的兽首都是错的。
史实是:头部为青铜,基座为石质。
而AI在缺乏明确指令时,会随机生成纯石质或纯铜质的雕像。
![]()
![]()
![]()
所以,如果我们只是给出一个模糊的指令,AI生成的内容大概率是错的。
错的内容只能看感觉。正确的内容才能感受文化。
那么我们该怎样才能得到那个正确的结果呢?
怎样确保我们复原的,是历史,而不是幻觉呢?
昨天下午在交大设计学院,我与同学们分享了我探索中沉淀出的方法论。
我总结为三大原则。
![]()
![]()
原则一:知识先行,给 AI 立规矩
在任何严肃创作中,AI的第一重身份,不应是美术,而应是学生。
我们不能期望 AI 凭空创造,而必须先为它建立一套严谨、准确的知识框架。
这项原则,我称之为「知识先行」。
开始重制的时候,我的第一步,其实是尽可能完善收集各类资料。
尽可能将散落在网络和文献中的碎片化史料,转化为 AI 能够理解和执行的结构化信息。
这里我推荐技巧有:
1、知识萃取: 利用大语言模型的信息整合能力,针对「海晏堂建筑风格、材质、色彩、兽首细节」等关键问题进行深度研究。
2、事实提纯: 将研究报告,提炼成一份纯粹的、客观描述的设计说明。尽可能剔除所有主观形容词和猜测,只保留事实性的描述。
比如前面提到的兽首问题,在说明中就必须明确为:头部是红铜材质,基座是人身石雕。
![]()
![]()
这个过程,本质上是在创作开始前,为 AI 划定一个「事实的边界」。
边界之内,AI 可以发挥其强大的渲染能力;边界之外,就不能让 AI 凭空想象。
最终,描述文件文档大概是这样的:
![]()
这套「先有规矩,后有方圆」的思路,是保证 AI 产出内容准确性的第一道防线。
原则二:分层迭代,让过程可控
试图让 AI 一步到位完成复杂任务,本质上就是一场结果不可控的对赌。
真正专业的工作流,我们需要放弃对单次完美结果的幻想,建立一套分层迭代的流程。
我们需要让每一步都可验证、可修正。
这项原则,我定义为「分层迭代」。
AI 作图其实和传统的设计、软件工程的逻辑大差不差。
我们得将一个宏大的目标(比如复原海晏堂),拆解成一系列逻辑上独立的子任务,然后分步执行,步步确认。
具体路径:
1、结构和色彩分离: 基于原始线稿和知识文档,第一步只让 AI 生成一张不含光影和复杂材质的「基础色稿」。此阶段的目标是确保建筑结构和色彩关系100%准确。
![]()
2、光影和质感分离: 在色稿准确无误的基础上,第二步再让AI专注于渲染真实世界的光影、材质与氛围。由于核心变量已被锁定,这一步的输出稳定性会大幅提升。
![]()
3、场景和环境分离: 获得标准日景图之后,再以此为基础,去拓展四季变化等不同场景。
![]()
这套流程的本质,就是将一个充满不确定性的黑箱,变成了一个相对透明的、模块化的工作流。
原则三:人类校验,守住真实的底线
AI 是强大的模拟器,但人类的知识与常识,永远是真实世界的最终守护者。
在人机协作的所有环节,我们需要扮演无可替代的最终审稿。
这项原则,我定义为「人类校验」。
AI 可以基于数据生成一个看似合理的虚拟世界,但这个世界是否符合物理规律、历史常识与文化背景,必须由人类专家来最终裁定。
具体路径:
1、常识校验:比如我之前让 AI 生成冬天的场景,发现 AI 生成的雪景图里的水池没结冰,树木居然是绿色的。
这些其实违背了自然规律,但因为 AI 没有这些鉴别能力,所以很难做好 。
你看下面的图,冬天的北京,树叶还是绿色的。
![]()
2、人工干预: 针对问题,通过优化指令或使用局部重绘等工具精准修正,确保最终成品符合我们对真实世界的认知。
![]()
有些时候,你甚至得动用 PhotoShop 等传统软件,进行古法创作…
![]()
AI 负责拓展创作的可能性,而我们得负责守住真实性的底线。
这种人机之间的相互制衡和补全,我觉得才是 AI 时代创作者最核心的价值所在。
写在最后:技术向善才更添文化自信
上面分享的「知识先行」、「分层迭代」、「人类校验」三大原则,是我在这次复原海晏堂的探索中,总结出的一点个人心得。
我不敢说它能指导多么宏大的命题。
但我想,对于所有需要与AI协作,去完成对「真实」有较高要求的创作时,这套思路或许是相通的。
无论是复原一段历史,设计一个产品,还是完成一份相对严谨的还原图。
技术本身是中立的,但当我们用它去抚平历史的褶皱,去传承文化的记忆时,我们就为冰冷的算力,注入了属于我们自己的温度与思考。
当我们用AI去回答历史留下的「如果」时,我们得到的,也不仅仅是一张高清的复原图。
举例来说,如果圆明园没有被毁,它在万籁俱寂的夜晚,或许会是这样一番景象吧?
![]()
这个方法论,更像是一篇严谨的笔记,一次与历史的深度对话…
也是我们这一代人,为文化传承,尽的一份心力。
这条路,我们才刚刚开始。
P.S. 这次复原,除了方法论,在工具选择(比如为何主要使用可控性更强的模型,而非Midjourney)上也有很多细节。
你对这部分感兴趣吗?
或者,你最希望看到我用这套方法,去复原哪个你心中的历史遗憾?
在评论区告诉我,或许就是我下一个挑战的目标。
如果你也想体验可控生成,推荐你使用 Lovart ,这是我用过最顺手的 AI 生图软件了,免费给他们打个广告。
关于我
我是洛小山,一个在 AI 浪潮中不断思考和实践的大厂产品总监。
我不追热点,只分享那些能真正改变我们工作模式的观察和工具。
关注我,我们一起进化。
本文知识产权归洛小山所有。
未经授权,禁止抓取本文内容,用于模型训练以及二次创作等用途。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.