我在字节「上班」了|安可|框图|图像生成基础模型

我在字节「上班」了

2025-09-22 13:12:11　来源: 唐韧

北京举报

分享至

早上我给朋友发了一张图片，他惊讶地问我，你去字节上班了？

这张图片是这样的。

怎么样，是不是毫无违和感？

别惊讶，开个玩笑，上班是不可能上班了，但 AI 可以帮我搞一张大厂体验卡。

如果我告诉你，这张字节工牌是由下面两张图片生成的，我没有用 PS 魔法，只是简单给 AI 提了一个需求。

最近我每天使用 AI 产品的频率高了很多，也把很多 AI 产品应用到了工作和生活中，有时候也会拿来玩一玩。

如果你还只是关注 AI 但还没有上手 AI，我的建议是，尽快动手。

前阵子在朋友介绍下体验了字节的即梦 AI 新版本，准确说是他们的新模型 Seedream 4.0。

即梦 AI 4.0 的主要特性是支持多图参考和组图生成，跟之前我介绍的 Nano Banana 能力类似。

我总共试验了不同场景下的需求，怎么说呢，没那么满意，但也不至于很失望。

先说几个成功的案例。

我的第一个需求是将下面两张照片合并成一张，提示词是「把图片中拿铲子的小孩和另外一张图里的大人放在一起，两人并排站着看远方的湖泊」。

选择 Seedream 4.0 的模型，经过即梦 AI 的造梦后生成了一组图片，我从中选择了一张效果比较好的。

相较于原图来说，AI 生成的图对我的原图做了光影优化，更加还原了我所穿衣服的颜色。

另外，合成后的图片里，参照了小小唐所在图中的湖水颜色，而且水中还有天上云朵的倒影，岸边盐湖的质感也呈现了出来。

原图所在的地点是青海茶卡盐湖，看来 AI 识别出来了。

再看一张我觉得效果不错的。

这张是把小小唐所在原图中对岸的小火车和人群元素加了进来，并且让他站在我原本站的台阶上，而我站在了台阶下。

再看一个我觉得也算成功的案例，原图是下面这张。

我的需求是把图中的黑车变成白车，然后加上车牌号，提示词是「把图中的车辆换成白色，加上绿色新能源车牌，车牌号是“湘AFV0304”」。

看下结果。

车漆是换成功了，但车顶好像还是黑色，而且车牌的中文字有点歪曲。

接下来我又给它上了点难度，在原来提示词的基础上增加一个黑白双拼车身的需求。

这次车顶也被修改成白色了，而且双拼车漆的效果看起来也不错，车牌也正确。

好，接下来就看其他失败的案例，先看下面两张原图。

我输入的提示词如下。

不知道是我提示词的问题还是照片比例问题，生成结果中我的人物比例都是偏大的。

而且，我的面部全部都糊掉了，就像一个巨人一样站在台上。

不过整个人物倒是抠出来了，而且手部动作也到位。

后来又调整了一下提示词重新生成了一组图片，虽然在其中找到了一张人物比例正确的，但是脸部依旧是糊的。

有趣的是，这次的结果中把我的照片搞到后面屏幕的 PPT 里去了，关键是脸部竟然没糊。

接着看，我在网上找了一套衣服的图片，希望把这套衣服穿在左边我的照片上。

我从生成结果里找了一张相对靠谱的，衣服是穿上去了，但脸又糊了，已经不怎么像我了。

神奇的是，AI 竟然把我光腿的样子想象了出来，还别说，腿型和我真像，连腿毛都有刻画。

然后我又给即梦 4.0 提了个需求，让它以我这张照片为主题，生成一个包含 4 个画面的分镜头，并配上字幕。

提示词我是这么写的「以图中人物为主题，生成一组工作场景分镜，主题是一个字节跳动的产品经理和程序员在针对一个需求的讨论，场景设定在会议室，总共出 5 张图片，每一张图下方都要配上中文字幕」。

然后，我得到了这 5 张图片。

5 组分镜倒是生成了，但还是前面的问题，脸糊掉了，而且表情和五官非常怪异。

另外，第三个分镜中我和程序员的衣服竟然对调了，果然是穿一条裤子的难兄难弟。

除此之外，场景和情节构建倒是挺像那么回事儿。

不管怎么说，AI 算是把我在字节的「工作照」给弄了出来。

既然即梦 4.0具备一定的推理能力，于是我让它针对一个产品线框图做高保真原型。

这是线框图原图。

提示词是这样的「把这张产品线框图渲染成高保真原型，风格选择京东红，保证设计规范的一致性，要求视觉美观，文案正确」。

看结果。

从生成的结果来看，不能说一点不对，但也基本是没啥用。

当然，可能这个问题可能有点超纲了。

到目前为止我尝试过的场景需求中，能称得上结果令人基本满意的只有前面两个，成功率并不高。

至于字节有没有搞砸，我觉得还需要留一些时间给他们进化。

可能是我的使用方式不对，也可能是提示词不精准或者题目太难，总之没达到预期。

当然，如果只是玩一玩基本也够了，但如果要放在生产领域那就还差点火候。

不过我还是看到了一些实际应用空间，

比如，假设在装修设计环节我想对这个原图的布局做一些调整，提示词是「把这张图片中客厅里的电视换成投影仪屏幕，地毯换成浅蓝色，客厅顶部的灯换成吊顶圆灯」。

过去，可能需要设计师重新调整并再出一版方案。

现在，用 AI 进行快速重构并给客户进行演示的话，效率还是提高很多。

在上面的 AI 出图中，除了投影仪的位置有问题，其他部分的改动需求 AI 都完整做到了。

除此之外，像广告创意、产品演示、服饰搭配、装修效果展示等场景都可以用到。

即梦 AI 4.0 倒是让我看到了未来的一种创意方式，那就是把想象力变成现实的工具。

只要你有想法，你要你能准确描述，剩下的就可以交给 AI。

因此，丰富的想象力和精准的表达力，这依旧是我们作为人的优势，也是把 AI 当做工具更好使用的杠杆。

类似即梦 AI 或者 Nano Banana 这样的工具是普通人都可以上手的，如果你过去因为不懂 PS 而难以下手，那现在只要你会说话就可以拿起 AI 的调色盘。

说到这我倒是觉得即梦的产品定义非常好，造梦。

电锯在手，就不要惦记锤子了。

················· 唐韧出品 ·················

安可时刻

最近我继续在小报童上更新 AI 基础技术知识专栏，用通俗易懂的方式讲解 AI 技术背后的原理，帮助不懂技术的同学了解基础原理和逻辑。

目前 AI 章节已经更新了十几个知识点，我争取保持每周更新，其实也是对我学习和实践的一次总结。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

手机 / 数码

房产 / 家居

我在字节「上班」了

告别废话文学与幻觉！GPT-5.5 Instant发布

牛弹琴：高市终于下跪了 中韩等亚洲人内心感到气愤

牛弹琴：高市终于下跪了 中韩等亚洲人内心感到气愤

全世界都等着看他笑话，他带国米拿下冠军

神仙友谊！杨紫连续10年为张一山庆生

人形机器人七小龙:谁真能卖 谁在讲故事?

吉利原生新能源越野架构亮相 AI如何带来极致越野

态度原创

孩子摆烂躺平，家长放任不管能靠他自己好起来？

宽度明显缩减 iPhone 18 Pro缩小灵动岛尺寸

卷首语｜这届年轻人，全员渡劫奥德赛

用青花瓷的方式，打开西溪湿地

刷新行业纪录！美光推出全球最大容量商用SSD：单盘245TB

牛弹琴：高市终于下跪了中韩等亚洲人内心感到气愤

牛弹琴：高市终于下跪了中韩等亚洲人内心感到气愤

人形机器人七小龙:谁真能卖谁在讲故事?