光靠嘴皮子,搞不出好设计
最近刷到 Adobe 设计团队的一篇博文,标题很直接——“You Can’t Describe Your Way to Great Design”。读完之后颇有感触,私以为这篇文章戳中了当下 AI 设计工具的一个核心矛盾,而且这个矛盾不仅仅存在于设计领域,它其实映射了整个 AI 工具生态的一个深层问题。今天就来聊聊这个话题。
从「打字员」说起
不知道大家有没有这样的体验:用 Midjourney 或者 DALL-E 生成一张图,第一版出来之后觉得「嗯,差点意思」,于是你开始改 prompt——加个”warm lighting”、去掉”too saturated”、换成”slightly desaturated mood”…来回改个五六版,半小时过去了,最终效果嘛,姑且算是能用。
这个过程的本质是什么?是你在用一个文本输入框,去描述一个本该由直觉、手感、和上百次微调才能逼近的视觉目标。
Adobe 那篇文章里有句话说得特别到位:
That’s not a creative tool. That’s a command line with better marketing.
翻译过来就是:这哪是什么创意工具,这就是一个包装得更好看的命令行。
私以为这个比喻精准得令人发指。你想想,终端里面敲命令也是这个套路——输入指令、等待执行、查看结果、不满意再改参数。区别只是 Midjourney 给你配了个好看的 UI 而已。
两种「不够好」
文章把当前的 AI 设计工具分成了两个阵营,我觉得这个分类蛮值得展开说说:
第一类:安全但受限。 诸如 Canva 的 AI 功能、各种模板化工具,生成的东西可编辑、可控,但出来的效果嘛…怎么说呢,就像是公司年会 PPT 的既视感——不出错,但也不出彩。适合做个直播封面、搞个活动海报,真正需要「感觉」的设计?别想了。
第二类:惊艳但锁死。 Midjourney、DALL-E 这类工具,能生成令人窒息的氛围感大片,但一旦生成完毕,它就是一张死图。你想微调一下亮度?抱歉,重新生成吧。想把左边的元素往右挪一点?对不起,重新生成吧。想换一种蓝?你猜——重新生成。
这就像什么呢?就像你去餐厅点了一份牛排,上来之后觉得熟了一点,你跟厨师说「下次五分熟」,他端走了,重新给你煎了一份。可你其实只是想要再煎 30 秒而已,但在这个流程里,「再煎 30 秒」这个操作根本不存在。
| 安全型工具 | 惊艳型工具 | |
|---|---|---|
| 代表 | Canva AI、模板化工具 | Midjourney、DALL-E |
| 可控性 | 高,可编辑 | 低,生成即锁死 |
| 创意上限 | 低,适合基础需求 | 高,但无法精调 |
| 适用场景 | 电商图、活动海报 | 概念图、灵感探索 |
| 核心问题 | 天花板太低 | 迭代成本太高 |
真正的创作,是「手感」驱动的
文章里有一个观点我觉得特别精彩,也是很多做 AI 工具的人容易忽略的:好的设计不是「描述」出来的,是「摸」出来的。
一个视觉总监在调图的时候,他做的事情可能是:把亮度拉低一点看看、去一点饱和度、加个暗角、再把对比度往回调两格…这些操作每一个都很小,但它们是连续的、实时的、基于直觉反馈的。他可能花 30 秒就完成了一轮尝试,然后说「对,就是这个感觉」。
但你让他把这些操作翻译成一个 prompt?
“Make it slightly darker, desaturated, with a subtle vignette, but not too moody, maybe 10% less contrast…”
且不说这个描述有多别扭,光是在 prompt 和结果之间来回等待的时间,就足以把创作者的直觉节奏(rhythm)打碎了。文章里的原话是:
The move must happen in a heartbeat, or it won’t happen at all.
一言以蔽之:如果操作不能在心跳间完成,那这个操作就不会发生。
这让我想到了一个类比。你用过 Excel 吧?想象一下,如果 Excel 不是让你直接在单元格里输入公式、拖拽填充、实时看到结果,而是让你在一个对话框里描述「我想要在 A 列和 B 列之间做一个 VLOOKUP,然后把结果格式化为百分比」…这效率直接打回石器时代。
设计工具也是一样的道理。手和眼之间的反馈循环(feedback loop)一旦被文字输入打断,创作的流畅感就断了,而断掉的不只是效率,还有灵感。
那些「野路子」工作室
文章中提到的一个现象也很有意思。一些前瞻性的设计工作室已经不满足于用标准界面了,他们在搞什么?搭 ComfyUI 的节点流水线。
如果你是做 AI 绘图的,对 ComfyUI 应该不陌生。它本质上是一个可视化的节点编排工具,让你把 Stable Diffusion 的各种操作拆解成节点,然后用线连起来,搞出一套自定义的 pipeline。这些工作室用它来做风格迁移、重新打光、局部重绘…效果的确比纯 prompt 好太多。
但问题来了——这套东西太脆了。节点之间的连线稍有变动就可能全盘崩溃,而且需要专门招技术人员来维护。一个设计工作室,最后搞得像个小型研发团队一样,这合理吗?
说白了,这是在「正确的方向上」走了一条「过于 DIY」的路。方向对了,但代价太高。
AI 应该是什么角色?
文章提出的理想形态是这样的:AI 不应该是一个等你下命令的工具,而应该是一个环境级的助手(ambient assistant)。什么意思呢?
它应该能预判你要做什么。你把鼠标悬停在某个区域,它就准备好了几种可能的调整方案。你拖了一下亮度滑块,它不是机械地执行「亮度 +5」,而是理解你的意图,顺手把对比度和色温也微调了,因为它猜到你想要的是「更温暖的午后氛围」而不是「单纯调亮」。
这让我想到了一个概念——在软件工程领域,最好的 IDE 从来不是那个功能最全的,而是那个「最懂你」的。IntelliJ 之所以能打败 Eclipse,不是因为它的功能多了多少,而是因为它能在你敲下第一个字母的时候就猜到你想要什么,能在你犯错的瞬间给出修复建议。这种「润物细无声」的辅助,才是真正提升效率的方式。
设计领域的 AI 工具也应当如此。它不该坐在那里等你输入 prompt,它应该在你创作的每一个瞬间都在「陪跑」。
行业压缩:似曾相识的故事
文章最后提到了一个历史类比,私以为非常值得咀嚼。
当年数码相机和手机摄像头普及之后,发生了什么?不是所有摄影师都失业了,而是中间层被压缩了。那些拍证件照、拍产品图、拍活动花絮的中端商业摄影师,日子越来越难过。但顶级的时尚摄影师、艺术摄影师?他们的价值反而更高了,因为「品味」和「审美」这些东西,是器材替代不了的。
AI 设计工具正在复制这个剧本。
底层的需求——做个 logo、出个 Banner、搞个社交媒体配图——正在被 Canva 和 AI 生成器快速吞掉。中层的设计师——那些能把甲方的需求翻译成好看的视觉方案、但还谈不上「大师」的——正在被两面夹击。而顶层的创意总监、视觉艺术家,他们的核心价值恰恰是 AI 最难替代的东西:品味、直觉、和那「一百次微小实验」的判断力。
不过话说回来,这个「压缩」的速度可能比当年数码相机的冲击快得多。毕竟软件的分发成本接近于零,而数码相机好歹还有个硬件普及的过程。
最后
读完这篇文章,我最深的感触其实不是关于设计工具本身,而是关于 AI 工具的交互范式。
我们正处在一个「prompt 即一切」的时代,似乎所有的 AI 产品都在比拼谁的 prompt 更智能、谁的模型更强大。但很少有人退一步想:prompt 本身是不是就是一种反模式?
把人类丰富的直觉和创意压缩成一段文字描述,再喂给一个黑盒模型——这个过程丢掉了多少信息?牺牲了多少效率?扼杀了多少灵感?
也许下一个真正革命性的 AI 设计工具,不是模型更强的那个,而是率先干掉 prompt 的那个。
不多说了,我得回去调我的 PPT 配色了——用鼠标拖的那种 [doge]。
原文:You can’t describe your way to great design — Adobe Design