光靠嘴皮子，搞不出好设计

发表于 2026-06-14 更新于 2026-06-15 分类于 Product & Intelligence Waline：

从 Adobe 设计团队的视角出发，探讨 AI 设计工具被文本提示框住的困境——创作者的直觉和手感不该被压缩成一段 prompt，下一代工具的革命性在于让 AI 成为环境级助手而非命令行。

最近刷到 Adobe 设计团队的一篇博文，标题很直接——“You Can’t Describe Your Way to Great Design”。读完之后颇有感触，私以为这篇文章戳中了当下 AI 设计工具的一个核心矛盾，而且这个矛盾不仅仅存在于设计领域，它其实映射了整个 AI 工具生态的一个深层问题。今天就来聊聊这个话题。

从「打字员」说起

不知道大家有没有这样的体验：用 Midjourney 或者 DALL-E 生成一张图，第一版出来之后觉得「嗯，差点意思」，于是你开始改 prompt——加个 “warm lighting”、去掉 “too saturated”、换成 “slightly desaturated mood”…来回改个五六版，半小时过去了，最终效果嘛，姑且算是能用。

这个过程的本质是什么？是你在用一个文本输入框，去描述一个本该由直觉、手感、和上百次微调才能逼近的视觉目标。

Adobe 那篇文章里有句话说得特别到位：

That’s not a creative tool. That’s a command line with better marketing.

翻译过来就是：这哪是什么创意工具，这就是一个包装得更好看的命令行。

私以为这个比喻精准得令人发指。你想想，终端里面敲命令也是这个套路——输入指令、等待执行、查看结果、不满意再改参数。区别只是 Midjourney 给你配了个好看的 UI 而已。

两种「不够好」

文章把当前的 AI 设计工具分成了两个阵营，我觉得这个分类蛮值得展开说说：

第一类：安全但受限。 诸如 Canva 的 AI 功能、各种模板化工具，生成的东西可编辑、可控，但出来的效果嘛…怎么说呢，就像是公司年会 PPT 的既视感——不出错，但也不出彩。适合做个直播封面、搞个活动海报，真正需要「感觉」的设计？别想了。

第二类：惊艳但锁死。 Midjourney、DALL-E 这类工具，能生成令人窒息的氛围感大片，但一旦生成完毕，它就是一张死图。你想微调一下亮度？抱歉，重新生成吧。想把左边的元素往右挪一点？对不起，重新生成吧。想换一种蓝？你猜——重新生成。

这就像什么呢？就像你去餐厅点了一份牛排，上来之后觉得熟了一点，你跟厨师说「下次五分熟」，他端走了，重新给你煎了一份。可你其实只是想要再煎 30 秒而已，但在这个流程里，「再煎 30 秒」这个操作根本不存在。

	安全型工具	惊艳型工具
代表	Canva AI、模板化工具	Midjourney、DALL-E
可控性	高，可编辑	低，生成即锁死
创意上限	低，适合基础需求	高，但无法精调
适用场景	电商图、活动海报	概念图、灵感探索
核心问题	天花板太低	迭代成本太高

真正的创作，是「手感」驱动的

文章里有一个观点我觉得特别精彩，也是很多做 AI 工具的人容易忽略的：好的设计不是「描述」出来的，是「摸」出来的。

一个视觉总监在调图的时候，他做的事情可能是：把亮度拉低一点看看、去一点饱和度、加个暗角、再把对比度往回调两格…这些操作每一个都很小，但它们是连续的、实时的、基于直觉反馈的。他可能花 30 秒就完成了一轮尝试，然后说「对，就是这个感觉」。

但你让他把这些操作翻译成一个 prompt？

“Make it slightly darker, desaturated, with a subtle vignette, but not too moody, maybe 10% less contrast…”

且不说这个描述有多别扭，光是在 prompt 和结果之间来回等待的时间，就足以把创作者的直觉节奏（rhythm）打碎了。文章里的原话是：

The move must happen in a heartbeat, or it won’t happen at all.

一言以蔽之：如果操作不能在心跳间完成，那这个操作就不会发生。

这让我想到了一个类比。你用过 Excel 吧？想象一下，如果 Excel 不是让你直接在单元格里输入公式、拖拽填充、实时看到结果，而是让你在一个对话框里描述「我想要在 A 列和 B 列之间做一个 VLOOKUP，然后把结果格式化为百分比」…这效率直接打回石器时代。

设计工具也是一样的道理。手和眼之间的反馈循环（feedback loop）一旦被文字输入打断，创作的流畅感就断了，而断掉的不只是效率，还有灵感。

那些「野路子」工作室

文章中提到的一个现象也很有意思。一些前瞻性的设计工作室已经不满足于用标准界面了，他们在搞什么？搭 ComfyUI 的节点流水线。

如果你是做 AI 绘图的，对 ComfyUI 应该不陌生。它本质上是一个可视化的节点编排工具，让你把 Stable Diffusion 的各种操作拆解成节点，然后用线连起来，搞出一套自定义的 pipeline。这些工作室用它来做风格迁移、重新打光、局部重绘…效果的确比纯 prompt 好太多。

但问题来了——这套东西太脆了。节点之间的连线稍有变动就可能全盘崩溃，而且需要专门招技术人员来维护。一个设计工作室，最后搞得像个小型研发团队一样，这合理吗？

说白了，这是在「正确的方向上」走了一条「过于 DIY」的路。方向对了，但代价太高。

AI 应该是什么角色？

文章提出的理想形态是这样的：AI 不应该是一个等你下命令的工具，而应该是一个环境级的助手（ambient assistant）。什么意思呢？

它应该能预判你要做什么。你把鼠标悬停在某个区域，它就准备好了几种可能的调整方案。你拖了一下亮度滑块，它不是机械地执行「亮度 +5」，而是理解你的意图，顺手把对比度和色温也微调了，因为它猜到你想要的是「更温暖的午后氛围」而不是「单纯调亮」。

这让我想到了一个概念——在软件工程领域，最好的 IDE 从来不是那个功能最全的，而是那个「最懂你」的。IntelliJ 之所以能打败 Eclipse，不是因为它的功能多了多少，而是因为它能在你敲下第一个字母的时候就猜到你想要什么，能在你犯错的瞬间给出修复建议。这种「润物细无声」的辅助，才是真正提升效率的方式。

设计领域的 AI 工具也应当如此。它不该坐在那里等你输入 prompt，它应该在你创作的每一个瞬间都在「陪跑」。

行业压缩：似曾相识的故事

文章最后提到了一个历史类比，私以为非常值得咀嚼。

当年数码相机和手机摄像头普及之后，发生了什么？不是所有摄影师都失业了，而是中间层被压缩了。那些拍证件照、拍产品图、拍活动花絮的中端商业摄影师，日子越来越难过。但顶级的时尚摄影师、艺术摄影师？他们的价值反而更高了，因为「品味」和「审美」这些东西，是器材替代不了的。

AI 设计工具正在复制这个剧本。

底层的需求——做个 logo、出个 Banner、搞个社交媒体配图——正在被 Canva 和 AI 生成器快速吞掉。中层的设计师——那些能把甲方的需求翻译成好看的视觉方案、但还谈不上「大师」的——正在被两面夹击。而顶层的创意总监、视觉艺术家，他们的核心价值恰恰是 AI 最难替代的东西：品味、直觉、和那「一百次微小实验」的判断力。

不过话说回来，这个「压缩」的速度可能比当年数码相机的冲击快得多。毕竟软件的分发成本接近于零，而数码相机好歹还有个硬件普及的过程。

最后

读完这篇文章，我最深的感触其实不是关于设计工具本身，而是关于 AI 工具的交互范式。

我们正处在一个「prompt 即一切」的时代，似乎所有的 AI 产品都在比拼谁的 prompt 更智能、谁的模型更强大。但很少有人退一步想：prompt 本身是不是就是一种反模式？

把人类丰富的直觉和创意压缩成一段文字描述，再喂给一个黑盒模型——这个过程丢掉了多少信息？牺牲了多少效率？扼杀了多少灵感？

也许下一个真正革命性的 AI 设计工具，不是模型更强的那个，而是率先干掉 prompt 的那个。

不多说了，我得回去调我的 PPT 配色了——用鼠标拖的那种 [doge]。

原文：You can’t describe your way to great design — Adobe Design