别再把 AI 当工具了:YC 说的「自我进化公司」到底是什么

起因:一篇公众号让我焦虑了

最近刷到刘小排的一篇文章,他整理了两个 YC 创业课程的学习笔记:Diana Hu 讲的《How To Build A Company With AI From The Ground Up》和 Tom Blomfield 讲的《How to Build a Self-Improving Company with AI》。

说实话,我一开始是抱着”又来了,又是 AI 改变世界”的心态点进去的。结果越看越坐不住——不是那种”好厉害”的坐不住,而是”完了,我是不是已经落后了”的坐不住。

私以为这两场分享合在一起,传递的核心信念只有一句话:

Not Productivity, rather Capability.

翻译成大白话就是:别只惦记着”用 AI 提效 20%”了,真正的命题是”一个人加一组 Agent,能不能拿到过去一个团队的能力”。

Copilot 心智模型的毒性

这一年多来,我身边(包括我自己)对 AI 最常见的用法就是 Copilot 模式:给工程师一个代码助手,让写代码快 20%;给客服一个智能回复,让响应快一点。这些当然有价值,但 Diana 的比喻一针见血——这相当于你只看到蒸汽机能让马车跑快一点,却没看到铁路要来了。

我在上一篇博客里聊 Agent 经济系统的时候,其实隐约感觉到了这层意思。但刘小排整理的这个框架把这件事说得更狠:

国内很多人(包括我)脑子里的隐含假设是”我比 AI 厉害,AI 就是来帮我打杂的”。而硅谷这帮人的假设是”AI 在很多能力上远比我厉害,我不能因为自己的笨拙而影响它的发挥”。

哪个假设更对?不知道。但哪个假设更有建设性?我觉得很明显是后者。

公司要变成 AI 可读的对象

Diana 用了一个词叫 queryable company,Tom 用了另一个词叫 legible to AI。两个意思差不多:公司必须对 AI 可查询、可理解、可调用。

这个要求听起来很简单,实际操作起来非常残酷。想想我们日常工作中的信息流:多少 know-how 只存在某个同事脑子里?多少决策只发生在一次没有纪要的会议中?多少客户反馈只停留在某个人的微信聊天里?

Tom 说了一句我特别认同的话:

如果没有被记录,它对你的 intelligence 来说就没有发生。

联想到我自己用 QoderWork 的经验——我给它的 context 越多,它就越像一个真正了解我工作的同事;我给它的 context 越少,它就只是一个通用的问答机器。公司层面也是一样的道理,只不过从”个人 AI 助手”放大到了”公司 AI 大脑”。

闭环才是自我进化

这里有一个控制论的概念特别精彩:open loop vs closed loop。

开环系统没有反馈。做了一个决策,执行完,结果好不好?没人系统性地测量和回溯。很多传统公司就是这样——开会拍板、执行、结束、下一个。客户流失了,销售知道一点,客服知道一点,产品知道一点,但没有一个系统把它们合起来让下一次决策变得更好。

闭环系统不一样。它持续监测输出,把结果反馈回系统,然后自动调整下一步。

Tom 描述了一个完整的 AI loop 有五层:感知层(sensor)、决策层(policy)、工具层(tool)、质量门(quality gate)、学习机制(learning mechanism)。如果这五层能跑起来,AI 就不只是”帮你干活的助手”,它变成了一个能发现问题、修复系统、让下一次表现更好的机制。

这让我想到我自己做的一些小实践——我在 QoderWork 里通过 MEMORY.md 和 Skills 沉淀经验,下次遇到类似问题它就不会再犯同样的错。这本质上就是一个小型闭环。只不过 YC 讲的是把这个思路推到极致、推到公司级别。

Holy Shit Moment

Tom 分享里最让我震撼的一段:YC 内部有一个 Agent 能查询内部数据库,上面又放了一个 monitoring agent,监控所有查询的成功/失败。失败以后,这个 monitor 会追问——缺工具?skills 文件要更新?数据库需要新 view?

然后关键来了:系统会在夜里自己写代码,提交 merge request,让另一个 Agent review,合并、部署。第二天员工再问同一个问题,它就能成功了。

Tom 说这是他的 holy shit moment。我深以为然。

因为这时候 AI 不只是让人更强——AI 在让系统本身更强。公司在创始人睡觉时变好了。这不是”自动化”(自动化是人定义规则、机器执行规则),这是真正的”自我进化”(机器执行任务、发现不足、改进下一次执行)。

Context 比 Software 更值钱

Tom 还有一个观点我觉得容易被低估:软件是一次性的,context 才值钱。

现代 coding agent 已经强到可以 one-shot 很多内部软件了。今天你为一场活动生成一个内部工具,用完可以扔。两个月后模型更强,你把原始指令和上下文再喂进去,重新生成一版更好的。

所以公司真正的资产不是代码库(虽然很多公司还在用代码行数衡量工程师产出,叹气),而是业务知识、数据、skills 和判断原则。

Business context and skills are valuable. Software on top is ephemeral.

这句话放在 Agent 时代特别有共鸣。我做 Skill 管理、做 MEMORY.md、做 Obsidian 知识库,其实就是在干这件事——沉淀 context,让 AI 能在上面不断重新生成更好的输出。代码可以扔,但 context 不能丢。

Burn Tokens, Not Headcount

Tom 有一句话适合贴墙上:

Burn tokens, not headcount.

YC 观察到的趋势是,最近这些公司到 Demo Day 时,每个员工对应的收入比 18 个月前高了大约 5 倍。公司越来越不受”人头”限制,而是受”智能调用量”限制。

这个我有切身体会——每个月 API 账单看着有点肉疼,但如果它能替代的是更贵、更慢、更臃肿的人力结构,那其实是极其划算的。

当然 Tom 也提醒,粗暴统计每个人用了多少 token 很容易被游戏化。但方向是对的——在这个阶段,如果一个人完全不使用 token,可能不是节俭,而是还没进入新范式。

我的一点思考

说回自己。读完这篇整理,我有三个比较强的感受:

第一,我过去确实在用 Copilot 心智模型。让 AI 帮我写代码快一点、帮我整理文档快一点。但我很少问自己:有哪些事是过去我根本做不了的,但现在一个人加 Agent 可以做了?这个问题的答案才是真正的能力跃迁。

第二,”让公司对 AI 可读”这件事,对个人工作者同样适用。你的工作方法、决策原则、领域知识,如果只存在你脑子里,AI 就帮不了你太多。写下来、结构化、让 AI 能查询——这才是 context 沉淀。

第三,闭环思维。我做事往往是开环的——做了、完了、下一件。但如果能把每次的结果反馈回来、让系统(或者说 AI 辅助的个人系统)自动变好,那长期积累下来的差距会非常可怕。

最后

一句话总结:AI 不是旧公司的一台新发动机,AI 是新公司的操作系统。

如果这句话成立,那问题就不是”怎么让效率提高 20%”,而是——这套机器本身要不要重新设计。

对创业者来说,这是一个窗口期。对像我这样的个体来说,这也是一个窗口期——在大多数人还把 AI 当打杂工具的时候,把自己的工作方式改造成”对 AI 可读、可调用、可自我改进”的系统。

嗯,不多说了,滚去给我的 Skills 库加几个 closed loop 去了。


原始视频链接:

The Why·Liam·Blog by WhyLiam is licensed under a Creative Commons BY-NC-ND 4.0 International License.

WhyLiam创作并维护的Why·Liam·Blog采用创作共用保留署名-非商业-禁止演绎4.0国际许可证

本文首发于Why·Liam·Blog (https://blog.naaln.com),版权所有,侵权必究。

本文永久链接:https://blog.naaln.com/2026/05/self-improving-company-with-ai/