什么是 AGI 产品经理
经典的三问应该是:什么是 AGI、什么是 AGI 产品经理?为什么要学习成为 AGI 产品经理?如何成为 AGI 初代产品经理?
这些问题当然有价值,但既然大模型的一切都未知——绿洲资本张津剑有一句很漂亮的话,「新世界没有地图,只有发令枪」——我们也可以不按常理出牌。
本文主要话题:
- 为什么大语言模型如火如荼的今天, Killer App 还没跑出来?
- 大模型时代的产品经理,应该首先理解大模型的产业链和技术原理
- 大模型产品经理如何学习技术?方法、材料和心态
- 大模型时代的产品设计革命
注:
1、本文写作时间为 9 月初,作为阶段性思考的记录,部分观点后续再更新;
一、为什么大语言模型如火如荼的今天, Killer App 还没跑出来?
先聊另一个话题:为什么大语言模型(LLM)如火如荼的今天,大模型 Killer App 还没跑出来?
任何一个稍微了解互联网和移动互联网时代的人都应该不难想到,这至少是一个价值十亿美金的天问。
首先我们应该警惕:真的会有吗?很多人怀疑 LLM 是布满泡沫的一时风口,认为 C 端没有需求。这当然是一个有价值的怀疑,也和历史上所有群体狂热与科技泡沫一样, 是一个无法过多争辩的信仰问题,值得另起一文。
硅谷风投机构 a16z 在今年年初写道:
许多热门的科技趋势在市场迎头赶上之前就被过度炒作。但生成式 AI 的繁荣伴随着真实市场的实质性增长,以及真实公司的实质性发展。类似 Stable Diffusion 和 ChatGPT 这样的模型正在创造用户增长的新记录,而且有几个应用在上线不到一年的时间里就实现了 1 亿美元的年化收入。测试也发现大模型在某些任务上的表现比人类好了几个数量级。所以,有足够的早期数据表明正在发生大规模的变革。我们不知道的是,现在已经成为关键问题的是:生成式 AI 将在何处发挥价值?
Kevin Kelly 说:趋势是可以预测的,但是具体在这个趋势中会发生什么、出现什么产品,是没有办法预测的。
总之,我更倾向于:最终会有 Killer App 的。
那为什么 killer app 还没跑出来?篇幅所限,简单说一下我理解的原因:
首先是技术周期:
- 模型层还在突飞猛进,中间层蓬勃发展,应用层所倚赖的条件尚不成熟;
- 算力成本(芯片)居高不下,高昂的成本抑制了对需求的满足;
- 对创业公司、新产品而言:只有一层「薄」应用的公司,因为壁垒不够强 + 模型层突飞猛进,就算跑出来,也会很快被吃掉。比如 Jasper.ai,金沙江创投主管合伙人朱啸虎曾认为,Jasper 的价值或将很快归零,根本守不住;
- 对大厂而言:监管、现阶段基础模型开发高优于应用、大厂尤其是产品经理缺少对 AI 的独到/深刻认知;
总而言之,无论是大厂还是小厂、还是创业者,大家(尤其是产品经理)还在消化底层模型的能力,一边提升认知,一边想着怎么跟业务深度融合。
当然,我个人对于这个问题,除了商业价值上的思考,还有智识或者专业上的考虑:如何探索 AGI 时代的产品?此处先按下不表,文末展开。
落到实处就是:如何首先成为 AGI 时代产品经理?AGI 产品经理第一课应该学什么?
作为一个在移动互联网尾声入门、刚刚自学入门 AGI 的产品经理来说,写下这一课,不是够胆教人,是对自己过去摸索学习的总结,万一能对其他人有启发,自然再好不过。
二、大模型时代的产品经理,应该首先理解大模型的产业链和技术原理
1、路径依赖的困境
人习惯于线性思维,总有路径依赖。沿着移动互联网产品设计的思维,很多产品经理和业务负责人面对汹涌而来的 LLM,本能反应是:
- 我应该如何将 ChatGPT 融入到当下的产品中?把大模型的能力「接进来」?
- 「调用大模型能力」做一个对话机器人?要开一个新 Tab 吗?
- 交互形式是跟 ChatGPT 一样对话吗?
- 看似很厉害但实际体验起来却很麻烦?
……
于是我们可以看到当下互联网人尤其是产品经理的焦虑:所有人都知道 ChatGPT 改变了世界,几乎所有人都相信微软 CEO Satya Nadella 说的要 Povit the Company——微软每个产品都必须用大模型为先的思路重做一遍,以及百度 CEO 李彦宏说的「所有产品都值得用大模型重做一遍」
——但怎么做?
在实际参与了部分成熟产品「结合 AI 的创新功能探索」并毫无意外受挫,以及和大量产品经理交流后,结合 LLM 学习体会,我的结论是,和过往互联网和移动互联网不同,在想象具体的产品交互之前,应该先退一步:
2、大模型时代的产品经理,应该首先理解大模型的产业链和技术原理
为什么首先需要理解大模型的产业链?为什么应该理解大模型的技术原理、而不是上来就开始想象交互的事情?
因为大模型带来的,首先是大的范式变革,然后才是具体的产品设计思路,交互体验,开发模式等等——这一切都要重新思考和探索,但首先需要理解并思考范式变革。
大模型,或者说生成式 AI,和以往互联网和移动互联网时代有什么不同?
3、大模型产业链
互联网建立在 TCP/IP 的协议之上,移动互联网有相对独立的系统层、应用层(基础架构、平台、软件),和它们不一样的是,大模型更复杂——这其中有大模型本身的原因,也有当下尚在技术周期初期的阶段性原因:
首先,我们都比较熟悉的是,大模型有模型层、中间层、应用层,而且由于大语言模型本身的复杂性(复杂算法、大算力要求、海量数据等),模型层和中间层的复杂度要远超以往。
模型层和应用层好理解,前者是大模型本身,后者是基于大模型的应用。所谓中间层,是指要将大模型融合到应用,中间所需的一系列工程能力、算法能力,以及基于此的「工具栈」——如开发工具链(如 Langchain)、模型工具链(做数据标注、向量数据库、分布式训练等)。
以下是风投机构 Antler、Sequoia Capital 和 NfX 从不同视角给出的生成式 AI 全景图,比较清晰地展示了生成式 AI 创业方向、明星公司和技术栈,可以看到,在 NfX 的框架里,「模型层」还可以细化,进一步拆分为「通用模型、垂类模型、本地模型」。
其实,「模型层、中间层、应用层」的分发,虽然复杂,但仍然只是聚焦到大模型本身。实际上,如果我们把视野扩大到整个生成式 AI,会发现 a16z 总结的技术栈更为全面。除了应用层、模型层,还有底层的基础设施,包括云平台,以及最核心的:芯片,或者说英伟达。
Cohere 的 Jay Alammar 在上述框架的基础上进一步细化,描绘了应用层玩家在这波生成式 AI 行业全景图中的位置:
这里大费周章介绍,是为了说明,虽然应用开发者实际上并不投身上述大部分工作,但在「只有发令枪,没有地图」的生成式 AI 大航海时代里,清楚自己在船队中的位置,能让你更可能发现新大陆。
4、大模型产品经理必须了解技术
既然要在 AGI 时代成事,产品经理就必须知己知彼,既要了解大语言模型的产业链,也要了解技术。
为什么产品经理要了解大语言模型的技术原理?
如上所述过去的互联网和移动互联网时代,产品经理完全可以在不懂 TCP/IP 协议、HTML、Swift 语言等技术的基础上设计产品(虽然如果不懂事瞎提需求的话,多少要被研发喷,但大体如此吧?)
但 LLM 时代不同了,由于 LLM 如此强大到几乎无所不能,以至于看起来能无差别地满足所有需求(只是看起来),结果就是,如果不理解 LLM 的技术原理、局限性,作为产品经理,你将无法提出有价值的产品洞察和解决方案:还有什么是 LLM 不会的?还有什么是我可以做的?甚至有大厂 AI 产品经理说,以后产品经理可以不写 PRD,但一定要去搞数据:给 LLM 训练的优质数据集。
这是我认为 LLM 时代的产品经理必须理解技术原理的原因。这也是微软 CTO Kevin Scott 在微软 Build 2023 上对开发者表达的意思。
当然,产品经理学习技术原理,不是为了真的和大模型博士们去搞大模型研发,而是为了更好理解 LLM,知己知彼,不求百战不败,只求一胜,为了最终开发出一个好用的大模型应用。
曾在 Google 工作了 17 年、和无数最优秀的产品经理打过交道的 Character.ai 创始人 Noam Shazeer 说:
让工程师、而不是产品经理来决定产品怎么做很重要,因为真正了解大语言模型能力的工程师才有能力确定产品的方向。大部分产品经理对大语言模型技术的能力并不足够了解,例如,他们可能会认为产品需要专注于某些垂直领域(场景),但对于大语言模型来说,只是专注某些垂直领域是完全错误的策略,因为大语言模型自身的优势就在于它的通用性。在真正将大语言模型产品化并投入使用之前,我们无法靠想象去判断它会有什么能力。
5、不了解大模型,你就是拉天线的
如果按原来移动互联网的线性思维,产品经理就只是把大模型当成黑盒,调模型 API 做产品——那不过只是从天上接电线装灯:灯亮了,你很开心,灯闪了,你不知道怎么处理,灯灭了,你两眼一抓黑,歇菜。
为什么拉电线价值有限?只需要看看年初风头一时无两的 GPT 套壳应用 Jasper 的裁员新闻就够了。
事实就是:不了解大模型,你就是个拉电线的。
但模型不是天线,是地基,盖好了,夯实了,知道哪里是承重墙哪里是排水管,才能建好上头的摩天大厦和三室两厅。
极客公园几个月前去硅谷调研就发现,相比中国「百模大战」的狂热,美国创业者们更冷静、思考也更深入:训练大模型本身的算法、算力、数据成本高昂,是巨头而非创业者的游戏,「美国现在是中间层在繁荣,已经几乎没有新的创业者要做下一个 OpenAI 了。」
其次,产品经理这个工种本身,就是「胶水」。因为现在模型层没有真正 ready,导致产品经理在实际产品研发过程中,还需要做大量连接和胶水作用,技术科普、技术理解与讨论、产品补位、PMO……这些都需要你深入了解技术原理。
顺便说一下,PM 这个岗位,有人觉得是产品经理,有人干成了项目经理(甚至最近 Airbnb 宣布取消产品经理岗位),还有人认为是 CEO——CEO 是最大的产品经理,总之,都在说一件事:冠以经理之名,其实就是要成事的,名可名非常名,叫成事经理也行。
三、别说自己不懂技术,记住你是最好的用户
上面主要说了大模型产品产品经理为什么需要懂技术——问题来了,如果你不是 LLM 相关专业背景(大概率不是),那只要稍微花时间去了解过大模型的技术原理,就自然会碰到问题:这些最聪明的博士们研究的问题、发表的论文,压根看不懂怎么办?
更关键的:不但读不懂,还很容易在 LLM 的世界里丢失了自己的认知优势、怎么办?
如何学习和理解技术?不丢掉自己?
1、别说自己不懂技术,记住你是最好的用户
怎么理解呢?
首先用户是不懂技术的,但不懂技术不是用户的原罪,而是理所当然。
产品经理当然需要理解技术、理解产品设计、理解开发……理解为了满足用户需求而需要干的所有事情——但是,这些都是手段,为了实现服务用户目标的手段。
产品经理最核心的,是理解用户需求(比如所谓 3 秒变成小白),而用户是不懂技术的。现在大部分需要用户大量学习成本、学习如何写 Prompt 的产品体验都是不合理的,应该敏锐地察觉到这种不合理,并想办法解决它。作为产品经理和资深用户,你应该学习这些技术,但不应该丢弃小白用户的心态。
补短板不应该丢了长板,这是个过于浅显易懂但实践起来非常难的道理,因为要克服的是你从小积累的刻板印象和潜意识,就像学习游泳,脑子跟上了还不够,身体还得一点点适应。
别说自己不懂技术,记住你是用户。
比如 prompt engineer 不合理,谁最先长出来,谁就是 killer app,谁就会定义 AGI 的新范式
比如技术与产品、业务的结合: 在理解 llm 技术原理的基础上,将对用户和对产品、业务的理解融合起来思考。
2、如何学习?
那应该从哪里入手,了解 LLM 技术原理、从而入门大模型产品经理呢?
大家仍然容易下意识反应:有哪些推荐的学习材料?
但其实,真正的问题从来不是缺乏学习材料,而是学习材料太多了:单单机器学习几大公众号、Founder Park,每天就完全看不过来了。
3、大模型时代的媒介素养
我一直认为大语言模型带来了真正的知识民主化时代(虽然印刷术、互联网的发明都引发了类似效果),知识都开源、都可以学到——只要你花时间。
怎么理解呢?首先,大语言模型的相关知识唾手可得:从论文,到开源社区,再到各类自媒体、新产品;从最专业最前沿,到最实操最落地,再到最通俗最科普最实际——只要你花时间,都可以了解到。
但你没时间没精力?不知道如何开始?
所以真正的问题是:LLM 时代应该如何学习?信息过载时代,时间应该花在哪里?或者更准确地说,LLM 时代的媒介素养应该是怎样的?
所谓媒介素养 Media Literacy,维基百科解释:是指在各种环境中以适合自己的目的和需求的方式取用(access)、分析(analyze)、评估(evaluate)及制造(create)媒体信息的能力。
作为一个严重信息焦虑症患者,我一直尝试在信息过载的 LLM 时代提出一些应付方法:
1)以主动提问和文字输出来倒逼输入,可能是解决信息过载和 FOMO 的最好路径。
2)信息的角度,比信息本身更重要;知识的角度,比知识本身更重要。
和大部分人一样,我也曾每天被 LLM 新闻刷屏,疲于奔命,但又感觉一叶障目、不识泰山,因为 FOMO 而看新闻,因为看新闻而更 FOMO。
直到有一天突然看到王建硕的一个观点:研究 AI 新闻不是研究 AI。从更长的时间维度看,你是否早一天或一周知道一个 AI 新闻,影响很小。王建硕建议少看新闻,直接上手研究产品、做产品。
顺着王建硕的思路,我发现也许更好的关注视角是两头抓:
一方面,关注最宏观:AI 会灭绝人类吗?人类如何和 AGI 相处?看几本最好的书——技术哲学的视角。
另一方面,关注最实际上手的:直接体验产品、直接写更好的 prompt、直接去学如何调用 api 写 app——用户视角、产品经理视角、研发视角。
中间的技术演进适当关注即可——哪个大模型又进化了、哪家创业公司又融资了——简单浏览即可,不用每天花太多时间在追踪热点新闻上,研究 AI 新闻不是研究 AI。
3)多读好内容,自然会分辨。
以饮食来比喻,胃口是有限的,坚持多吃好的,自然而然不想吃垃圾,并且最终你会发现,只吃好的,更能补足营养。
4、读最好的材料,跟最好的老师,善用工具
最好的材料,两个层次:最好的入门材料、最专业的材料。
最好的入门材料
好的开始,是成功的一半,好的入门材料:
- Learning Prompt 课程 By Jimmy Wong https://learningprompt.wiki/zh-Hans/
- Prompt Engineer,是入门 LLM 产品的必经之路。但大部分 Prompt 的教程是英文,所以英语不好首先成了很多人学习 LLM 的拦路虎。于是一直努力让更多的人用上 AI 的 Jimmy 制作了这份免费的中文 Prompt Engineering 教程,包含 ChatGPT 和 Midjourney 教程。Jimmy 是我前同事,自称「一名工具产品爱好者、产品设计师」,实则是横跨设计、产品、研发的学习高手。
- OpenAI Platform https://platform.openai.com/overview
- OpenAI 官方说明文档,可能是写得最详实、最深入浅出的一份技术说明文档。OpenAI 不但集结了最好的 LLM 研究员,还汇聚了最好的 LLM 布道师,从最基础的概念,到循序渐进的 Prompt Engineer、API 使用说明书、最佳实践,还手把手教你如何基于大语言模型开发插件、应用。
- 好的材料,以一敌百,官方下场,好上加好。比如相比市面上鱼龙混杂的 Prompt Engineer 教程,OpenAI 官方提供的六种策略明显更简单有效:
- OpenAI Cookbook https://github.com/openai/openai-cookbook
- 同样是官方推出的使用 OpenAI API 的示例和指南,包含了具体代码
- OpenAI 官方推荐的第三方资源:
- 提示指南 Prompt Engineering Guide:展示许多技术的 Prompt Engineer 指南(有中文版)https://www.promptingguide.ai/zh
- learnprompting.org:Prompt Engineer 的入门课程 https://learnprompting.org/
- Brex’s Prompt Engineering Guide:Brex 对语言模型和 Prompt Engineer 的介绍 https://github.com/brexhq/prompt-engineering
- OpenAI 烹饪手册:提高可靠性的技巧:一篇关于激发语言模型技术的回顾 https://github.com/openai/openai-cookbook/blob/main/techniques_to_improve_reliability.md
- Lil’Log 提示工程:OpenAI 研究员对提示工程文献的评述 https://lilianweng.github.io/posts/2023-03-15-prompt-engineering/
- 视频课程
- ChatGPT Prompt Engineering for Developers by 吴恩达 DeepLearning.AI:为开发者提供的关于 Prompt Engineer 的简短课程 https://www.deeplearning.ai/short-courses/chatgpt-prompt-engineering-for-developers/
- Prompt Engineering by DAIR.AI:一小时的视频,介绍各种 Prompt Engineer 技术 https://www.youtube.com/watch?v=dOxUroR57xs
最专业的材料
- 《State of GPT》,只用半个小时,有人能讲明白 GPT 的技术原理、训练过程,还教你怎么用好 GPT 吗?有,OpenAI 联合创始人 Andrej Karpath 甚至还有时间加彩蛋,实在是了解 LLM 不得不看的精彩演讲 https://www.youtube.com/watch?v=bZQun8Y4L2A
- 《Attention is All You Need》,提出 Transfomer 架构的必读论文,LLM 开山之作:https://arxiv.org/abs/1706.03762
- GPT 1-4 论文、技术报告
- GPT-1 论文《Improving Language Understanding by Generative Pre-Training》,Generative Pre-Train Model 就是 GPT 名字的由来 https://cdn.openai.com/research-covers/language-unsupervised/language_understanding_paper.pdf
- GPT-2 论文《Language Models are Unsupervised Multitask Learners》https://cdn.openai.com/better-language-models/language_models_are_unsupervised_multitask_learners.pdf
- GPT-3 论文《Language Models are Few-Shot Learners》https://arxiv.org/pdf/2005.14165.pdf
- GPT-4 技术报告《GPT-4 Technical Report》https://cdn.openai.com/papers/gpt-4.pdf
- B 站 Up 主「跟李沐学 AI」的 AI 论文精读系列视频,如果你读不懂英文 LLM 论文,那就跟着前 AWS 资深首席科学家、美国卡内基梅隆大学计算机科学博士李沐精读论文吧:
- 《GPT,GPT-2,GPT-3 论文精读》https://www.bilibili.com/video/BV1AF411b7xQ/?spm_id_from=333.788&vd_source=0a7349493c5d70149efefa88eac70de1
- 《GPT-4 论文精读》https://www.bilibili.com/video/BV1vM4y1U7b5/?spm_id_from=333.337.search-card.all.click
- 《Wolfram Alpha What is ChatGPT?》,伊利诺斯大学物理学、数学和计算机科学教授、「第一个真正实用的人工智能」搜索引擎 WolframAlpha 发明人 Stephen Wolfram ,用这本小书(其实是一篇长文)讲透了 GPT 的原理及未来,连 OpenAI CEO、ChatGPT 之父 Sam Altman 都感叹「这是我见过的对 ChatGPT 原理最佳的解释」的神作。
- 《Sparks of Artificial General Intelligence: Early experiments with GPT-4》,微软 154 页 GPT-4 研究报告,结论是 GPT-4 让人看到了 AGI 的火花 https://arxiv.org/abs/2303.12712
最好的老师
真格基金 f.chen 整理过一份 No.1 - 关于 AI 的 107 个人,61 个工具和 28 个通讯,很全,可以按需关注。
这里列一些我自己读得比较多的作者,凭记忆写,不全,且动态更新:
LLM 技术
- Andrej Karpath
- Sam Altman
- Ilya Sutskever
- Greg Brockman
- Kevin Scott
- Geoffrey Everest Hinton
- Yann LeCun
- Yoshua Bengio
- Jim Fan
- Yao Fu 符尧
- Andrew Ng 吴恩达
创投
- Paul Graham
- 陆奇
- 拾象科技 - 海外独角兽
- 张津剑
中文盗火者
- 宝玉
- 木遥
- web3 天空之城
- 王建硕
语言学家、认知科学家、科幻作家……
- 丹尼尔·卡尼曼,《思考快与慢》
- Douglas Richard Hofstadter 侯世达,《哥德尔、埃舍尔、巴赫 – 集异璧之大成》《我是个怪圈》《表象与本质》
- 特德·姜,「ChatGPT 是网络上的一个模糊的 JPEG 文件」
善用工具
工具是人的延伸,学 AI 必须用好 AI 工具,首先克服英文不好、技术不行的心理障碍,其次提高信息消费效率,主要有两类,不展开:
翻译工具:沉浸式翻译、火山翻译、Google Translator、网易有道翻译等
学习工具:ChatGPT、Claude、Perplexity 等
四、学习心态和思路
上面介绍了一些具体的学习方法、材料和工具,下面讲讲学习心态和思路。
1、要空杯心态,新世界不看旧船票
为什么新世界不能看旧船票?
为什么创业公司找成熟业务负责人的做法,大概率不会奏效?为什么在新世界寄希望于老将军们的做法,很可能碰壁?
旧世界的业务负责人/产品经理们忙于应付旧世界的问题——那是眼下杠杆率最高的事情,无可厚非——自然而然地:
他们大多没时间研究 AI,基础的认知不一定能跟上,比如最基本的几篇论文没读过、GPT 的基本技术原理不了解、模型能力没概念、模型层中间层应用层的关系不清晰、甚至最基本的 LLM 产品体验不多,不一而足。
更关键的:旧世界的经验往往是新世界的桎梏,旧世界的 Legacy ,是新世界的 Burden。绿洲资本张津剑的这句话,可谓一剑封喉,虽然他指的是美元基金。
怎么理解呢?
以产品经理举例,产品规划、设计、项目管理等能力,自然是必备的基本功,但除此之外,在旧世界(比如移动互联网)越成功,越容易带着所谓「旧世界的成功经验」去探索新世界。
「旧世界的成功经验」,或者说「成见」,叠加上面说的基础认知跟不上,自然容易在新世界搁浅。
——这甚至都无可厚非,路径依赖,人性如此。
那么,启发是什么?
2、要学会跳出自己总结的经验、教训
首先,必须要学会从亲身经历中总结经验、吸取教训。
进一步,要学会跳出自己总结的经验、教训。
重新学习 AGI 应用,保持原来移动互联网和互联网的优势,又要放下成见,重新学习 AI Native 应用应该怎么设计。
最重要的,要亲自上手体验产品
百闻不如一试,百试不如一用。要真的像移动互联网一样,变成小白用户去使用,去感受。
现在有哪些好的产品?有哪些好的体验、好的理念?有哪些不尽如人意的产品?做 case 分析
ChatGPT、Claude、Pi
Character.ai、Perplexityai、Midjourney、Poe
New Bing、Bard、Jasper……
未来有什么理想的产品体验?
Her?贾维斯?Apple Vision Pro?
五、大模型时代的产品设计哲学革命
在技术这个大前提下,交互设计是下一步。如果我们把视野放大到整个产品或技术周期,就可以很轻易总结出一个新产品的发展轨迹:
新技术萌发→技术浪潮发展/基础条件具备→新产品想法爆发→新产品设计尝试/迭代→新产品诞生新体验、吸引早期尝鲜用户→产品跨越鸿沟进入大众市场……
粗略预估,我们现在大概在新产品诞生前夜,所有人都在疯狂进行新产品设计尝试、迭代,而回顾历史,我们会发现,新的技术周期,往往带来新的设计范式的变革,比如初代苹果电脑 Macintosh 带来的图形交互界面革命,比如 iPhone 带来的移动互联网革命,颇有点「天不生乔布斯,万古长如夜」的意思。
这也是为什么在 LLM 的新技术浪潮面前,越来越多人开始谈论大模型时代的产品设计哲学,探索 AI Native 产品应该怎么做。
大模型时代的产品设计哲学
这是一个很重要、且必须在了解 LLM 技术原理的基础上才可能展开的宏大话题,我在另外一篇文章里写过,篇幅所限这里简单写下主要思考:
大模型带来的人机交互范式的转换将彻底改变产品设计思路。
因为大模型本质上带来的是人机交互范式的转变,我们将从图形用户界面 (GUI) 转向自然语言用户界面 (LUI)。
所有人都必须思考:大模型已经很强大了,还能新增哪些能力呢?用户还需要它新增哪些能力?这些能力要如何获得?
LLM时代的产品设计革命:大模型带来的人机交互范式的转换是如何影响产品设计的?
六、如何探索 AGI?
本文主要讨论如何成为 AGI 产品经理,抛砖引玉,但最后我想稍微放飞一点:当我们讨论 AGI 产品经理的时候,我们在讨论什么——如何探索 AGI。
为什么伟大不能被计划?
最近 OpenAI 的前研究员 Kenneth Stanley 和 Joel Lehman 出了一本新书,叫《为什么伟大不能被计划》,书里讲了他们从研究人工智能中得到的启发:大部分的事情需要目标和计划,但对于伟大的事情——比如探索 AGI——目标和计划可能是束缚,它们会限制你的视野。
书里介绍,算法研究里,针对某个特定的问题或目标,会有一个搜索空间——绝大部分的问题,答案往往藏在搜索空间内,但对于「伟大的」问题,答案也许在搜索空间之外。如果你过于专注在具体问题或目标上,按照计划寻找,结果可能永远找不到答案。
我的理解是:AGI 明显是伟大的事情,要有原则,有理念,有哲学,但不要有太明确的计划。
对于大模型产品经理和从业者来说,要广泛而快速地尝试,要允许犯错,允许重来,允许没有阶段性明确产出,允许模型颠覆自己,推倒重来,在新的搜索空间里,实现伟大。
AGI Killer App 的探索,是对人类美好未来的探索
最近越来越多的人问,你看好哪个方向?哪个产品?或者你有什么产品方案吗?
我当然知道大家为什么关心这个问题,很简单,Killer App 的问题,是个起码价值十亿美金的问题。
我也当然不知道怎么回答,但我似乎更关心的是,Killer App 的探索,除了商业上的价值,更重要的,其实是智识上的价值,对人类的价值。
以史为鉴,可以知兴替,我们可以停下来看看,历史上面临类似问题时,前人是怎么做的?
比如,当面对早期个人电脑的技术浪潮时,巨人们是怎么思考的?
上面提到 1984 年,乔布斯率领苹果用 Macintosh 开启了图形交互界面革命,Macintosh 集合了当时最新的交互元素,比如图形用户界面(GUI)、图示(Icon)、个人桌面(Desktop),并且用鼠标操作。
但鲜为人知的是,Macintosh 的图形界面,灵感来源于一个 1960 年代的系统,oN-Line System(NLS),它的发明者,是道格拉斯·恩格尔巴特(Douglas Engelbart)。
1968 年 12 月 9 日,现代个人电脑之父道格拉斯·恩格尔巴特在旧金山召开的计算机协会暨电气电子工程师学会(ACM/IEEE)秋季联合计算机会议上,进行了一场具有里程碑意义的计算机演示,后被人称为「所有演示之母」(The Mother of All Demos)。也有人称 1968 年 12 月 9 日为现代个人计算机(PC)诞生的日子。
现场的 90 分钟演示,恩格尔巴特介绍了一个完整的计算机软硬件系统 NLS,第一次公开展示了现代计算机单一操作系统几乎所有的基本要素:窗口,超文本,图形,高效导航和命令输入,视频会议,鼠标,文字处理,动态文件链接,版本控制和实时协作编辑器,这些我们受益至今的伟大创举,几乎都来源于恩格尔巴特的这次演示。
这次演讲产生了巨大影响,在 1970 年代早期催生了施乐帕罗奥多研究中心的类似研究项目,在 1980-1990 年代,影响了苹果麦金塔操作系统和微软 Microsoft Windows 的图形用户界面。
恩格尔巴特和他发明的鼠标
后世只知乔布斯、比尔·盖茨,鲜有人知恩格尔巴特,因为他发明鼠标和一整套个人计算机操作系统的目的,不是赚钱或制造产品,只是希望「通过计算机,让世界更美好」。
a16z、网景公司创始人马克•安德森(Marc Andreessen)这样谈及恩格尔巴特及其同事:恩格尔巴特那样的发明家最大的与众不同之处在于,他们心目中最注重的是对人类的影响,这是一种今天已不复存在的理想主义。
我当然知道,在今天言必称「脚踏实地」「活下来再说」的商业环境里,追求所谓智识的价值、对人类的影响,是天真的一厢情愿——但人类技术进步的历史,不从来都是由这些天真、固执的理想主义者们推动的吗?
参考资料:
- a16z:Who Owns the Generative AI Platform? https://a16z.com/2023/01/19/who-owns-the-generative-ai-platform/?ref=txt.cohere.com
- Cohere:AI is Eating The World https://txt.cohere.com/ai-is-eating-the-world/
- 陆奇:我的大模型世界观 https://www.bilibili.com/video/BV1mM4y147qw/?spm_id_from=333.1007.tianma.1-2-2.click&vd_source=0a7349493c5d70149efefa88eac70de1
- 微软 CTO Kevin Scott: The era of the AI Copilot | KEY02H https://www.youtube.com/watch?v=FyY0fEO5jVY&t=1459s
- 极客公园:沸腾 251 天,访谈近百位从业者,关于大模型世界的 5 个现状
- The Mother of All Demos https://en.wikipedia.org/wiki/The_Mother_of_All_Demos
- 老钱文集:硅谷传奇:现代个人电脑之父——道格拉斯•恩格尔巴特:http://lao-qian.hxwk.org/2014/12/19/%E7%A1%85%E8%B0%B7%E4%BC%A0%E5%A5%87%EF%BC%9A%E7%8E%B0%E4%BB%A3%E4%B8%AA%E4%BA%BA%E7%94%B5%E8%84%91%E4%B9%8B%E7%88%B6-%E9%81%93%E6%A0%BC%E6%8B%89%E6%96%AF%E2%80%A2%E6%81%A9%E6%A0%BC/
- 1968 “Mother of All Demos” with Doug Engelbart & Team https://www.youtube.com/watch?v=UhpTiWyVa6k
- 张无常:
- 除了ChatGPT,大模型杀手级应用还没有跑出来的原因是什么?
- 别说自己不懂技术,记住你是用户
- ChatGPT 信息爆炸导致FOMO、焦虑怎么办?
- AGI大航海时代前瞻:新世界不能看旧船票
- LLM时代的产品设计革命:大模型带来的人机交互范式的转换是如何影响产品设计的?
- 无常的大模型世界观_2023年9月
- 一个产品经理的大模型观察、反思与预测
The Why·Liam·Blog by WhyLiam is licensed under a Creative Commons BY-NC-ND 4.0 International License.
由WhyLiam创作并维护的Why·Liam·Blog采用创作共用保留署名-非商业-禁止演绎4.0国际许可证。
本文首发于Why·Liam·Blog (https://blog.naaln.com),版权所有,侵权必究。
本文永久链接:https://blog.naaln.com/2023/11/AI-pm/