Next After ChatGPT

13 家海外生成式 AI 独角兽及其估值

生产式AI独角兽

生成式 AI 独角兽 [^1]

估值(美元) 融资披露时间 介绍
OpenAI 290 亿 2023 年 4 月 28 日 大模型/聊天机器人
Hugging Face 45 亿 2023 年 8 月 26 日 社区
Anthropic 44 亿 2023 年 3 月 9 日 大模型/聊天机器人
Cohere 20 亿 2023 年 5 月 2 日 大模型/聊天机器人
Lightricks 18 亿 2021 年 9 月 20 日 图像处理
Runway 15 亿 2023 年 5 月 4 日 视频编辑
Jasper 15 亿 2022 年 10 月 18 日 写作、营销
Replit 12 亿 2023 年 4 月 25 日 代码生成
Inflection 12 亿 2022 年 5 月 13 日 大模型/聊天机器人
AdeptAI 10 亿 2023 年 3 月 14 日 大模型/智能助手
Character.ai 10 亿 2023 年 3 月 23 日 虚拟角色
Stability.ai 10 亿 2022 年 10 月 17 日 大模型/文生图
Glean 10 亿 2023 年 5 月 18 日 企业知识管理

AI 公司的基础模型

AI 公司的基础模型

Adept AI

AdeptAI

Adept AI 是一家由前 OpenAI 工程副总裁 David Luan 创立的初创公司。它把大语言模型的能力用在企业应用软件上,在学习人类的操作习惯后,具备了直接操作应用的能力,它能够根据人类的指示直接作用于浏览器,或者 ERP 等软件系统,自动完成一系列操作。

发展

Adept 团队

David Luan 6 岁从中国随家人搬到美国。原本,David Luan 的兴趣方向是机器人。从高中起他就尝试独立开发智能机器人的控制系统,在耶鲁就读期间,他曾休学两年去创立机器人应用商店项目,后来他专注研究深度学习技术,创立了人工智能公司 Dextro,主要业务对视频和场景进行自动分类和分割,后来被警用安全上市公司 Axon 收购。

后来 David Luan 开始继续在深度学习技术上深耕,他在 2017 年加入 OpenAI,深度参与了 GPT-2 和 GPT-3 的开发,2019 年他加入了谷歌大模型研究部门担任技术主管。

2021 年底,David Luan 和 Transformer 架构的提出者 Ashish Vaswani、Niki Parmar 一起,创办了一家叫 Adept AI,目标是创造让人和计算机能够协同工作的通用人工智能

Attention Is All You Need

2022 年 4 月,Adept AI 获得了 6500 万美元的 A 轮融资。投资机构包括风险投资基金 Saam Motamedi、LinkedIn 联合创始人 Reid Hoffman、特斯拉 Autopilot 负责人 Andrej Karpathy,Skype 早期开发者 Jaan Tallinn、以及斯坦福大学计算机科学家、Lattice Data 联合创始人 Chris Ré 等。

2023 年 3 月,Adept AI 宣布 B 轮融资中筹集了 3.5 亿美元。该轮融资由 General Catalyst 和 Spark Capital 主导,其他参与者还包括 Greylock、Atlassian Ventures、微软、英伟达、Workday Ventures、Caterina Fake、Frontiers Capital、PSP Growth、SV Angel 等。根据《福布斯》的报道,本轮融资后 Adept AI 的估值至少为 10 亿美元。

主要场景

简单来说,Adept AI 的目标是基于生成式 AI 来建立一个全新的操作系统或者说是平台,彻底改变过去人们使用应用程序或网页来进行软件操作的流程,让用户可以通过使用语音或文字来下指令,由人工智能理解后来帮助完成各种操作和任务。目前,该产品主要由 Adept AI 自研的大模型 Action Transformer (ACT-1) 来实现。

在 Adept AI 给出的示例中,产品是以桌面对话框的形式存在。可以在电脑上随时调用它,用户只需在文本框中输入命令,ACT-1 就会一步一步地自动完成所有操作。

比如,你想让它帮你找到一个位于休斯顿、适合 4 口人、总价在 60 万美元以内的房子,Adept 能迅速理解并抓取关键信息然后开始执行操作。

Adept

其他列子:

Google Sheets

  • 为上一个季度创建损益表
  • 更新 2022 年的收入总和
  • 添加一个新的列,并显示平均花费

Salesforce

  • 将 Andy 录入到销售机会系统
  • 添加来自 Acme Co 的 Emma Jacobs 作为新联系人
  • 设置一个提醒,明天早上给 Sho Ito 发送电子邮件

Redfin

  • 找一处价格低于 60 万美元的休斯顿房产

Craigslist

  • 找一台价格低于 1,000 美元的冰箱

ACT-1

AI 模型最近时间层出不穷。其中不同类型的 Transformer 模型,在不同领域都有及其重要的贡献。

模型类型
语言模型 GPT,PaLM,Chinchila
编码 Codex,AlphaCode
图像生成 DALL-E,Imagen

除了上述领域外,Luan 开发了新的一个领域:在互联网场景下执行任务,并发布了新模型称为Action Transformer(ACT-1)。(他们说将很快发布论文)

这个模型令人感兴趣的点在于:

  • 它能够在电脑面前使用任意一个软件,API 工具等,用来辅助需要在电脑前完成的工作
  • 需要利用到自然语言推断,用来告诉模型我们到底需要做什么

自然语言的介入方式将会极大的改变人们在电脑前的工作,他们给出了未来的畅想:[^2]

  • 未来与电脑的互动将会更多的使用自然语言,而不是使用软件 GUI 进行操作。相当于我们只要输入命令给它,它会自己自动执行任务
  • 初学者不需要培训,也会是一个熟练的使用者。任何人只要使用自然语言,都能够表达自己的想法,而不需要特定的专业知识。软件会变得更加强大,而不会仅仅局限于一个下拉菜单的长度。
  • 以后软件的文档和手册,不是给用户看的,而是直接让模型进行学习。
  • 让 AI 突破更多的领域,会使得 AI 在未来更像是我们的工作伙伴。在可以遇见的未来,AI 会在设计,工程等领域辅助人们实现更加复杂的功能。

Next After ChatGPT

人工智能最雄心勃勃的目标之一是构建可以做人类所能做的一切的系统。GPT-3 可以书写,Midjourney 可以绘画,但两者都不能直接与世界互动。

OpenAI 的视频预训练模型(VPT),它通过观看人类游戏来学习玩 Minecraft —— 也就是在某种程度上模仿人类的行为。但是,到目前为止,像 VPT 这样的系统并不多。

GPT-3 是在 有损压缩信息,而 VPT 也只在修改互联网内状态 —— 但同样也无法与现实世界发生联动。[^3]

而今天讨论的主角 —— Adept AI 希望可以充当人类和数字世界之间的自然翻译。

ACT-1 厉害的地方是在于,它可以执行我们不知道该怎么做的动作。要使其发挥作用,我们只需要知道如何与 ACT-1 沟通以及我们想要的结果。如果 ACT-1 运行良好,我们就不必学习使用 Excel,Photoshop 或 Salesforce。我们只是将工作委托给 ACT-1,并专注于更具认知挑战性的问题。

但是新的交互模型必定带来新的挑战。

承诺的可靠性

像 GPT-3 这样基于 Transformer 模型的主要局限性之一是它们太不可靠,无法用于高风险环境。原因是这些模型在互联网数据上进行训练并优化先前的 token/action。这意味着他们缺乏常识、或对世界运作方式的深刻理解。如果用户发出了他们不知道如何完成的请求怎么办?用户会盲目地相信人工智能系统正在做正确的行动。

如果用户意识到人工智能的工作原理并了解其风险,决定不盲目信任系统。但是,即使在这种情况下,他们也没有办法评估 ACT-1 是否做了正确的事情。当我们向 ChatGPT 询问我们不知道答案的事情时,也会发生同样的情况。在某些情况下,我们可以简单地自己检查它,但在其他情况下,我们不能。

想象一个场景,你想要签署一份协议,在指令发出之前,你是不是会全程盯着 Adept 的操作,而中间的不信任感会严重影响产品的体验。

如果用户的不信任足够强烈,可能会导致他们不使用该系统。

在我们能够构建我们可以信任的人工智能之前,像 Adept 这样系统的承诺就是承诺。如果它不能可靠地工作,Adept 只是一个非常昂贵的工具,只能完成我们也可以做的任务——而且很多时候我们不得不重做它做错的事情。

Prompte 歧义性

Prompte 是与计算机交流的最自然方式,它也不是与生俱来的能力。这是一项需要练习才能掌握的技能。这种话语模式——相当于我们在和孩子说话时如何修改我们的语气、风格和词汇,或者政客在与我们交谈时使用修辞的方式。Prompte 是以特定形式针对特定目标的自然语言通信。

除了不同的模型之前的理解差异之外(比如 GPT-3,ACT-1 在语言认知结构上一定会存在差异),它有一个重要的缺点:人类语言固有的模糊性与缺乏上下文相结合。

如果编程语言,就没有解释的余地。语法严格而清晰。但是 prompte 存在于自然语言领域,它们失去了传统代码的刚性和无歧义性。

同时,人类的上下文不会仅限与语言,对于情感、肢体、直觉的判断共同构建了事件的上下文。这意味着当存在歧义时,ACT-1 将不得不要么猜测,要么停在那里而不完成任务。


[^1]: 熊莉. & 张伦可. (2023, June 9).人工智能专题报告(2):大模型突破技术奇点,海外应用百花齐放. https://pdf.dfcfw.com/pdf/H3_AP202306121590850016_1.pdf
[^2]: Cuofano, G. (2023, July 6). What Is Adept AI?. FourWeekMBA. https://fourweekmba.com/adept-ai/
[^3]: Romero, A. (2022, September 20). ACT-1: How Adept Is Building the Future of AI with Action Transformers. Substack. https://thealgorithmicbridge.substack.com/p/act-1-how-adept-is-building-the-future

The Why·Liam·Blog by WhyLiam is licensed under a Creative Commons BY-NC-ND 4.0 International License.

WhyLiam创作并维护的Why·Liam·Blog采用创作共用保留署名-非商业-禁止演绎4.0国际许可证

本文首发于Why·Liam·Blog (https://blog.naaln.com),版权所有,侵权必究。

本文永久链接:https://blog.naaln.com/2023/08/next-ChatGPT/