「世界模型」的深刻革命
在过去短短两三年间,我们几乎所有人都被 ChatGPT 的「超能力」所震撼。我们很快就习惯了人工智能在生活和工作中带来的便利,它能编写复杂的代码,能写邮件,或者构思文案,甚至遇事不决的时候也可以找他们讨论。
大语言模型,本质上是一个前所未有的符号处理器——它由词元(Tokens)构成,智能建立在对人类语言和知识的海量统计之上。
图像生成模型,则是一个强大的视觉翻译器——它通过逐步去噪将文字转化为画面,能力建立在对「描述与视觉」对应关系的海量学习之上。
然后,就在我们以为看清楚未来模型的发展都是基于文章或像素预测的时候,Sora 出现了。
因为这不再是语言游戏。






