马斯克的星舰完成了第十次试飞,nano-babana 的 AI 模型迎来了史无前例的更新。科技的车轮滚滚向前,每一次实验、每一次迭代,都在悄然重塑我们的世界。或许此刻你正在阅读这段文字,另一端的地球上,已经有人见证了新的突破。世界从未像今天这样充满未知与可能,而我们所能做的,或许就是时刻保持好奇,去理解这些巨变背后的逻辑与意义。
「没有秘密,只有纯粹的执行速度」 在开源盛行、模型快速迭代的背景下,传统的技术壁垒正变得脆弱。Manus 的成功证明,To C 产品最大的护城河在于「纯粹的执行速度」。尽管 Perplexity、Cursor、Monica 等应用没有自研大模型,但它们凭借快速迭代和极致的用户体验,依然获得了巨大的用户量。这一顿悟表明,与其空谈「壁垒」,不如专注于将用户体验做到极致,通过持续的产品改进和口碑积累,构筑真正的竞争优势。
「质疑汤姆猫,成为汤姆猫,超越汤姆猫」 这一顿悟的核心思想是「积极行动」。过去,很多 AI 小应用因被认为是「套壳产品」而遭批评。但「套壳」并非贬义,它其实是利用最新技术能力的产品力体现。关键在于放下对完美「终局产品」的执念,像「汤姆猫」一样,先积极行动起来,在 AI 浪潮中不断学习和迭代。只有放下执念,专注于理解和抓住当下,才能在快速变化的技术浪潮中找到真正的机会。
「未来已来,只是尚未均匀分布」 「产品蝗虫」这类从业者,通过率先体验前沿产品,具备提前感知未来的价值。通过深度体验 Devin,人们预见了 AI Agent 的「模糊模样」:像一个聪明员工那样展示思考过程、制定计划和自我校验。基于此,人们大胆地将 2025 年称为「Agent 元年」,并很快得到验证。这一顿悟强调,积极行动和抢先体验能让人提前看到未来的可能性,并更有可能参与创造未来。
「AI Agent 带来的变化和机会,仍然被低估了」 通过对大量 AI Agent 产品的评测,人们普遍感到 Agent 所带来的变革被低估。以 Lovart.ai 为例,它不仅能生成 logo,还能自主思考并给出包括 App UI、广告牌在内的整套 VI 设计,甚至创造出富有创意的广告语。这标志着 AI 能力已经从简单的推理,跃升到了调用工具完成复杂任务的 L3 阶段。这一顿悟揭示了 Agent 的巨大商业潜力和发展空间。
「我们总是高估未来两年的变化,低估未来 10 年的变革。」 引用比尔·盖茨的这句名言,人们反思在面对 AI 变革时可能犯的错误。马克·扎克伯格关于「终极商业 Agent」的设想,即 AI 自动完成所有广告投放,可能不会在短期内完全实现,但对广告行业乃至整个商业世界的颠覆是确定性的。人们常常因对短期变革的过度反应,而忽视了其在未来十年带来的更深层次、更全面的重塑。
「美是一种生产力」 随着 AI 编程工具的成熟,产品构建变得越来越简单,这使得优秀的设计和审美变得前所未有的重要。设计师具备共情和独特性等成为优秀创业者的关键能力。通过 AI 工具赋能,设计师可以从头到尾独立完成一个完整的产品,例如「日落岛」App。这一顿悟强调,AI 为设计师群体提供了巨大的效率杠杆,让他们能够将「美」转化为实际的生产力。
「创造爱的瞬间」 AI 除了提高效率,也能为人类提供情感价值。「独响」App 的「AI 陪你睡觉」功能每天有一万多人使用,这表明 AI 能够很好地满足人们对陪伴和情感互动的需求。一位 AI 宠物创始人的使命「创造爱的瞬间」,尤其令人动容。这一顿悟揭示了 AI 的另一个重要维度:它不仅是生产力的工具,更是情感连接的载体。当效率被无限提高后,AI 可以帮助我们回归人性的核心需求。
回顾之前写的 newsletter,大多数内容都是我一点点打出来的,带着自己的思考和选择。后来虽然有时偷懒,但分享的仍是我认为有价值或启发的东西。进入 AI 时代后,我逐渐依赖它去搜集与总结最新资讯,结果内容的「价值感」越来越淡。再回头看,很多推荐其实缺少自己的立场与判断,更多是杂乱的信息。这感觉,像极了浪浪山里那个忙碌的小猪妖。
本期newsletter聚焦AI领域的「逐鹿之战」,OpenAI、Anthropic与Google同台竞技,GPT-5、Claude Opus 4.1与Gemini 2.5 Deep Think各展所长。从全能博士生到编码工程师,再到未来主义的并行思考者,三大模型的差异化定位正重塑AI生态。本文深入解析它们的技术亮点、应用场景与市场策略,探讨多模型协同的未来趋势。
最近的 AI 圈子,OpenAI、Anthropic 和 Google 几乎在同一时间亮出了各自的王牌。单一的「最佳模型」概念正在被打破,取而代之的是一个更加多元、更加专业的生态系统。企业和开发者不再只是追求原始的基准分数,他们开始更注重模型的实际效用、成本效益以及在特定工作流中的适应性。
未来,我们很可能会看到一种多模型策略:用 Claude Opus 来处理复杂的编码任务,用 GPT-5 来进行快速原型设计,再用 Gemini 2.5 Deep Think 来攻克某个科学难题。这种局面无疑将加速 AI 技术的普及和创新,同时也对我们如何管理和编排这些复杂的 AI 工具提出了更高的要求。
AI 世界正在以惊人的速度发展,而每一次延迟和每一次突破,都在悄然塑造未来格局。本期 AI 行业周报为你梳理 GPT-5 的延迟发布背后的战略考量、ChatGPT 对认知的影响、智谱 AI 带来的开源变革、Manus AI 引领的智能体革新,以及微软 Edge Copilot 如何重塑浏览体验,最后深入探讨 AI 产品经理在巨变时代的角色演进。
OpenAI 将 GPT-5 的发布时间推迟至 8 月底或之后,引发行业内广泛关注。许多声音将其视为一次战略性转向,而非技术失误。此次延迟凸显 AI 企业对安全性、可靠性和用户信任的重视。
本期 Newsletter 聚焦于 Agent AI 在生产力与安全领域的突破性进展。从 OpenAI 的 ChatGPT Agent 到 Walmart 的 Super Agents,再到 Google 的 Big Sleep 主动防御系统,展示 agent 如何重塑企业服务与用户交互方式,并在真实攻击中实现主动防护。
OpenAI 在 7 月 17 日发布 ChatGPT Agent,把 Operator 与 Deep Research 融为一体,让 ChatGPT 可以通过虚拟浏览器在 Gmail、Google Calendar、网页等环境中自主完成多步任务。与此同时,Walmart 正整合旗下数十个 AI 工具,推出面向客户、员工、供应商与开发者的四大 Super Agents(如 Sparky),统一用户与后端的交互方式。更引人注目的是 Google 的 Big Sleep agent:项目首次在实际攻击到来前识别并中断了 SQLite 零日漏洞(CVE‑2025‑6965),展示 agent 在网络安全中的主动防御能力。总的来说,这些变化彰显 agent AI 正在成为企业实践与安全防护的重要执行者。
OpenAI 正式推出 ChatGPT Agent,将之前的 Operator 和 Deep Research 合二为一,允许 ChatGPT 在虚拟浏览器中自主完成复杂任务:填写表单、编辑表格、浏览网页、处理邮件,与 Gmail、GitHub 等应用集成,用户仍保持全程控制权。该 Agent 已面向 Plus、Pro 与 Team 用户开放 (TechCrunch, OpenAI Help Center)。 我认为,这是生产力工具走向执行平台的关键一步——ChatGPT 不再只是提示生成器,而能真正「做」事情。