Why·Liam·Blog

人生若如初見

这篇内容来自「少楠」的分享,实在找不到原链接了。

这是 Marc Andreessen 在 2013 年的一篇文章,他提出了一个有趣的概念:结构化拖延。其核心思想并非对抗拖延,而是巧妙地利用拖延的时间来完成其他有价值的任务。

为了更好地实践结构化拖延,Andreessen 建议维护以下三个清单:

  • TODO:必须完成的任务(按时间排序):这是优先级最高的任务列表,需要按照截止日期或重要性进行排序。
  • 观察:需要持续跟进的事项:这个清单记录了需要长期关注和监测的事项,例如产品上线后的数据、运营活动的效果、以及个人的长期变化(健康、投资等)。这类事项往往不紧急但很重要,容易被遗忘。
  • 稍后:未来想做但不紧急的任务:这个清单用于记录一些想法和未来的计划,暂时不需要立即执行。

建议每天睡前写下第二天必须完成的三件事,并在醒来后优先处理。即使看起来任务不多,坚持完成也能带来成就感。同时,记录下当天完成的清单外事项,帮助自己了解时间的实际流向,而不是为了指责自己。

阅读全文 »

人工智能领域正经历前所未有的快速发展与变革。随着 AI 技术的不断发展,我们可以预见未来将出现更多创新应用和商业模式。AI 将不仅是一种技术工具,更将成为推动社会进步和经济增长的重要力量。在这个过程中,开放协作的生态将加速创新,而技术与伦理的平衡将成为 AI 发展的关键考量。

OpenAI 近期发布了两款突破性 AI 模型——o3 和 o4-mini,它们能通过图像进行推理,并可自主调用多种工具,被专家称为人工智能能力的一次飞跃式提升。这些推理模型是 OpenAI”o 系列 “ 的最新成员,经过训练后,它们能在响应前进行更长时间的思考,是 OpenAI 迄今为止发布的最智能、最强大的模型。
这些模型的突出特点包括:

  1. 图像思维能力:o3 和 o4-mini 能够 “ 看到 “ 图像并以此进行思考,将图像信息有效融入到自己的思维链中。用户可以上传白板笔记、草图和其他图像内容,让 AI 进行分析与讨论 [1]
  2. 自主工具调用:这些模型兼容使用 ChatGPT 内的所有工具,包括网页搜索、图像生成和使用 Python 进行数据分析等功能。它们不仅能判断何时使用工具,还能决定如何使用工具,从而提供经过深思熟虑的详细回答 [2]
  3. 性能提升:在数学竞赛、编程、指令遵循和工具调用方面,o3 和 o4-mini 取得了显著进步。o3 在 AIME 2024 数学竞赛题目中的准确率达 91.6%,在 Codeforces 编程竞赛评分中取得了 2706 的 ELO 分数,显示出在复杂数学与代码任务中的强大推理与执行能力 [3]
  4. 应用案例:在一次展示中,用户询问电池技术的新突破对电动车的潜在影响,o3 模型在经过 40 秒的推理后,不仅可以生成丰富的文字内容,还能生成相关的图像和图表数据 [2]

OpenAI 近期宣布计划在未来几个月内发布自 GPT-2 以来首个 “ 开放权重 “ 模型,这一决定标志着 OpenAI 在技术策略上的重要转变:

阅读全文 »

过去一周,AI 领域呈现出技术快速迭代、开源生态繁荣发展的态势。DeepSeek 引领开源浪潮,OpenAI 宣布开源新模型计划,Gemini 持续迭代更新,Anthropic 的 Claude 模型在代码能力上表现出色,AI Agent 能力呈现「摩尔定律」式增长,Prompt 工程成为 AI 交互的关键技术。
这些发展表明,AI 技术正以前所未有的速度向前推进,开源生态日益繁荣,技术融合不断深化,应用领域持续拓展。随着中美 AI 大模型性能差距的缩小,全球 AI 竞争格局正在重塑,中国在 AI 领域的影响力正在提升。
未来,随着 AI 技术的不断发展和普及,我们将看到更多创新应用的出现,AI 将为各行各业带来更深远的变革,推动社会生产力的提升和人类文明的进步。

斯坦福 HAI 研究所发布的《2025 年人工智能指数报告》显示,中美顶级 AI 大模型性能差距已大幅缩小至 0.3%,接近抹平 [1]。报告评选出 2024 年全球 61 个重要 AI 大模型,其中谷歌、OpenAI 和阿里分别入选 7 个、7 个和 6 个 [1]
这一差距的显著缩小主要归功于中国 AI 技术的快速发展。开源模型在 2024 年迎头赶上,顶尖开源模型与顶尖闭源模型之间的差距大幅减小。2024 年 1 月初,领先闭源模型的表现比顶级开源模型高出 8.0%,而到 2025 年 2 月,这一差距已大幅缩小 [2]

DeepSeek 凭借其出色的成本效益、惊人的推理速度以及开源生态,迅速崛起成为 AI 领域的明星产品。2025 年 2 月,DeepSeek 的访问量达 5.25 亿次,超过 ChatGPT 的 5 亿次,市场份额达到 6.58%,仅次于 ChatGPT(43.16%) 和 Canva(8.27%)[3]
DeepSeek 的技术优势主要体现在以下几个方面:

  1. 成本效益:DeepSeek V3 的完整训练仅需 2.788M H800 GPU 小时,训练过程仅用约 2000 张二流芯片,大幅降低了 AI 开发成本 [4]
  2. 性能卓越:在教育类基准测试中,DeepSeek-V3 的表现超越了所有开源模型,在 MMLU、MMLU-Pro 和 GPQA 测试中分别获得了 88.5、75.9 和 59.1 的优异成绩,性能已与领先闭源模型 GPT-4o 相当 [5]
  3. 全面的开源生态:DeepSeek 的开源项目几乎覆盖了 AI 基础设施的方方面面,包括存储 (3FS)、计算 (DeepEP)、通信 (smallpond)、数据处理 (FlashMLA) 等 [6]
阅读全文 »

前段时间在产品设计过程中注意到:iPhone 的每个按键竟然如此小巧。 这些按键排列紧密,每个尺寸甚至小于指尖,且几乎没有触觉反馈来帮助判断是否准确按下。手指容易遮挡目标按键,导致用户无法确认实际点击的是哪个键。按照传统直觉来看,这样的设计似乎不可行,理应遭到坚决反对。

然而,事实却正好相反。用户从未对此提出不满,反而习惯并认可了这一设计。这种「看似反直觉」的设计,最终成为智能手机行业的标准配置之一。

在 iPhone 发布前,市面上的智能手机主要采用两种实体键盘设计:全键盘设备(如黑莓)滑盖键盘手机。前者具备真实的触觉反馈和盲打能力,但占用了大量屏幕空间;后者虽在外观上更紧凑,但受限于机械结构,可靠性和耐用性都存在问题。

第一代 iPhone 项目启动时,乔布斯提出了一个坚定不移的原则:必须使用纯触摸屏,完全取消物理键盘。 他明确表示:

面对团队质疑,乔布斯的态度强硬——「要么接受触控屏,要么就滚蛋。」

阅读全文 »

在技术层面,GPT-4o 的图像生成能力大幅提升,MCP 协议推动 AI 模型无缝协作,DeepSeek 在医疗等领域的应用不断深化,这些都为 AI 技术的发展注入了新的动力。

在应用层面,AI 技术在零售、金融、医疗、能源等多个行业实现了广泛落地,推动了这些行业的数字化转型和智能化升级。同时,随着 AI 技术的不断发展和应用场景的不断拓展,我们可以期待看到更多创新应用的出现,进一步推动 AI 技术的发展和应用。

在学术研究方面,ICLR 2025 会议汇聚了众多关于大语言模型和智能体的前沿研究,这些研究为 AI 技术的发展提供了重要的理论基础和实践指导。通过解决多智能体协作系统的扩展性问题,赋予 LLM 代理个性化特征,研究人员可以开发出更强大、更灵活的 AI 系统,为各种应用场景提供更丰富、更自然的交互体验。

OpenAI 于 3 月 28 日宣布对 ChatGPT 的基座模型 GPT-4o 进行重大升级,并对所有付费用户开放使用。这次更新主要聚焦四大核心部分:多指令解析优化、技术问题处理增强、逻辑推理与决策能力提升 [1]。更新后的 GPT-4o 在图像生成能力方面表现尤为突出:

阅读全文 »

在 AI 技术加速迭代的当下,大模型正在以颠覆性的方式重塑行业生态。
大模型的「去工程化」能力虽可能挤压中小团队的生存空间,但同时也为开发者提供了新的创作接口——通过低代码工具链快速整合 API 资源,形成差异化竞争力。值得关注的是,技术普惠与巨头垄断的矛盾或将持续存在,开发者需在技术迭代中找到「人机协作」的新平衡点。

OpenAI 推出的 GPT-4o 在文本 - 图像对齐技术上实现质的飞跃,其生成质量与控制精度显著超越现有模型。通过简化工作流程,该模型不仅可精准生成吉卜力风格等复杂图像,更通过自然语言交互降低创作门槛。技术层面,其多模态能力支持透明通道生成、UI 设计修改等专业场景,使创意行业的工作流效率大幅提升。但这也带来行业集中化隐忧:大模型的「一站式」解决方案可能削弱创业公司通过垂直工具突围的机会,倒逼开发者转向更高阶的创意价值创造。

OpenAI 复制吉卜力,大模型正在吞噬一切产品?

GPT-4o 的真正突破在于将复杂图像操作转化为自然语言对话。用户无需掌握专业提示词或技术参数,即可完成换脸、风格迁移等高阶任务。其支持透明通道图片生成与 UI 设计稿直接修改,标志着图像生成技术从「技术驱动」向「需求驱动」转变。文中强调,技术成熟的核心在于「消解复杂性」,通过简化交互逻辑实现人机本质转变。这种变革不仅提升创意行业效率,更预示着未来 AI 工具将更注重「意图理解」而非「操作门槛」。

阅读全文 »

MCP(Model Context Protocol)的核心价值在于定义了应用程序与 AI 模型间标准化的上下文信息交换机制。通过这套协议,开发者能够以统一的方式连接各类数据源、工具和功能到 AI 模型,无需为每个特定场景开发独立适配器。[1]

传统 AI 系统集成外部工具时面临显著挑战。每个 API 都需要独立处理代码实现、文档学习、认证机制、错误处理和持续维护,这种碎片化的开发模式极大增加了系统复杂度。[2] 在 MCP 出现前,AI 助手与外部工具的每次交互都需要预先编码和 API 调用,这种手工对接方式效率低下且难以规模化。

更严峻的是配置组合爆炸问题。假设存在 1000 个 AI 助手和 1000 个外部工具,传统方式需要开发 100 万(1000×1000)个独立连接,而 MCP 通过标准化协议将这个数字降低到 2000(1000+1000)。这种数量级的效率提升重构了智能体生态的连接范式。

打个比方:API 就像是不同的门,其中每扇门都有自己独特的钥匙和使用规则:

阅读全文 »

一年一度的 Mac Software 整理如期而至,本次是因为新入手了 Mac mini。谁叫这个价格实在是太香了。

去年的见:2024-08-mac-software

Homebrew 是 Mac 上非常强大的包管理工具,可以方便地安装和管理各种软件。

阅读全文 »

Manus[1] 是中国创业公司「蝴蝶效应」推出的全球首款通用 Agent 产品。它定位为全能型智能助手,不仅能提供建议,还能将想法转化为实际行动,真正解决问题。

作为首款真正意义上的通用 AI Agent,Manus 具备从规划到执行的完整任务闭环能力,如撰写报告、制作表格等。它不仅能生成想法,还能独立思考和执行任务,直接交付完整成果。据官方数据,Manus 在 GAIA 基准测试中取得了 SOTA 成绩,性能超越 OpenAI 同级别大模型。

Manus 的名字含义:「Manus」在拉丁文中意为「手」,象征着知识不仅存在于思维中,还应能通过行动得以实现。这体现了 Agent 与 AI Bot(聊天机器人)产品从提供信息到执行任务的本质进阶。

阅读全文 »

在 AI 技术加速迭代的浪潮中,我们正见证着人类社会组织形态与技术应用范式的双重变革。从 AI 原生公司的组织实验到 GPT-5 的技术突破,从企业数字化转型的阵痛到人机协作模式的哲学思辨,这场变革正在重塑商业逻辑、工作形态乃至社会结构。
AI 发展已进入「创造性破坏」的关键阶段:一方面,DeepSeek 等工具正在瓦解传统科层制组织的合理性;另一方面,黄仁勋的「十五个大饼」预示着硬件革命将重构技术边疆。这种撕裂与重构的张力中,真正的机遇或许属于那些既能驾驭 AI 工具又能保持人性化创新的组织形态。但需警惕的是,在追求效率最大化的竞赛中,我们不应让技术理性完全吞噬人类创造力的混沌之美。

AI 原生公司正在颠覆传统企业架构,创始人通过编排 AI 代理网络实现小团队运作。这种模式以「非必要不雇人」为原则,利用 AI 工具将传统需要数十人的工作压缩至几人完成。Paul Jarvis 的「一人公司」理念在此得到进化,创始人从管理者转变为系统设计师。但该模式面临三重挑战:创意障碍可能导致同质化、AI 过度迎合用户偏好、决策责任模糊化。解决方案包括保留人工创意环节、构建对抗性 AI 系统、建立透明决策框架。这种组织实验揭示出,未来的商业竞争将更多是系统设计能力的较量。

相关延伸:AI 原生公司

OpenAI 即将推出的 GPT-5 将整合 GPT 与 o 系列模型优势,实现推理能力质的提升。其核心突破在于编程自动化领域,预计 2026 年实现 99% 代码自动生成,这将重构软件开发行业生态。更值得关注的是产品化思维:通过 Deep Research 展现 AGI 潜力,将个性化教育导师和机器人技术作为落地场景。这种「研究即产品」的模式,打破了传统实验室与市场的界限。但编者担忧,当编程成为 AI 的游乐场,人类开发者的价值定位需要重新定义——从代码工人转变为需求架构师。

阅读全文 »
0%