Why·Liam·Blog

人生若如初見

MCP(Model Context Protocol)的核心价值在于定义了应用程序与 AI 模型间标准化的上下文信息交换机制。通过这套协议,开发者能够以统一的方式连接各类数据源、工具和功能到 AI 模型,无需为每个特定场景开发独立适配器。[1]

传统 AI 系统集成外部工具时面临显著挑战。每个 API 都需要独立处理代码实现、文档学习、认证机制、错误处理和持续维护,这种碎片化的开发模式极大增加了系统复杂度。[2] 在 MCP 出现前,AI 助手与外部工具的每次交互都需要预先编码和 API 调用,这种手工对接方式效率低下且难以规模化。

更严峻的是配置组合爆炸问题。假设存在 1000 个 AI 助手和 1000 个外部工具,传统方式需要开发 100 万(1000×1000)个独立连接,而 MCP 通过标准化协议将这个数字降低到 2000(1000+1000)。这种数量级的效率提升重构了智能体生态的连接范式。

打个比方:API 就像是不同的门,其中每扇门都有自己独特的钥匙和使用规则:

阅读全文 »

一年一度的 Mac Software 整理如期而至,本次是因为新入手了 Mac mini。谁叫这个价格实在是太香了。

去年的见:2024-08-mac-software

Homebrew 是 Mac 上非常强大的包管理工具,可以方便地安装和管理各种软件。

阅读全文 »

Manus[1] 是中国创业公司「蝴蝶效应」推出的全球首款通用 Agent 产品。它定位为全能型智能助手,不仅能提供建议,还能将想法转化为实际行动,真正解决问题。

作为首款真正意义上的通用 AI Agent,Manus 具备从规划到执行的完整任务闭环能力,如撰写报告、制作表格等。它不仅能生成想法,还能独立思考和执行任务,直接交付完整成果。据官方数据,Manus 在 GAIA 基准测试中取得了 SOTA 成绩,性能超越 OpenAI 同级别大模型。

Manus 的名字含义:「Manus」在拉丁文中意为「手」,象征着知识不仅存在于思维中,还应能通过行动得以实现。这体现了 Agent 与 AI Bot(聊天机器人)产品从提供信息到执行任务的本质进阶。

阅读全文 »

在 AI 技术加速迭代的浪潮中,我们正见证着人类社会组织形态与技术应用范式的双重变革。从 AI 原生公司的组织实验到 GPT-5 的技术突破,从企业数字化转型的阵痛到人机协作模式的哲学思辨,这场变革正在重塑商业逻辑、工作形态乃至社会结构。
AI 发展已进入「创造性破坏」的关键阶段:一方面,DeepSeek 等工具正在瓦解传统科层制组织的合理性;另一方面,黄仁勋的「十五个大饼」预示着硬件革命将重构技术边疆。这种撕裂与重构的张力中,真正的机遇或许属于那些既能驾驭 AI 工具又能保持人性化创新的组织形态。但需警惕的是,在追求效率最大化的竞赛中,我们不应让技术理性完全吞噬人类创造力的混沌之美。

AI 原生公司正在颠覆传统企业架构,创始人通过编排 AI 代理网络实现小团队运作。这种模式以「非必要不雇人」为原则,利用 AI 工具将传统需要数十人的工作压缩至几人完成。Paul Jarvis 的「一人公司」理念在此得到进化,创始人从管理者转变为系统设计师。但该模式面临三重挑战:创意障碍可能导致同质化、AI 过度迎合用户偏好、决策责任模糊化。解决方案包括保留人工创意环节、构建对抗性 AI 系统、建立透明决策框架。这种组织实验揭示出,未来的商业竞争将更多是系统设计能力的较量。

相关延伸:AI 原生公司

OpenAI 即将推出的 GPT-5 将整合 GPT 与 o 系列模型优势,实现推理能力质的提升。其核心突破在于编程自动化领域,预计 2026 年实现 99% 代码自动生成,这将重构软件开发行业生态。更值得关注的是产品化思维:通过 Deep Research 展现 AGI 潜力,将个性化教育导师和机器人技术作为落地场景。这种「研究即产品」的模式,打破了传统实验室与市场的界限。但编者担忧,当编程成为 AI 的游乐场,人类开发者的价值定位需要重新定义——从代码工人转变为需求架构师。

阅读全文 »

在人工智能技术快速迭代的浪潮中,我们看到两条并行不悖的发展主线:技术突破带来的生产力革新与商业叙事构建的市场价值创造。从 OpenAI 的 Deep Research 展现的端到端任务处理能力,到中国 AI 企业以惊人性价比挑战技术霸权;从 Agent 模式对传统工作流的颠覆可能,到商业叙事在资本市场中的战略价值——这些现象共同勾勒出 AI 时代「技术 + 商业」双轮驱动的创新图谱。
真正的行业引领者既需要像 DeepSeek 那样用算法突破技术天花板,也需要具备比尔·盖利所言的「重构估值体系」的叙事智慧,这种硬实力与软实力的结合,或将重新定义未来十年的科技竞争格局。

基于端到端强化学习的 AI Agent 正在重塑知识工作范式。OpenAI 开发的 Deep Research 系统通过 o3 推理模型的微调版本,展现出在医疗研究、市场分析等场景中生成万字级结构化报告的能力。其技术突破体现在三个维度:通过网站信息聚合实现跨平台数据整合,利用强化学习优化搜索推理路径,以及构建用户意图理解与任务分解的闭环系统。当前已实现的旅行规划、代码开发等应用场景,预示着未来在个性化教育、私有数据分析等领域的扩展潜力。值得关注的是,这种「思考型 AI」正在改变传统的人机协作模式,将原本需要数小时的研究工作压缩至分钟级,但同时也引发了关于信息溯源与决策透明度的新思考。

相关延伸:AI Agent将成为今年最具突破性技术

DeepSeek 等中国模型以 1/30 的训练成本实现 GPT-4 的 90% 性能,这背后是算力优化与算法创新的双重突破。Geoffrey Hinton 指出的「神经网络自主推理能力」,在中国团队的实践中得到验证:通过改进注意力机制与知识蒸馏技术,在 175B 参数量级实现复杂逻辑推理。这种技术路径的创新性体现在三个层面:摆脱对标注数据的过度依赖、构建混合精度训练框架、开发面向中文语境的语义理解模型。值得关注的是开源策略的战术价值——通过开放基座模型吸引开发者生态,既加速技术迭代又构建行业标准。这种「农村包围城市」的创新策略,正在改写全球 AI 竞争规则。

阅读全文 »

最近,完成了述职,感觉稍微空一点,又开始折腾笔记软件了。

过去半年,我执着于寻找「完美方案」。Obsidian 的稳定性与开放性确实满足了我的基础需求。但当我将「管理混乱」归咎于工具时,却忽略了更本质的真相:「工具的价值,在于它是否能延伸你的行动力。」(彼得·德鲁克语)

重读《原则》《终身成长》时,我试图将 PMK(个人管理知识体系)、PDCA(计划 - 执行 - 检查 - 行动循环)等方法论融入日常,却发现它们如同精致的瓷器——「过于完美的系统,往往经不起现实的磕碰。」 当系统与个人节奏、认知成本产生冲突时,工具反而成了束缚行动的绳索。

因此我设计了 「PDAA 循环」问题驱动行动系统 (Problem-Define-Act-Adapt,简称 PDAA)

以「问题」为驱动,通过最小化流程实现「思考 - 行动 - 迭代」的闭环,避免过度设计,专注结果导向。

阅读全文 »

Ray Dalio 认为,美国未来五年将面临国内极化、AI 竞赛加速与全球秩序瓦解的挑战。贫富差距、教育鸿沟和党派对立可能导致社会进一步撕裂,而 AI 技术的发展虽提升经济效率,却也带来更大不平等和治理难题。全球 AI 竞争缺乏统一协调机制,中美在该领域各有优势,但仍存技术扩散与地缘冲突的风险。Dalio 强调,人类需通过社区建设、教育改革和价值观引导,让科技服务于共同福祉,以避免社会陷入失序。

桥水达利欧:美国分裂、AI竞赛、全球失序,未来五年将如何演变?

世界模型技术正在快速演进,从 2018 年的基础突破发展到 2024 年的实时交互应用,并有望在游戏、机器人和法律等领域大放异彩。AI 媒介推动经济价值转变,未来或彻底改变人类的娱乐、工作和社交方式。然而,该技术也可能加剧贫富差距,使少数技术精英掌控财富分配。尽管世界模型为个体提供了虚拟空间构建意义的可能性,但仍面临计算能力、数据获取和版权法规等挑战。

「世界模型」能改变世界吗?李飞飞的世界实验室是啥?8000字看懂World Model演进史

阅读全文 »

DeepSeek、千问和 O3 背后的推理语言模型(RLM)融合大型语言模型的广度、强化学习的探索深度以及高性能计算的强大算力,实现从简单预测到系统化推理的跃迁。RLM 由推理、训练、数据生成三大流程构成,并结合树状结构和蒙特卡洛搜索优化决策路径。其模块化蓝图降低了研发门槛,推动学术与应用创新,同时提供实验框架「x1」,支持快速原型设计,帮助开发者构建适用于不同场景的智能推理系统。
推理模型创新大爆发,DeepSeek、千问、O3 背后的基础技术科普

AI 的普及正在降低技术门槛,使更多人能接触到前沿科技,实现表面上的机会均等。然而,这种平权并不意味着公平,反而可能加剧资源集中效应,使强者更强,形成新的「马太效应」。AI 在教育、创意、医疗等领域带来革命性变革,同时也让传统学科和职业的价值受到挑战。面对这一变革,人类需要培养批判性思维、同理心等 AI 难以取代的能力,避免盲目依赖技术,从而在智能时代保持核心竞争力。

2小时思想碰撞,10000字深度思考:人类会被AI淘汰吗

阿里最新开源的 AI 视频生成模型万相 2.1,结合文本生成视频(文生)和图像生成视频(图生)两大能力,提供 1.3B 和 14B 两种模型规格。1.3B 版本仅需 8G 显存即可运行,适合本地部署,而 14B 版本在语义理解、物理真实性和运动表现方面达到领先水平。此外,万相 2.1 是全球首个能直接生成中文字的 AI 视频模型,尽管在复杂文字生成上仍有改进空间。该模型的开源降低了 AI 视频技术的准入门槛,为内容创作生态提供了更广阔的发展空间,并提升了全球对中国 AI 产业的关注。
阿里深夜开源万相2.1,这是AI视频领域的DeepSeek啊

阅读全文 »

Grok-3 凭借数学领域 87.2% 的准确率(较 GPT-5 提升 23%)、代码生成 Benchmark 92.4 分的成绩,刷新了 AGI 领域的性能天花板。其独创的神经架构搜索技术,使模型参数量突破 2 万亿仍保持高效推理能力。值得注意的是,Chatbot Arena 竞技场中用户自发测试的 1.3 万组对话数据显示,其多轮对话连贯性得分达 4.81/5.0(行业均值 3.92)。

闭源策略虽加速技术迭代,但可能加剧行业马太效应,中小开发者更需关注开源生态建设。

马斯克正式发布Grok 3,这回真的把OpenAI干碎了。

吴永辉博士携其神经符号系统研究成果加盟字节跳动,据悉团队已获 20 万张 H100 显卡资源支持。其主导的 Seed 项目聚焦「认知涌现」机制研究,尝试突破现有 transformer 架构的泛化瓶颈。值得关注的是,其团队论文《液态神经网络在长程推理中的应用》刚获 ICML 2025 最佳论文提名。

阅读全文 »

DeepSeek 对数据标注极为重视,甚至传闻创始人梁文锋也亲自参与。AI 领域除了算法和技术,数据的精准度至关重要。特斯拉在标注方面的投入是中国自动驾驶行业的 20 倍,他们的策略是寻找驾驶经验丰富的人进行标注,从而优化自动驾驶能力。而在机器人训练中,特斯拉挑选小脑健康的人来标注动作,确保机器人的动作更加丝滑。DeepSeek 在数据标注上的精细化投入,正是其模型效率出色的关键。

86 条 DeepSeek 的关键思考 |Best Ideas 开源

阿里巴巴联合创始人、董事局主席蔡崇信近日回应了关于阿里与苹果合作的传闻。他表示,苹果在中国市场需要一个本地化合作伙伴,以优化其手机服务。苹果一直对合作伙伴要求极高,他们在中国市场接触了多家公司,最终选择了阿里。蔡崇信认为,能够与苹果这样的科技巨头合作,是阿里的幸运与荣幸。

阿里确认与苹果合作,股价创近三年新高

阅读全文 »
0%