Why·Liam·Blog

人生若如初見

在 AI 技术加速迭代的当下,大模型正在以颠覆性的方式重塑行业生态。
大模型的「去工程化」能力虽可能挤压中小团队的生存空间,但同时也为开发者提供了新的创作接口——通过低代码工具链快速整合 API 资源,形成差异化竞争力。值得关注的是,技术普惠与巨头垄断的矛盾或将持续存在,开发者需在技术迭代中找到「人机协作」的新平衡点。

阅读全文 »

在调研 Manus AI 时,很容易发现「工具不足」的问题。虽然 Manus AI 内置了 29个工具,但这在当前软件生态中远远不够。例如操作 PhotoShop、Holo 等专业工具时仍需重写适配方法,而 MCP 正是为解决这一根本性问题而设计。

阅读全文 »

 一年一度的 Mac Software 整理如期而至,本次是因为新入手了 Mac mini。谁叫这个价格实在是太香了。
 
 去年的见:[[2024-08-mac-software]]

Homebrew 是 Mac 上非常强大的包管理工具,可以方便地安装和管理各种软件。

阅读全文 »

Manus[1] 是中国创业公司「蝴蝶效应」推出的全球首款通用 Agent 产品。它定位为全能型智能助手,不仅能提供建议,还能将想法转化为实际行动,真正解决问题。

作为首款真正意义上的通用 AI Agent,Manus 具备从规划到执行的完整任务闭环能力,如撰写报告、制作表格等。它不仅能生成想法,还能独立思考和执行任务,直接交付完整成果。据官方数据,Manus 在 GAIA 基准测试中取得了 SOTA 成绩,性能超越 OpenAI 同级别大模型。

阅读全文 »

在 AI 技术加速迭代的浪潮中,我们正见证着人类社会组织形态与技术应用范式的双重变革。从 AI 原生公司的组织实验到 GPT-5 的技术突破,从企业数字化转型的阵痛到人机协作模式的哲学思辨,这场变革正在重塑商业逻辑、工作形态乃至社会结构。
AI 发展已进入「创造性破坏」的关键阶段:一方面,DeepSeek 等工具正在瓦解传统科层制组织的合理性;另一方面,黄仁勋的「十五个大饼」预示着硬件革命将重构技术边疆。这种撕裂与重构的张力中,真正的机遇或许属于那些既能驾驭 AI 工具又能保持人性化创新的组织形态。但需警惕的是,在追求效率最大化的竞赛中,我们不应让技术理性完全吞噬人类创造力的混沌之美。

阅读全文 »

在人工智能技术快速迭代的浪潮中,我们看到两条并行不悖的发展主线:技术突破带来的生产力革新与商业叙事构建的市场价值创造。从 OpenAI 的 Deep Research 展现的端到端任务处理能力,到中国 AI 企业以惊人性价比挑战技术霸权;从 Agent 模式对传统工作流的颠覆可能,到商业叙事在资本市场中的战略价值——这些现象共同勾勒出 AI 时代「技术 + 商业」双轮驱动的创新图谱。
真正的行业引领者既需要像 DeepSeek 那样用算法突破技术天花板,也需要具备比尔·盖利所言的「重构估值体系」的叙事智慧,这种硬实力与软实力的结合,或将重新定义未来十年的科技竞争格局。

阅读全文 »

最近,完成了述职,感觉稍微空一点,又开始折腾笔记软件了。

过去半年,我执着于寻找「完美方案」。Obsidian 的稳定性与开放性确实满足了我的基础需求。但当我将「管理混乱」归咎于工具时,却忽略了更本质的真相:「工具的价值,在于它是否能延伸你的行动力。」(彼得·德鲁克语)

阅读全文 »

Ray Dalio 认为,美国未来五年将面临国内极化、AI 竞赛加速与全球秩序瓦解的挑战。贫富差距、教育鸿沟和党派对立可能导致社会进一步撕裂,而 AI 技术的发展虽提升经济效率,却也带来更大不平等和治理难题。全球 AI 竞争缺乏统一协调机制,中美在该领域各有优势,但仍存技术扩散与地缘冲突的风险。Dalio 强调,人类需通过社区建设、教育改革和价值观引导,让科技服务于共同福祉,以避免社会陷入失序。

阅读全文 »

DeepSeek、千问和 O3 背后的推理语言模型(RLM)融合大型语言模型的广度、强化学习的探索深度以及高性能计算的强大算力,实现从简单预测到系统化推理的跃迁。RLM 由推理、训练、数据生成三大流程构成,并结合树状结构和蒙特卡洛搜索优化决策路径。其模块化蓝图降低了研发门槛,推动学术与应用创新,同时提供实验框架「x1」,支持快速原型设计,帮助开发者构建适用于不同场景的智能推理系统。
推理模型创新大爆发,DeepSeek、千问、O3 背后的基础技术科普

阅读全文 »

Grok-3 凭借数学领域 87.2% 的准确率(较 GPT-5 提升 23%)、代码生成 Benchmark 92.4 分的成绩,刷新了 AGI 领域的性能天花板。其独创的神经架构搜索技术,使模型参数量突破 2 万亿仍保持高效推理能力。值得注意的是,Chatbot Arena 竞技场中用户自发测试的 1.3 万组对话数据显示,其多轮对话连贯性得分达 4.81/5.0(行业均值 3.92)。

阅读全文 »
0%