Liam's Notes

L55_你又在绘制新的航线了吗

发表于 2025-02-07 分类于 AI & Systems Waline：

预训练阶段 Scaling Laws 效果放缓，但后训练与多模态仍有潜力；用户规模不是核心竞争力，ChatGPT 日活远超 Claude 而性能相近；DeepSeek 通过 MoE 与FP8、并行与通信等优化推动成本下降趋势，同时凸显出口管制必要性

你又在绘制新的航线了吗

在模型的预训练阶段，Scaling Laws 的效果确实有所放缓，但在后训练和多模态模型的场景下，数据的 Scaling 仍然有显著的提升空间。有研究员从 Scaling 的原理出发，认为模型在第一阶段的性能提升依赖于从小模型到大模型的「非线性到线性」转变。然而，当模型已经足够大时，这种转变的效果难以预测，预训练的效果可能会趋于瓶颈。尽管如此，研究员们并不认为预训练的 Scaling Laws 已经完全结束，尤其是在多模态模型中，数据的 Scaling Laws 仍有许多未被探索的领域。目前，许多公司选择大力投入后训练，主要是出于性价比的考虑。

干货分享：一场OpenAI、NVIDIA、Anthropic、Google研究员的新年硬核聊天

闫俊杰认为，用户数量等指标并不是 AI 竞争的核心。他强调，不应使用移动互联网时代的产品方法论来思考 AI 大模型产品。他指出，中国大部分公司，无论是创业公司还是大厂，仍然在使用推荐系统的方法来开发大模型产品。然而，AI 大模型与产品的关系是：更好的模型可以带来更好的应用，但更好的应用和更多的用户并不会直接导致模型的改进。例如，ChatGPT 的日活跃用户数（DAU）是 Claude 的 50 到 100 倍，但两者的模型性能却相差无几。

晚点对话 MiniMax 闫俊杰：千万别套用移动互联网的逻辑来做 AI

阅读全文 »

12月小结｜请回答2024

发表于 2024-12-31 分类于 Notes & Essays Waline：

停止通讯后失去动力。陪伴孩子成长，意识家庭责任重。父母老去成依靠。留辫子、养寄居蟹健身尝试新事物的乐趣。喜音乐，演唱会体验深，尤其父母同欢张信哲演唱会。期间内耗严重，现状不满却犹豫不决。全年感恩焦虑共生，盼新一年走出内耗追梦。

2024 年，我停下了许多事情。停更了 newsletter，本以为可以更自由地安排时间，可是没有了催更的压力，反而觉得自己越来越没有动力输出。那个一度满怀热情想要分享一些想法的自己，似乎已经消失了。取而代之的，是一个安静得像是消失在世界角落的人。

这年，周末几乎都花在了陪伴孩子上。和他一起玩耍、兜风、探园，看着他一点一点长大，心中满是感动。看着他成长，就像在看一部电影，剧情的每一个转折都深深牵动着我。

家庭的责任感也越来越强烈。外婆摔倒了，需要做手术，父母也渐渐进入了 60 岁的年龄，依然在为我分担一些生活的重担。随着他们年龄的增长，我开始越来越意识到，自己不只是孩子的父亲，也在慢慢变成父母的依靠。这个变化让我有些无奈，也有些感慨。时间，似乎在不经意间悄悄带走了他们的青春，而我，正在经历着父母曾经经历过的转变。

这一年，我也试着做一些新的尝试。留了个小辫子，像是与年轻时的自己打个招呼；买了些寄居蟹，给它们搭了一个小小的生态圈，花心思照顾它们；年末开始健身，希望通过改变身体，能让生活变得更有层次感。虽然大多数时间的日子依旧平淡，但这些小小的波澜，却给了我一些意外的乐趣。

音乐，也在这一年占据了我的生活。我去看了很多场演唱会，林俊杰、汪苏泷、邓紫棋、张信哲，每一场都让生活充满了色彩。尤其是带父母去看张信哲的演唱会时，听他们提起年轻时喜欢他的歌，脸上不禁浮现出感慨。那一刻，我仿佛看见了岁月的流转。

阅读全文 »

论 NVIDIA 的崛起

发表于 2024-12-22 分类于 Product & Intelligence Waline：

英伟达以图形处理器起家，通过变换与光照、CUDA和AI技术实现三次增长曲线，经历游戏、加密货币挖矿和加速计算；市值突破三万二千亿美元，在全球算力竞争中占据主导，但2024年12月因收购Mellanox在华反垄断调查面临潜在十亿美元罚款。

英伟达（NVIDIA）的股价屡创新高，其市值在短短几年内相继突破了 1 万亿、2 万亿，直至目前的 3.2 万亿美元大关。这家以 GPU 起家的公司在人工智能领域正发挥着越来越重要的基础设施作用。

回顾英伟达的发展历程，可以发现它几乎与 GPU 技术的发展同步。作为图形处理器的领头羊，英伟达通过不断创新和升级，推动了 GPU 从专业图形显示向计算领域的拓展。尤其是在 AI 技术突飞猛进的背景下，GPU 的高性能并行计算能力为深度学习提供了坚实的支撑，使得英伟达成为这一领域不可或缺的角色。

GPU，即图形处理器（Graphics Processing Unit），最早诞生于 20 世纪 90 年代初。随着计算机技术的飞速发展，游戏行业开始从 2D 向 3D 转变。相比 2D 游戏，3D 游戏能够提供更加逼真的体验，但也对计算能力提出了更高的要求。为此，GPU 被发明出来，用于专门处理图形计算任务，以减轻 CPU 的负担。

阅读全文 »

费曼学习法与ChatGPT

发表于 2024-11-16 分类于 AI & Systems Waline：

人工智能特别是ChatGPT作为思考伙伴，帮助学习者运用费曼学习法快速获取资源、解答疑问、用自述巩固理解，并通过角色扮演测试盲点、反馈、总结，实现信息到洞见、洞见到创新的转化，提升认知能力与学习效率。

在当今的科技时代，人工智能（AI）的迅猛发展重新定义了我们学习、工作和生活的方式。AI 不仅帮助我们提高效率，还成为我们思维的伙伴，指导我们激发潜能，尤其是像 ChatGPT 这样的工具，能够帮助我们充分发挥人类的潜力。

**大脑不应该简单地被当作一个信息储存库。**人类大脑的独特之处在于它能够进行复杂的推理、情感理解和创造性思维，这远超出信息存储的功能。仅将大脑视作存储工具，忽略了它在生成新思维、发现创新解决方案以及应对变化中的挑战方面的卓越能力。事实上，过于强调记忆信息，可能会限制我们的创新潜能，因为我们的认知资源可能被用于记住信息而不是处理和应用知识。大脑的真正价值在于将信息转化为洞见，创造出全新的想法和解决方案。

AI，特别是如 ChatGPT 一样的生成模型，能够在这个过程中扮演关键角色。AI 不仅能帮助我们获取信息，还能通过工具化的信息整理和多角度观点的提供，帮助我们理清思路，从而激发新的创意。这种协助让我们能够将精力放在创新和复杂问题的解决上，而不是简单的记忆和信息的回避。

在实践中，实现这种 AI 与人类思维的协同作用，可以采用费曼学习法。费曼学习法由著名物理学家理查德·费曼提出，其核心思想是通过讲述来巩固理解。简单而言，如果你不能用简明的语言解释你所学的内容，那么你并不真正理解它。当我们结合 AI 工具如 ChatGPT 时，相当于与一个始终客观且可以互动的「伙伴」进行交流。通过这样的讲述与即时反馈系统，我们可以不断校正和加深自己的理解，同时使得学习过程更具互动性和趣味性。

因此，AI 不仅是信息的提供者，更是思维和创造力的激发者。我们的目标不应是简单的信息积累，而是通过整合和利用 AI 工具，提升我们的认知能力，实现更佳的自我提升和创新突破。

阅读全文 »

阅读困境：广泛阅读还是按需获取？

发表于 2024-11-10 分类于 Notes & Essays Waline：

信息过载让人难以有效阅读，需要在广泛获取信息与按需深入之间取得平衡。芒格主张好奇心驱动的跨学科广泛阅读并在关键问题上深入；费曼以问题为导向，使用费曼技巧内化知识；德鲁克强调严格筛选高价值信息源；费里斯推崇及时学习以降低认知负担；波普尔建议围绕核心问题筛选信息；加缪和纳博科夫坚持依据内在需求的深度阅读。

在日常生活中，我习惯订阅大量的 RSS、Newsletter 等信息源，每天上班前的第一件事便是浏览这些订阅内容。随着订阅的数量增加，我逐渐发现信息量的增长与实际获取的有效信息并不成正比。

很多内容当下似乎有用，但收藏后却往往再也不会打开。这让我陷入思考：我们的阅读方式究竟应该「广泛获取信息」还是「按需深入查找」？

为了更好地理解这个问题，我参考了几位知名学者的策略，他们在广泛信息与按需查找方面各有独到的见解：

查理·芒格（Charlie Munger）——广泛阅读 + 适时深入
芒格提倡「好奇心驱动的广泛阅读」，他涉猎广泛，从心理学到历史、经济学、法律等多个领域。这种广泛积累让他在不同学科中找到普遍规律。但他也强调在关键问题上要深入挖掘。因此，这种方法适合对跨学科有兴趣、需要多维度思考的工作者。
理查德·费曼（Richard Feynman）——问题导向的学习
费曼的学习方法以「好奇和问题驱动」为核心。他通常不会无目的地泛读，而是带着明确的问题去学习，这种策略让他能够深入理解复杂内容，并通过「费曼技巧」内化知识。这种方法适合在有具体问题时深入探究的学习者。
彼得·德鲁克（Peter Drucker）——高价值信息过滤
德鲁克认为信息过载已成常态，真正有用的内容却凤毛麟角。因此他主张严格筛选信息源，只关注对自己价值较高的内容。这种方法适合需要在特定领域内深耕的学习者，避免信息过多干扰核心工作。
蒂姆·费里斯（Tim Ferriss）——及时学习法（Just in Time Learning）
Tim Ferriss 倡导「及时学习」，即在特定需求时才专注学习相关内容，避免为不必要的阅读消耗精力。这种策略帮助他在学习过程中保持目标明确、提高效率，避免认知负担过重。
卡尔·波普尔（Karl Popper）——围绕核心问题筛选信息
波普尔在构建理论时，以问题为核心筛选信息。他认为科学家应围绕关键问题展开深度分析，而不是追逐所有信息。应用在阅读上，可以通过设定核心问题或主题，从而将精力集中在最相关的内容上。
加缪（Albert Camus）与纳博科夫（Vladimir Nabokov）——内在需求驱动的深度阅读
加缪和纳博科夫的阅读方式不同于一般的广泛信息获取，而是基于兴趣和内在需求，深入研究特定主题。他们倾向于重读对自己有深刻启发的作品，这种方式不仅帮助增强记忆，还能形成更加深入的见解。

The Why·Liam·Blog by WhyLiam is licensed under a Creative Commons BY-NC-ND 4.0 International License.

阅读全文 »

找到 PMF

发表于 2024-11-05 分类于 Product & Intelligence Waline：

找到PMF分为五个级别：解决重要问题、验证问题、验证MVP、验证留存、获取前五个付费客户。创始人需亲自参与迭代。

找到 PMF 就像打游戏， 它们分别是：

找到一个重要的问题来解决
通过与用户对话验证问题
让用户开始使用你的产品
让用户持续使用你的产品
获取你的前五个参考客户

要赢得这个游戏，需要完成所有五个等级。除第一级外，每一级都有多种失败的可能性。我已经列出这些可能性——按顺序依次进行。如果你发现没办法完成某一级，意味着你可能需要对整个公司来个大转型。

从解决你自己遇到的问题开始。这个问题不仅需要你亲身经历过，还要你曾尝试过去解决，否则它就不算是一个重要的问题。

你的想法和你选择服务的用户群体，会深刻影响你的职业生涯和个人生活。我建议多尝试一些想法，然后找出你喜欢的是什么，以及为什么喜欢。

阅读全文 »

人在低谷期的时候，有三件事情不能做

发表于 2024-11-05 分类于 Notes & Essays Waline：

在低谷期避免摆烂、沉迷短视频、沉默寡言三点，分别强调保持生活秩序感、守护专注力与创造力、坚持表达的重要性，以提升情绪与生活品质，低谷时正是修炼自己的时机，需坚持积极行动与持续学习。

在生活中，难免会有情绪低谷、状态不佳的时候。然而，在低谷期，有三件事情我们绝不能做，否则可能让情绪更加低迷、生活更加失序。

当我们放弃自我管理、随波逐流时，生活和工作很容易变得模糊。模糊的界限不仅影响效率，还会导致不安和焦虑。

有一位心理咨询师提到，「许多内耗和焦虑的来源正是‘模糊’：模糊的工作生活边界、模糊的日程安排。」这种模糊会让思维凌乱不堪。因此，学会用「有意的清晰」来对抗「模糊的不安」，至关重要。

我们需要为每天的时间安排和任务进行有意识的规划，保持清晰的目标和秩序感，让自己在生活的每一刻都找到价值和意义。

在当下，短视频平台充斥着娱乐性极强的内容，很容易让人一刷停不下来。但其实，短视频成瘾对大脑的损害不容小觑。

阅读全文 »

我对财务自由的思考和探索

发表于 2024-11-04 分类于 Notes & Essays Waline：

工作曾给作者带来成就感和成长满足感，但当工作无法提供满足感时变得痛苦，引发对人为什么要工作的思考，最初工作为解决生存问题，现在仍面临房贷、育儿、养老等压力，掉入老鼠赛跑陷阱。财务自由定义为目标选择自由而非无限消费，分为普通自由和高级自由两个标准：前者只需投资收益跑赢通胀保障生活质量不下降，后者还需跑赢人均GDP增速确保社会财富排名不下降。提供具体计算公式和实现路径，强调保护可投资资产、控制年总开销

工作曾经令我很快乐。因为每一天我都能感觉到自己在进步，毫不夸张，每！一！天！都有一些些进步。而且对工作价值非常认同，觉得自己在做的事情，虽然微小但真实的改变一些人的生活，在帮助这个社会变得更好。

当我享受过工作价值带来的成就感、个人快速成长带来的满足感之后，对工作的要求就会变得很高。如果有一天，当下的这份工作，确实没有办法让我有成就感和满足感的时候，工作的过程就会变得非常痛苦。

前几年我就曾陷入这样痛苦工作的模式，而这些痛苦引发我思考一个问题，人为什么要工作？

不说别人，就说我自己，最开始工作只是为了解决生存问题，而且我从来没有想过，除了工作还有什么其他的途径也可以解决生存问题。现在工作，仍然是为了解决生存问题，因为家中有小孩，身上有房贷，老家有父母，没有办法因为自己觉得痛苦，就撂挑子不干了。

玩过现金流游戏的人都懂，这是掉入到老鼠赛跑的陷阱里了，随着工作收入的增加，各方面支出也会同步加大，需要永无止境的劳动才能获得不断的收入，一旦停下来，就会饿死！

阅读全文 »

字节跳动的产品与决策：中观层面的探索

发表于 2024-11-04 分类于 Product & Intelligence Waline：

以中观视角解析字节跳动在ToC市场的中台驱动与快速迭代：强调中台标准化能力沉淀与资源调度，以手感型团队打造推荐系统，平衡搬运与原创先聚流量后提质，完善微头条供给生态以规避明星依赖，构建教练文化与透明组织，产品会议跨层级直达，数据驱动决策与复盘。抖音短视频通过多目标模型与审核本地化推动全球扩张，OKR促使目标对齐。总体呈现以执行为核心的迭代文化与中观方法论形成壁垒。

在和 @Yifeng Li 的对话中，我们探讨了字节跳动产品战略的一些独特之处。感触最深的是「中观」的概念：既要有战略视角，又能深入到落地执行，甚至包含对决策的深度反思。这种中观视角，不仅帮助我们理解企业运作的深层逻辑，也揭示了外界难以看到的决策过程和复盘。

在面对 ToC 市场时，字节的策略从未拘泥于传统的「一击必中」模式。字节在小视频领域的成功，正是源于「不断尝试」的策略。火山、抖音和系列收购的布局，尽管前期投入较小，但通过中台团队的高效支撑，迅速孵化出大量产品，实现了市场快速占领。

微头条最初的设想是针对微博的分发缺陷，试图建立更健康的内容分发生态。然而，由于创作者内容供给不足，字节不得不依赖 PGC 内容。但这种转向破坏了 UGC 生态，使得平台无法达到预期的活跃度。最终，微头条的定位逐渐转变为明星和粉丝的沟通工具，逐步失去竞争优势。

字节跳动的推荐系统的成功，更多源自于工程师的「手感」和对上下游链路的深刻理解。在早期，字节甚至没有 NLP 专家，仅靠工程师自学书籍完成推荐系统的初期构建。产品的成败与工程师的直觉和操作细节紧密相连，这种「手感型团队」的默契为字节的推荐系统奠定了坚实基础。

字节跳动在对待内容搬运和原创上的策略值得深思。早期，平台大力补贴内容搬运，吸引流量。等到平台生态初步形成后，再将原创补贴提升至搬运补贴的十倍，实现内容的质变。这种做法，在流量和优质内容之间实现了平衡，为字节的内容生态奠定了基础。

阅读全文 »

个人投资系统的构建

发表于 2024-10-12 分类于 Product & Intelligence Waline：

阐述个人认知与投资哲学的根基作用，强调价值投资四大核心理念：买公司本质、忽略短期波动、保持安全边际、专注能力圈。系统化构建投资框架，以长期持有优质企业实现财富增长，体现知识、技术与商业模式协同。

在现代金融市场中，每个投资者都需要一套成熟的投资系统。这不仅仅是为了应对复杂的市场环境，更是为了在长期中保持理性与耐心。本文将借用《投资第一课》中关于「我们为什么需要一套投资系统」的框架，结合当下的个人投资认知，来探讨如何构建一套适合自己的投资系统。

个人认知就像每个人的指纹，独特而深刻，是我们投资行为的起点。投资实际上是认知的变现。没有清晰的投资哲学作为指导，一切的投资策略都会失去方向。因此，思考「为什么要投资」是构建投资系统的核心。

财富的本质来源于知识的积累，呈现为物理技术、社会技术与商业模式的协奏。

长期投资的三段论：股票背后是公司，公司背后是商业，而商业则反映了社会价值。长期来看，这些要素的增长是同步的。

价值投资是一种长期、理性、以公司价值为核心的投资方式。在《金钱心理学》一书中，万维钢引用了李录的总结，完美诠释了查理·芒格和本杰明·格雷厄姆的价值投资思想，这对我们构建投资系统至关重要。

阅读全文 »