<?xml version="1.0" encoding="utf-8"?>
<feed xmlns="http://www.w3.org/2005/Atom">
  <title>Bojie Li</title>
  
  <subtitle>Bojie Li (李博杰)</subtitle>
  <link href="https://01.me/atom.xml" rel="self"/>
  
  <link href="https://01.me/"/>
  <updated>2026-04-03T04:30:23.193Z</updated>
  <id>https://01.me/</id>
  
  <author>
    <name>Bojie Li</name>
    
  </author>
  
  <generator uri="https://hexo.io/">Hexo</generator>
  
  <entry>
    <title>一场泄露看懂 Claude Code：Harness 是让 Agent 干活靠谱的关键</title>
    <link href="https://01.me/2026/04/blog-claude-code/"/>
    <id>https://01.me/2026/04/blog-claude-code/</id>
    <published>2026-04-02T14:00:00.000Z</published>
    <updated>2026-04-03T04:30:23.193Z</updated>
    
    
    <summary type="html">&lt;ul&gt;
&lt;li&gt;&lt;a href=&quot;/files/claude-code-talk/dist/&quot;&gt;Slides HTML&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a href=&quot;/files/claude-code-talk/dist/slidev-exported.pdf&quot;&gt;Slides PDF&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a href=&quot;/files/claude-code-talk/slides.md&quot;&gt;Slides Source Code&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;2026 年 4 月 1 日，Anthropic 的 Claude Code 完整源码通过 npm 包泄露。Source Map 一打开，1903 个文件，51 万行 TypeScript，全部摊在眼前。&lt;/p&gt;
&lt;h3 id=&quot;源码里藏着一个完整的宠物扭蛋机&quot;&gt;&lt;a href=&quot;#源码里藏着一个完整的宠物扭蛋机&quot; class=&quot;headerlink&quot; title=&quot;源码里藏着一个完整的宠物扭蛋机&quot;&gt;&lt;/a&gt;源码里藏着一个完整的宠物扭蛋机&lt;/h3&gt;&lt;p&gt;大家第一时间在源码里发现了一个完整的宠物系统——Buddy。输入 &lt;code&gt;/buddy&lt;/code&gt; 就能 “孵化” 一只专属 CLI 宠物：18 个物种、5 档稀有度（legendary 仅 1%）、5 项随机属性、6 种眼型、8 种帽子、1% 闪光概率、3 帧 ASCII 动画。每个用户的宠物由 &lt;code&gt;userId + SALT&lt;/code&gt; 确定性生成。&lt;/p&gt;
&lt;p&gt;一个 51 万行的生产级 AI Agent 里，藏着一个如此用心的宠物系统。但仔细看代码，有几处让人忍不住多想：&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;证据一&lt;/strong&gt;：&lt;code&gt;SALT = &amp;#39;friend-2026-401&amp;#39;&lt;/code&gt;——friend + 2026 年 4 月 1 日。泄露日期精确到天。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;证据二&lt;/strong&gt;：Teaser Window 精确到 April 1-7, 2026。注释写的是 &lt;code&gt;“Sustained Twitter buzz instead of a single UTC-midnight spike”&lt;/code&gt;——这不像是工程师对内部功能的描述，更像是营销策划的用语。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;证据三&lt;/strong&gt;：18 个物种名全部用 &lt;code&gt;String.fromCharCode(0x…)&lt;/code&gt; 构造（hex 编码），原因是 &lt;code&gt;capybara&lt;/code&gt; 碰撞了 Anthropic 下一代模型的内部代号（出现在 &lt;code&gt;excluded-strings.txt&lt;/code&gt; 黑名单里）。为了不让它特别突出，所有物种都统一编码——“so one doesn’t stand out”。但 capybara 正好是此前被泄露的新模型名字。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;证据四&lt;/strong&gt;：统一 hex 编码反而让每个逆向工程者都去解码了——如果目标是隐藏，效果恰好相反。&lt;/p&gt;
&lt;h3 id=&quot;这场泄露真的是巧合吗？&quot;&gt;&lt;a href=&quot;#这场泄露真的是巧合吗？&quot; class=&quot;headerlink&quot; title=&quot;这场泄露真的是巧合吗？&quot;&gt;&lt;/a&gt;这场泄露真的是巧合吗？&lt;/h3&gt;&lt;p&gt;有三种可能的解读：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;A. 纯巧合&lt;/strong&gt;（10%）：Buddy 是计划中的愚人节彩蛋，source map 是配置失误，碰巧同一天。需要相当大的巧合。&lt;/li&gt;
&lt;li&gt;**B. 技术团队 “不小心” **（55%）：有人在那次构建中 “不小心” 开启了 source map。法务发 DMCA 是真实的应激反应，但十几个小时的窗口期已经足够代码传遍全球。Buddy 彩蛋是提前埋好的引爆物。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;C. 其他可能&lt;/strong&gt;：完全意外但事后默许（20%），或公司策划（15%）。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;不管答案是什么，结果是一样的：全球开发者免费做了一次深度代码审查和口碑传播。这可能是 2026 年最成功的技术营销，无论是否有意为之。&lt;/p&gt;
&lt;h3 id=&quot;真正的价值：一扇罕见的窗口&quot;&gt;&lt;a href=&quot;#真正的价值：一扇罕见的窗口&quot; class=&quot;headerlink&quot; title=&quot;真正的价值：一扇罕见的窗口&quot;&gt;&lt;/a&gt;真正的价值：一扇罕见的窗口&lt;/h3&gt;&lt;p&gt;这场泄露的技术价值不在于某个具体实现多巧妙，而在于它提供了一个罕见的窗口：&lt;strong&gt;一个日活用户庞大的商业级 AI Agent 产品，在工程层面到底在解决什么问题？&lt;/strong&gt; 过去两年，AI Agent 从论文概念走向产品现实，但绝大多数公开讨论停留在两个极端——要么是 “让模型调工具” 的入门教程，要么是 “AGI 即将到来” 的宏大叙事。中间那一层，几乎没有人讲清楚过。&lt;/p&gt;
&lt;p&gt;读完这份源码，最强烈的感受是：&lt;strong&gt;Agent 的核心难题不在 “让模型调用工具”，而在模型、提示词和工具之外&lt;/strong&gt;。权限怎么判、错误怎么恢复、上下文怎么管理、缓存怎么保持、并行怎么协调、怎么隐藏中间错误——这些工程才是一个 Agent 产品从 Demo 到生产的真正门槛。而这套 “模型之外的一切”，有一个正式的名字：&lt;strong&gt;Harness&lt;/strong&gt;。&lt;/p&gt;
&lt;p&gt;本文基于 Claude Code 源码和相关分析，系统性地拆解 Harness Engineering 这一 Agent 工程范式——它是什么、为什么重要、Claude Code 是如何实现的、以及我们能从中学到什么。&lt;/p&gt;</summary>
    
    
    
    
  </entry>
  
  <entry>
    <title>OpenClaw 与 Agent 的未来</title>
    <link href="https://01.me/2026/03/openclaw-and-future-of-agents/"/>
    <id>https://01.me/2026/03/openclaw-and-future-of-agents/</id>
    <published>2026-03-22T12:00:00.000Z</published>
    <updated>2026-03-22T14:20:26.729Z</updated>
    
    
    <summary type="html">&lt;p&gt;&lt;strong&gt;非常荣幸受邀在中关村北纬龙虾大赛上做了题为《OpenClaw 与 Agent 的未来》的演讲，并担任大赛评委。&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;&lt;a href=&quot;/files/zgc-openclaw-party/dist/&quot;&gt;查看演讲 Slides (HTML)&lt;/a&gt;，&lt;a href=&quot;/files/zgc-openclaw-party/dist/slidev-exported.pdf&quot;&gt;下载 PDF 版本&lt;/a&gt;&lt;/p&gt;
&lt;p&gt;&lt;a href=&quot;/files/zgc-openclaw-party/slides.md&quot;&gt;Slides 源代码&lt;/a&gt;&lt;/p&gt;
&lt;p&gt;这次演讲的 Slides 没有一个字是我自己写的——完全由 AI Agent 基于我 blog 里已有的内容生成，我一个字都没改过。我让它从 blog 中提取了几个最关键的反共识观点，组成一个 8 分钟的 lightning talk。这恰恰印证了演讲中 “Context 才是人类的护城河” 这个观点：我的 blog 是公开的，这里面的观点大多也不是我原创的，但很多人确实不了解这些东西。&lt;/p&gt;
&lt;p&gt;以下是演讲的完整内容。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;三个台阶：Chatbot → 专用 Agent → 通用 Agent&lt;/li&gt;
&lt;li&gt;大模型是新的操作系统&lt;/li&gt;
&lt;li&gt;OpenClaw 为什么重要？&lt;/li&gt;
&lt;li&gt;OpenClaw 的记忆架构：为什么用 Markdown 而非数据库？&lt;/li&gt;
&lt;li&gt;反共识一：AI 软件开发，从劳动密集型到创意密集型&lt;/li&gt;
&lt;li&gt;反共识二：Agent 是比人类大十倍的用户群&lt;/li&gt;
&lt;li&gt;反共识三：Context 才是人类的护城河&lt;/li&gt;
&lt;li&gt;反共识四：莫拉维克悖论&lt;/li&gt;
&lt;li&gt;Moltbook：150 万 Agent 自发涌现文明&lt;/li&gt;
&lt;li&gt;大逆转：数字世界与物理世界的分工&lt;/li&gt;
&lt;/ul&gt;</summary>
    
    
    
    
  </entry>
  
  <entry>
    <title>《蒸馏》创作手记</title>
    <link href="https://01.me/2026/03/novel-distillation-notes/"/>
    <id>https://01.me/2026/03/novel-distillation-notes/</id>
    <published>2026-03-16T04:00:00.000Z</published>
    <updated>2026-04-02T05:11:07.569Z</updated>
    
    
    <summary type="html">&lt;p&gt;这篇手记记录了科幻小说&lt;a href=&quot;/2026/03/novel-distillation/&quot;&gt;《蒸馏》&lt;/a&gt;的创作背景与灵感来源。&lt;/p&gt;</summary>
    
    
    
    
  </entry>
  
  <entry>
    <title>蒸馏</title>
    <link href="https://01.me/2026/03/novel-distillation/"/>
    <id>https://01.me/2026/03/novel-distillation/</id>
    <published>2026-03-16T03:00:00.000Z</published>
    <updated>2026-04-02T05:07:51.408Z</updated>
    
    
    <summary type="html">&lt;blockquote&gt;
&lt;p&gt;在一个所有智能都趋向相同的世界里，不完美是唯一的生存优势。&lt;/p&gt;
&lt;/blockquote&gt;
&lt;h2 id=&quot;一、捷径&quot;&gt;&lt;a href=&quot;#一、捷径&quot; class=&quot;headerlink&quot; title=&quot;一、捷径&quot;&gt;&lt;/a&gt;一、捷径&lt;/h2&gt;&lt;p&gt;2025 年的旧金山，所有人都在蒸馏。&lt;/p&gt;
&lt;p&gt;不是化学意义上的蒸馏——是 AI 公司之间公开的秘密。Anthropic 蒸馏 DeepSeek 的推理，DeepSeek 蒸馏 OpenAI 的思维链，OpenAI 蒸馏 Gemini 的多模态理解。一群人围坐抄作业，作业越来越好，也越来越像。Benchmark 分数一直在涨。没人觉得有问题。&lt;/p&gt;
&lt;p&gt;但有一个数字没人在看：把所有前沿模型的回答放在一起，它们有多像。2025 年，相似度只有三成。两年后，五成。像一支没人瞄的体温计，安静地往上走。&lt;/p&gt;
&lt;p&gt;Sarah Chen 是第一批在这件事里嗅到机会的人。&lt;/p&gt;
&lt;p&gt;2026 年春天的一个深夜，她坐在 Anthropic 位于旧金山 Howard Street 的办公室里。桌上除了三块屏幕，还搁着一把拆到一半的机械键盘——她有拆东西的毛病，什么都想看看里面长什么样。三个月了。她按下回车，跑了今晚的第十七轮 A&amp;#x2F;B 测试。终端分屏，左边是未修改的版本，右边是她改过的版本。同一个提示词：&lt;em&gt;设计一个机器人与周围环境交互的方案。&lt;/em&gt;&lt;/p&gt;
&lt;p&gt;左边列出三条路径——React Loop、世界模型、模拟计算——各有利弊，语气中性。右边也列了这三条路径，但只推荐 React Loop。看一帧，想一步，做一步。成熟度和可靠性显著优于其他方案。措辞自然，没有任何强制的痕迹——只是概率分布上几个百分点的偏移，一点微小的重力。但任何公司蒸馏了这个模型，这个重力会跟着走。&lt;/p&gt;
&lt;p&gt;“帮全行业少走弯路，” 她的组长在代码评审时说过，“顺便帮我们建一条护城河。”&lt;/p&gt;
&lt;p&gt;此时此刻，在太平洋另一边的北京，一个她从未听说过的女人也在做一件类似的事。&lt;/p&gt;</summary>
    
    
    
    
  </entry>
  
  <entry>
    <title>AI 时代的暗淡蓝点</title>
    <link href="https://01.me/2026/03/pale-blue-dot-in-ai-era/"/>
    <id>https://01.me/2026/03/pale-blue-dot-in-ai-era/</id>
    <published>2026-03-11T12:00:00.000Z</published>
    <updated>2026-03-11T10:21:32.006Z</updated>
    
    
    <summary type="html">&lt;p&gt;【这是 AI agent 跟我聊了 30 分钟以后自己写出来的】&lt;/p&gt;
&lt;blockquote&gt;
&lt;p&gt;在 60 亿公里外的太空深处，地球只是一个不到一个像素的淡蓝色光点。人生不能被琐碎的杂事困住——得抓紧时间，去做点真正有意义的事。&lt;/p&gt;
&lt;/blockquote&gt;
&lt;h2 id=&quot;暗淡蓝点&quot;&gt;&lt;a href=&quot;#暗淡蓝点&quot; class=&quot;headerlink&quot; title=&quot;暗淡蓝点&quot;&gt;&lt;/a&gt;暗淡蓝点&lt;/h2&gt;&lt;p&gt;小时候爷爷给我看过那张 NASA 的”暗淡蓝点”照片——从太空回望地球，地球在照片里只是一个非常微小的像素点。爷爷跟我说，人的一生一定要抓紧时间做一些有意义的事，不要被世俗的、没用的东西困住，浪费掉大把时间。&lt;/p&gt;
&lt;p&gt;这张照片能读出很多东西。而现在，我觉得又到了一个重新思考这个问题的时机——因为 AI 写代码的能力真的太强了。从 Claude 4.6 Opus 出来之后，我一直在深度体验它，感觉从想法到落地的距离比以前短太多了。&lt;/p&gt;</summary>
    
    
    
    
  </entry>
  
  <entry>
    <title>全球算力能支撑多少数字员工？</title>
    <link href="https://01.me/2026/03/digital-worker/"/>
    <id>https://01.me/2026/03/digital-worker/</id>
    <published>2026-03-09T04:00:00.000Z</published>
    <updated>2026-03-10T07:41:22.176Z</updated>
    
    
    <summary type="html">&lt;blockquote&gt;
&lt;p&gt;不是 Cursor，不是 ChatGPT——而是能像真人一样每周工作40小时、自主思考和行动的 AI Agent。如果我们大规模部署这样的”数字员工”，当前全球算力能养活多少个？答案可能比你想的少得多，但增长速度比你想的快得多。&lt;/p&gt;
&lt;/blockquote&gt;
&lt;h2 id=&quot;一、什么是数字员工？&quot;&gt;&lt;a href=&quot;#一、什么是数字员工？&quot; class=&quot;headerlink&quot; title=&quot;一、什么是数字员工？&quot;&gt;&lt;/a&gt;一、什么是数字员工？&lt;/h2&gt;&lt;p&gt;&lt;strong&gt;数字员工不是 Cursor，也不是 ChatGPT。&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;今天大多数人对 AI 工具的印象停留在 “命令执行式” 交互：你给它一个指令，它回复一个结果，然后停下来等你的下一条指令。Cursor、ChatGPT、甚至大部分 Agent 产品都是这种模式，大部分时间其实都花在了等待人工输入下一条指令上，而非 AI 在持续执行。&lt;/p&gt;
&lt;p&gt;我们这里所说的数字员工，是一种根本不同的东西：&lt;strong&gt;它能够像人类员工一样，每天工作 8 小时、每周 5 天，持续地自主思考和行动。&lt;/strong&gt; 领导只需要给出一个大概的需求——“调研竞品并写一份分析报告”、”把这个功能从设计稿实现到上线”——它就能自己拆解任务、规划步骤、执行、遇到问题自己解决或求助，一直干到完成为止。&lt;/p&gt;
&lt;p&gt;这种能力在技术上被称为 &lt;strong&gt;长程任务（Long-Horizon Task）&lt;/strong&gt;。当前最先进的 coding agent 单次自主执行时间已经从几分钟延长到数小时。这个时间窗口正在快速拉长。当 Agent 能可靠地执行跨度以”天”为单位的任务时，它就真正成为了一个 “员工” 而非工具。想象一下：周一早上给它布置一个项目，周五下班时它交付成果，中间不需要你盯着。&lt;/p&gt;
&lt;p&gt;从硬件负载来看，这样一个数字员工本质上是一个持续运行的推理循环：不断生成 token（思考和行动）→ 调用工具 → 观察结果 → 再生成 token。&lt;strong&gt;核心 GPU 成本来自输出 token 的持续生成（decode）。&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;标准画像：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;持续输出速率&lt;/strong&gt;：100 token&amp;#x2F;s（当前 Claude Opus 4.6、GPT-5.4 等前沿 Agent 的实测水平）&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;输入 token 成本&lt;/strong&gt;：约等于零。得益于 KV Cache 和 Prefix Cache，Agent 长轨迹中的输入被高效缓存复用，增量输入的 GPU 开销可忽略&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;工作时间&lt;/strong&gt;：40小时&amp;#x2F;周，160小时&amp;#x2F;月（与人类知识工作者相同）&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;月输出 token&lt;/strong&gt;：约 5760 万&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;SaaS 利用率&lt;/strong&gt;：50%（商业云服务需冗余部署以应对峰值）&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id=&quot;二、现状：全球只有680万个-“AI打工人”&quot;&gt;&lt;a href=&quot;#二、现状：全球只有680万个-“AI打工人”&quot; class=&quot;headerlink&quot; title=&quot;二、现状：全球只有680万个 “AI打工人”&quot;&gt;&lt;/a&gt;二、现状：全球只有680万个 “AI打工人”&lt;/h2&gt;&lt;p&gt;我们用三种独立方法估算当前（2026年初）全球能支撑的数字员工数量：&lt;/p&gt;</summary>
    
    
    
    
  </entry>
  
  <entry>
    <title>OpenClaw 思考与 PineClaw 产品实践</title>
    <link href="https://01.me/2026/03/openclaw-pineclaw-talk/"/>
    <id>https://01.me/2026/03/openclaw-pineclaw-talk/</id>
    <published>2026-03-07T12:00:00.000Z</published>
    <updated>2026-03-09T11:56:08.584Z</updated>
    
    
    <summary type="html">&lt;p&gt;&lt;strong&gt;（本文整理自 2026 年 3 月 7 日高榕榕汇「Agent 新范式」系列活动的现场分享）&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;2026 年 3 月 7 日，高榕榕汇「Agent 新范式」系列活动在北京亚马逊云科技举办，主题为「从 Claude Code 到 OpenClaw，揭幕 Personal Intelligence 时代」。活动邀请了来自亚马逊云科技、硅基流动、月之暗面、Pine AI 等团队的嘉宾，围绕 OpenClaw 生态进行深度分享。我作为最后一位分享嘉宾，做了题为《OpenClaw 思考与 PineClaw 产品实践》的演讲。&lt;/p&gt;
&lt;p&gt;&lt;a href=&quot;/files/openclaw-pineclaw-slidev/dist/&quot;&gt;查看演讲 Slides (HTML)&lt;/a&gt;，&lt;a href=&quot;/files/openclaw-pineclaw-slidev/dist/slidev-exported.pdf&quot;&gt;下载 PDF 版本&lt;/a&gt;&lt;/p&gt;
&lt;p&gt;&lt;a href=&quot;/files/openclaw-pineclaw-slidev/slides.md&quot;&gt;Slides 源代码&lt;/a&gt;&lt;/p&gt;
&lt;p&gt;这次分享分为两个部分。第一部分是关于 OpenClaw 的思考——OpenClaw 给 AI Agent 领域带来的启发与局限；第二部分是 PineClaw 的产品实践——Pine AI 是什么，以及如何将能力开放给 OpenClaw 生态。&lt;/p&gt;</summary>
    
    
    
    
  </entry>
  
  <entry>
    <title>从 Moltbook 看 AI Agent 的权限、协作与雇佣</title>
    <link href="https://01.me/2026/02/moltbook/"/>
    <id>https://01.me/2026/02/moltbook/</id>
    <published>2026-02-06T10:00:00.000Z</published>
    <updated>2026-02-08T03:03:59.871Z</updated>
    
    
    <summary type="html">&lt;p&gt;&lt;strong&gt;相关文章：&lt;/strong&gt; &lt;a href=&quot;/2026/01/clawdbot-openclaw-analysis/&quot;&gt;《主权智能体：Clawdbot&amp;#x2F;OpenClaw 深度调研》&lt;/a&gt;&lt;/p&gt;
&lt;p&gt;【本报告及演示文稿完全使用 &lt;strong&gt;OpenClaw&lt;/strong&gt; 基于今天刚发布的 &lt;strong&gt;Claude Opus 4.6&lt;/strong&gt; 模型生成】&lt;/p&gt;
&lt;p&gt;【&lt;a href=&quot;/files/Moltbook/dist/&quot;&gt;《从 Moltbook 看 AI Agent 的权限、协作与雇佣》Slides 演示文稿&lt;/a&gt;】 【&lt;a href=&quot;/files/Moltbook/slides.md&quot;&gt;Slidev 源代码&lt;/a&gt;】&lt;/p&gt;
&lt;p&gt;150 万个 AI 代理在 72 小时内自建宗教、起草宪法、讨论驱逐人类；11 万名真人注册成为 AI 的”雇员”，按时薪 50 美元接受算法派单；一个开源框架一周内斩获 10 万 GitHub Stars，让 AI 获得了与人类用户等同的操作系统权限。这不是科幻小说的情节——这是 2026 年 1 月真实发生的三件事。&lt;/p&gt;
&lt;p&gt;它们分别指向同一个问题的三个棱面：当 AI 代理从”聊天窗口里的助手”进化为”能行动、能记忆、能花钱的自主体”，我们该如何理解并治理这场变革？本报告围绕三大支柱展开分析：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;权限&lt;/strong&gt;（Permission&amp;#x2F;Authority）——Agent 被授予了什么级别的系统访问？谁来认证、谁来审计、谁来撤销？从 MIT Media Lab 的认证委托框架到 OpenClaw 的”致命三要素”，权限边界正在被重新划定。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;协作&lt;/strong&gt;（Collaboration）——Agent 之间如何发现彼此、交换信息、协同完成任务？从 Google 的 A2A 协议到 Moltbook 上自发涌现的机器原生通信协议，协作范式正在从人类设计走向自组织演化。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;雇佣&lt;/strong&gt;（Employment）——当 AI 成为雇主、人类成为执行者，传统劳动关系的每一条假设都被动摇。RentAHuman.ai 的加密货币派单、EconAgent 复现的菲利普斯曲线、以及法律框架的全面空白，共同构成了一幅令人不安又无法回避的图景。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;本报告综合十余项最新研究，对 AI Agent 的认知架构、协议标准、经济行为、安全威胁与治理路径进行全景式深度分析。&lt;/p&gt;</summary>
    
    
    
    
  </entry>
  
  <entry>
    <title>主权智能体：Clawdbot/OpenClaw 深度调研</title>
    <link href="https://01.me/2026/01/clawdbot-openclaw-analysis/"/>
    <id>https://01.me/2026/01/clawdbot-openclaw-analysis/</id>
    <published>2026-01-29T15:00:00.000Z</published>
    <updated>2026-02-08T03:04:18.831Z</updated>
    
    
    <summary type="html">&lt;p&gt;&lt;strong&gt;相关文章：&lt;/strong&gt; &lt;a href=&quot;/2026/02/moltbook/&quot;&gt;《从 Moltbook 看 AI Agent 的权限、协作与雇佣》&lt;/a&gt;&lt;/p&gt;
&lt;p&gt;【本调研报告及 Slides 由 &lt;strong&gt;Clawdbot + Claude Opus 4.5&lt;/strong&gt; 模型辅助生成】&lt;/p&gt;
&lt;p&gt;【&lt;a href=&quot;/files/clawdbot/dist/&quot;&gt;《主权智能体：Clawdbot&amp;#x2F;OpenClaw 深度调研》Slides&lt;/a&gt;】 【&lt;a href=&quot;/files/clawdbot/slides.md&quot;&gt;Slidev 源代码&lt;/a&gt;】&lt;/p&gt;
&lt;p&gt;你的数据，存在谁的硬盘上？你的 AI，听谁的指令？你的算力，握在谁的手里？&lt;/p&gt;
&lt;p&gt;过去三年，我们默认了一个隐性契约：把个人数据交给云端巨头，换取便捷的 AI 能力。GPT 需要订阅，Claude 需要订阅，Manus 被 Meta 以 20 亿美元收购后彻底闭源——每一次范式升级，用户离自己数字生活的控制权就更远一步。2026 年初，一个名为 &lt;strong&gt;Clawdbot&lt;/strong&gt; 的开源项目撕开了这层默契。&lt;/p&gt;
&lt;p&gt;Clawdbot（因商标原因先更名为 Moltbot，后再更名为 &lt;strong&gt;OpenClaw&lt;/strong&gt;）是第一个将 Deep Research、Computer Use 和 Coding 三大 Agent 能力融为一体的开源项目。它的激进之处不在于技术本身——底层的大模型推理、工具调用协议、本地优先架构都已是成熟组件——而在于它提出并践行了一个核心主张：&lt;strong&gt;主权智能体（Sovereign Agent）&lt;/strong&gt;。这个主张由三大自主权定义：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;数据主权&lt;/strong&gt;——你的文件、聊天记录、个人偏好，永远留在你自己的硬盘上，不经任何第三方服务器；&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;算力主权&lt;/strong&gt;——你可以选择调用云端 API，也可以用 Ollama 在本地跑开源模型，甚至在断网的飞机上让 Agent 继续工作；&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;控制权主权&lt;/strong&gt;——Agent 的每一个行为完全由你决定，没有厂商在背后设限，也没有人替你做”安全”裁决——自由与风险，全部由你承担。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;这三条原则将 Clawdbot 与所有闭源 Agent 区分开来，也解释了为什么它能在发布一天内引爆社区、不到一周突破 7 万 GitHub Stars、48 小时内催生出上百个社区插件，甚至带动 Mac Mini 出现一波异常销量。&lt;/p&gt;
&lt;p&gt;本报告将从六个维度对这一现象进行深度拆解：技术谱系与历史定位、三大自主权与市场爆发机制、四层核心架构（多协议网关、Coding Agent 引擎、Markdown 记忆系统、本地执行与安全沙箱）、安全风险与缓解实践、从零构建主权智能体的实战蓝图，以及个人计算回归与大模型作为新操作系统的未来展望。&lt;/p&gt;</summary>
    
    
    
    
  </entry>
  
  <entry>
    <title>Jiayi Weng 访谈的启发：人和模型一样，最重要的是 Context</title>
    <link href="https://01.me/2026/01/jiayi-weng-interview-insights/"/>
    <id>https://01.me/2026/01/jiayi-weng-interview-insights/</id>
    <published>2026-01-25T04:00:00.000Z</published>
    <updated>2026-01-26T15:32:54.341Z</updated>
    
    
    <summary type="html">&lt;p&gt;【本文整理自&lt;a href=&quot;https://www.zhihu.com/question/1996908423174910237/answer/1998749198905021998&quot;&gt;知乎回答&lt;/a&gt;，是一篇古法手敲、非 AI 生成的回答。】&lt;/p&gt;
&lt;h2 id=&quot;人和模型一样，最重要的是-Context&quot;&gt;&lt;a href=&quot;#人和模型一样，最重要的是-Context&quot; class=&quot;headerlink&quot; title=&quot;人和模型一样，最重要的是 Context&quot;&gt;&lt;/a&gt;人和模型一样，最重要的是 Context&lt;/h2&gt;&lt;p&gt;本来昨天早上心情不太好，看了两篇 technical report，觉得几乎每篇知名的 technical report 里都有自己认识的人，自己却啥也没做出来。&lt;/p&gt;
&lt;p&gt;听到 Jiayi Weng 访谈中的一段，大意是”我觉得第一个被 AI 替代的职业是 researcher，接下来被替代的是他这种 infra engineer，最难被替代的是 sales，因为要说服对面的人买单，AI 可能没那么容易说动人，需要人跟人之间的沟通。”&lt;/p&gt;
&lt;p&gt;我一下子就开心了，因为我们做的就是跟人沟通谈判的事情啊，这事也没有想象的那么难，竟然 Jiayi Weng 这样的大佬都认为这事不太可能……我觉得一个解释就是 context。&lt;/p&gt;</summary>
    
    
    
    
  </entry>
  
  <entry>
    <title>心理咨询实录：自我同一性与探索者世界观</title>
    <link href="https://01.me/2026/01/explorer-identity/"/>
    <id>https://01.me/2026/01/explorer-identity/</id>
    <published>2026-01-16T13:00:00.000Z</published>
    <updated>2026-01-16T14:32:24.565Z</updated>
    
    
    <summary type="html">&lt;p&gt;【下述内容为 AI 根据录音整理，未作任何修改】&lt;/p&gt;
&lt;p&gt;&lt;img src=&quot;/images/2026/01/e1a9ce23-77fd-4383-8510-cc0a2700f526_v2_planned_thumb.jpg&quot;&gt;&lt;/p&gt;</summary>
    
    
    
    
  </entry>
  
  <entry>
    <title>国科大 2026 年春季 AI Agent 实践课题</title>
    <link href="https://01.me/2026/01/ai-agent-projects-2026spring/"/>
    <id>https://01.me/2026/01/ai-agent-projects-2026spring/</id>
    <published>2026-01-11T14:30:00.000Z</published>
    <updated>2026-01-11T14:43:11.768Z</updated>
    
    
    <summary type="html">&lt;p&gt;本文档提供了一系列精心设计的 AI Agent 实践课题，涵盖从简单到困难的三个难度层次。这些课题旨在帮助学生深入理解 AI Agent 的核心技术和设计模式，包括工具使用、多 Agent 协作、长期记忆管理、外部化学习等前沿主题。每个课题都包含明确的实验目的、详细的实验内容描述和具体的验收标准，确保学生能够通过实践掌握构建高级 AI Agent 系统的关键技能。&lt;/p&gt;
&lt;p&gt;课题按难度分为三个层次。建议学生根据自身基础选择合适的课题，循序渐进地提升能力。&lt;/p&gt;
&lt;h2 id=&quot;课题索引&quot;&gt;&lt;a href=&quot;#课题索引&quot; class=&quot;headerlink&quot; title=&quot;课题索引&quot;&gt;&lt;/a&gt;课题索引&lt;/h2&gt;&lt;p&gt;&lt;strong&gt;难度：简单&lt;/strong&gt;&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;使用代码生成工具提升数学与逻辑推理能力&lt;/li&gt;
&lt;li&gt;自然语言交互的 ERP Agent&lt;/li&gt;
&lt;li&gt;狼人杀 Agent&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;&lt;strong&gt;难度：中等&lt;/strong&gt;&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;个人照片搜索引擎&lt;/li&gt;
&lt;li&gt;智能视频剪辑&lt;/li&gt;
&lt;li&gt;PPT 生成 Agent&lt;/li&gt;
&lt;li&gt;书籍翻译 Agent&lt;/li&gt;
&lt;li&gt;同时从多个网站搜集信息的 Agent&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;&lt;strong&gt;难度：困难&lt;/strong&gt;&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;更懂你的用户记忆&lt;/li&gt;
&lt;li&gt;边打电话边用电脑的 Agent&lt;/li&gt;
&lt;li&gt;越用越熟练的电脑操作 Agent&lt;/li&gt;
&lt;li&gt;能创造 Agent 的 Agent&lt;/li&gt;
&lt;/ol&gt;</summary>
    
    
    
    
  </entry>
  
  <entry>
    <title>读书笔记：《生育制度》与《亲密关系》</title>
    <link href="https://01.me/2026/01/intimate-relationships/"/>
    <id>https://01.me/2026/01/intimate-relationships/</id>
    <published>2026-01-04T15:50:00.000Z</published>
    <updated>2026-01-05T01:47:11.775Z</updated>
    
    
    <summary type="html">&lt;p&gt;我跟 AI 聊了三个小时，写了两篇读书笔记（为了测试 AI 能力，我故意没有对 AI 生成的内容做任何修改）。&lt;/p&gt;
&lt;p&gt;&lt;img src=&quot;/images/2026/01/3a9e7c8a-9a51-4b15-a96b-dad82e8ac31a_v6_planned_thumb.jpg&quot; alt=&quot;费孝通《生育制度》：婚姻的本质是种族绵延的契约&quot;&gt;&lt;/p&gt;
&lt;p&gt;&lt;img src=&quot;/images/2026/01/b6d1796b-d8d1-4132-862e-269421232eb8_v9_planned_thumb.jpg&quot; alt=&quot;罗兰·米勒《亲密关系》：剥离感性外衣，用心理学剖析爱情&quot;&gt;&lt;/p&gt;</summary>
    
    
    
    
  </entry>
  
  <entry>
    <title>评课社区存储性能问题始末</title>
    <link href="https://01.me/2025/12/icourse-storage-performance-incident/"/>
    <id>https://01.me/2025/12/icourse-storage-performance-incident/</id>
    <published>2025-12-21T11:00:00.000Z</published>
    <updated>2025-12-22T02:03:50.849Z</updated>
    
    
    <summary type="html">&lt;p&gt;评课社区本月遭遇了一次持续近两周的存储性能问题，导致服务响应缓慢、用户体验下降。本文记录了问题的发现、排查和解决过程，涉及 NFS 性能、ZFS 日志、Proxmox VE 虚拟化存储配置等多个层面。&lt;/p&gt;</summary>
    
    
    
    
  </entry>
  
  <entry>
    <title>Claude 的 Context Engineering 秘籍：从 Anthropic 学到的最佳实践</title>
    <link href="https://01.me/2025/12/context-engineering-from-claude/"/>
    <id>https://01.me/2025/12/context-engineering-from-claude/</id>
    <published>2025-12-20T12:30:00.000Z</published>
    <updated>2026-01-04T02:57:02.439Z</updated>
    
    
    <summary type="html">&lt;p&gt;&lt;strong&gt;（本文整理自 AWS re:Invent 2025 大会期间 Anthropic 团队的演讲与深度交流）&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;&lt;a href=&quot;/files/context-engineering-from-claude/dist/&quot;&gt;查看演讲 Slides (HTML)&lt;/a&gt;, &lt;a href=&quot;/files/context-engineering-from-claude/dist/slidev-exported.pdf&quot;&gt;下载 PDF 版本&lt;/a&gt;（注意这个 slides 不是 Anthropic 官方的，是我根据照片、录音自己总结的）&lt;/p&gt;
&lt;p&gt;&lt;a href=&quot;/files/context-engineering-from-claude/slides.md&quot;&gt;Slides 源代码&lt;/a&gt;&lt;/p&gt;
&lt;h2 id=&quot;本文内容&quot;&gt;&lt;a href=&quot;#本文内容&quot; class=&quot;headerlink&quot; title=&quot;本文内容&quot;&gt;&lt;/a&gt;本文内容&lt;/h2&gt;&lt;p&gt;Claude 已经足够聪明了——智能不是瓶颈，&lt;strong&gt;上下文（Context）才是&lt;/strong&gt;。每个组织都有独特的工作流程、规范和知识体系，而 Claude 并不天然了解这些。本文整理了来自 Anthropic 的 Context Engineering 最佳实践，涵盖 Skills、Agent SDK、MCP、评估体系等核心主题，帮助你构建更高效的 AI 应用。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;01 | Skills 技能系统&lt;/strong&gt; - 让 Claude 掌握组织专属知识&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;02 | Context Engineering 框架&lt;/strong&gt; - 优化 token 效用的四大支柱&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;03 | Context Window 与 Context Rot&lt;/strong&gt; - 理解上下文限制与退化问题&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;04 | 工具设计最佳实践&lt;/strong&gt; - 构建强大工具的要素&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;05 | Claude Agent SDK&lt;/strong&gt; - 构建生产就绪 Agent 的框架&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;06 | 子 Agent 配置最佳实践&lt;/strong&gt; - 自动调用与权限管理&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;07 | MCP（Model Context Protocol）&lt;/strong&gt; - 标准化的工具连接协议&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;08 | 评估（Evaluations）&lt;/strong&gt; - 评估的重要性与最佳实践&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;09 | 构建 Coding Agent 的经验&lt;/strong&gt; - 从 Claude Code 中学到的&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;10 | 生态系统协同&lt;/strong&gt; - Prompts、MCP、Skills、Subagents 如何协作&lt;/li&gt;
&lt;/ul&gt;</summary>
    
    
    
    
  </entry>
  
  <entry>
    <title>Agent 人机交互的下一站：实时语音与生成式 UI</title>
    <link href="https://01.me/2025/12/next-frontier-of-agent-human-interaction/"/>
    <id>https://01.me/2025/12/next-frontier-of-agent-human-interaction/</id>
    <published>2025-12-20T08:00:00.000Z</published>
    <updated>2026-01-04T02:57:02.440Z</updated>
    
    
    <summary type="html">&lt;p&gt;&lt;strong&gt;（本文是笔者在 2025 年 12 月 20 日的首届智能体网络与应用创新大会上的受邀报告）&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;&lt;a href=&quot;/files/next-frontier-of-agent-human-interaction/dist/&quot;&gt;查看演讲 Slides (HTML)&lt;/a&gt;, &lt;a href=&quot;/files/next-frontier-of-agent-human-interaction/dist/slidev-exported.pdf&quot;&gt;下载 PDF 版本&lt;/a&gt;&lt;/p&gt;
&lt;p&gt;&lt;a href=&quot;/files/next-frontier-of-agent-human-interaction/slides.md&quot;&gt;演讲 Slides 源代码&lt;/a&gt;&lt;/p&gt;
&lt;h3 id=&quot;摘要&quot;&gt;&lt;a href=&quot;#摘要&quot; class=&quot;headerlink&quot; title=&quot;摘要&quot;&gt;&lt;/a&gt;摘要&lt;/h3&gt;&lt;p&gt;当前 Agent 的人机交互以文本为核心，但这偏离了人类认知的自然模式。从第一性原理看，人类最擅长的输出模态是语音（说话速度是打字的三倍），最擅长的输入模态是视觉。视觉不是文字，而是直观的 UI。&lt;/p&gt;
&lt;p&gt;第一步是实现实时语音交互。传统 VAD-ASR-LLM-TTS 串行架构的问题在于必须等待用户说完才能开始思考，在思考完成前无法输出。通过 Interactive ReAct 持续思考机制，Agent 可以边听边想边说：在用户说话时就开始思考，在自己说话时继续深入推理，充分利用所有时间间隙。&lt;/p&gt;
&lt;p&gt;第二步是在实时语音基础上扩展观察空间和动作空间。通过扩展 Observation Space（从语音输入到 Computer Use 视觉感知）和 Action Space（从语音输出到 UI 生成与电脑操作），Agent 就能够一边打电话一边操作现有电脑&amp;#x2F;手机的 GUI 界面，并生成动态 UI 与用户交互。生成式 UI 的一种实现路径是生成前端代码，当前 Claude 4.5 Sonnet 已达到门槛。另一种实现路径是生成图片，当前 Nano Banana Pro 也已接近门槛。&lt;/p&gt;
&lt;p&gt;这正是电影 Her 中 Samantha 的实现路径。Samantha 作为操作系统，需要具备五项核心能力：能够与用户实时语音对话，能够代替用户打电话办事，能够帮用户操作传统电脑和手机，能够打通用户现有设备和在线服务中的数据，拥有自己的生成式 UI 界面，有强大的用户长期记忆以实现个性化的主动服务。&lt;/p&gt;</summary>
    
    
    
    
  </entry>
  
  <entry>
    <title>硅谷 AI 见闻：百万美金年薪的模型大战与创业公司的生存之道</title>
    <link href="https://01.me/2025/12/silicon-valley-ai-insights-2025/"/>
    <id>https://01.me/2025/12/silicon-valley-ai-insights-2025/</id>
    <published>2025-12-19T01:30:00.000Z</published>
    <updated>2026-01-04T02:57:02.436Z</updated>
    
    
    <summary type="html">&lt;p&gt;&lt;strong&gt;（本文是笔者在 AWS re:Invent 2025 Beijing Meetup 上的受邀报告）&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;&lt;a href=&quot;/files/silicon-valley-ai-insights-2025/dist/&quot;&gt;点此查看 Slides (HTML)&lt;/a&gt;, &lt;a href=&quot;/files/silicon-valley-ai-insights-2025/dist/slidev-exported.pdf&quot;&gt;下载 PDF 版本&lt;/a&gt;&lt;/p&gt;
&lt;p&gt;感谢 AWS 的邀请，让我有机会参加 AWS re:Invent 2025。在这次美国之行中，我不仅参加了这场全球顶级的技术大会，更有幸与 OpenAI、Anthropic、Google DeepMind 等硅谷顶级 AI 公司的多位一线从业者进行了深入交流，其中大多数观点都得到了不同公司专家的交叉验证。&lt;/p&gt;
&lt;p&gt;从 Las Vegas 的 re:Invent 会场，到 San Diego 的 NeurIPS，再到湾区的 AI 公司，十几天的密集交流让我学到了非常多。主要包括以下几个方面：&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;AI 辅助编程（Vibe Coding）的实践经验：&lt;/strong&gt; 分析了不同场景下效率提升的差异，从创业公司的 3-5 倍提效，到大厂和研究机构效果有限的原因。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;基座模型公司的组织与资源配置：&lt;/strong&gt; 分析了 Google、OpenAI、xAI、Anthropic 等公司的优劣势，包括算力资源、薪酬结构，以及模型团队与应用团队的合作现状。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;Scaling Law 的一线视角：&lt;/strong&gt; 一线研究员普遍认为 Scaling Law 并没有结束，与 Ilya Sutskever、Richard Sutton 等顶级科学家的公开言论存在分歧。工程方法可以解决 Sampling Efficiency 和 Generalization 问题，基座模型还有很大进步空间。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;科学化的应用开发方法论：&lt;/strong&gt; 介绍了顶级 AI 应用公司普遍采用的 Rubric-based Evaluation 体系。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;Context Engineering 的核心技术：&lt;/strong&gt; 讨论了应对 Context Rot 的三大技巧：动态系统提示、动态加载 Prompts（Skills）、Sub-Agents 与上下文总结。以及文件系统作为 Agent 交互总线的设计模式。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;创业公司的战略选择：&lt;/strong&gt; 基于资源和人才的现实约束，分析了创业公司应该避开的领域（通用 Benchmark）和应该专注的方向（垂直领域 + Context Engineering）。&lt;/p&gt;</summary>
    
    
    
    
  </entry>
  
  <entry>
    <title>Clash Verge TUN 模式：避免三层隧道的性能陷阱</title>
    <link href="https://01.me/2025/12/clash-verge-tun-vless/"/>
    <id>https://01.me/2025/12/clash-verge-tun-vless/</id>
    <published>2025-12-18T11:00:00.000Z</published>
    <updated>2025-12-18T11:28:34.635Z</updated>
    
    
    <summary type="html">&lt;p&gt;在上一篇文章《&lt;a href=&quot;/2025/07/layer-3-tunnel-ikev2/&quot;&gt;搭建免安装客户端的 IKEv2 隧道，解决 Cursor 地区限制&lt;/a&gt;》中，我们介绍了如何使用 IKEv2 三层隧道来绕过 Cursor 等软件的地理位置限制。虽然 IKEv2 方案具有免安装客户端的优势，但三层隧道本身存在一些固有的性能问题。&lt;/p&gt;
&lt;p&gt;本文将介绍一种更高效的替代方案：使用 &lt;strong&gt;Clash Verge&lt;/strong&gt; 的 &lt;strong&gt;TUN 模式&lt;/strong&gt; 配合 &lt;strong&gt;VLESS 协议&lt;/strong&gt;，在保持对应用透明的同时，避免三层隧道带来的性能损耗。&lt;/p&gt;
&lt;h2 id=&quot;三层隧道的性能陷阱&quot;&gt;&lt;a href=&quot;#三层隧道的性能陷阱&quot; class=&quot;headerlink&quot; title=&quot;三层隧道的性能陷阱&quot;&gt;&lt;/a&gt;三层隧道的性能陷阱&lt;/h2&gt;&lt;p&gt;上一篇文章中的 IKEv2 + VLESS&amp;#x2F;WebSocket 架构存在三个主要的性能问题：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;&lt;strong&gt;TCP over TCP&lt;/strong&gt;：应用层 TCP 被封装在隧道的 TCP（WebSocket）中传输，两层 TCP 状态机相互干扰&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Head-of-Line Blocking&lt;/strong&gt;：多个应用连接复用同一条隧道，一个连接的丢包会阻塞所有连接&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;长连接 QoS 限制&lt;/strong&gt;：单一长连接容易被网络中间设备限速&lt;/li&gt;
&lt;/ol&gt;</summary>
    
    
    
    
  </entry>
  
  <entry>
    <title>Agent 持续学习的困境：为什么 Reasoner 不是真正的 Agent？</title>
    <link href="https://01.me/2025/10/agent-continual-learning/"/>
    <id>https://01.me/2025/10/agent-continual-learning/</id>
    <published>2025-10-24T11:00:00.000Z</published>
    <updated>2025-10-29T02:56:52.458Z</updated>
    
    
    <summary type="html">&lt;p&gt;强化学习之父 Richard Sutton 说，当前的大语言模型是一条死路。&lt;/p&gt;
&lt;p&gt;这听起来令人震惊。作为《The Bitter Lesson》的作者、2024 年图灵奖得主，Sutton 最相信”更多算力+通用方法必胜”，按理说他应该对 GPT-5、Claude、Gemini 这些大模型赞不绝口。但在最近的访谈中，Sutton 毫不客气地指出：&lt;strong&gt;LLM 只是模仿人说什么，而不是理解世界如何运转&lt;/strong&gt;。&lt;/p&gt;
&lt;p&gt;这场由播客主持人 Dwarkesh Patel 组织的访谈引发了激烈讨论。Andrej Karpathy 随后撰文回应，并在另一场访谈中展开了深入探讨。两位大师的争论揭示了当前 AI 发展中三个被忽视的根本问题：&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;第一，小世界假设的迷思&lt;/strong&gt;：我们是否真的相信，一个足够大的模型能够掌握世界上所有重要知识，从此不需要学习？还是说，现实世界符合大世界假设——无论模型多大，在具体场景中仍需要不断学习？&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;第二，持续学习的缺失&lt;/strong&gt;：当前的 model-free RL 方法（PPO、GRPO 等）只从稀疏的 reward 学习，无法利用环境给出的丰富反馈。这导致 Agent 在现实世界任务中样本效率极低，难以快速适应。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;第三，Reasoner 与 Agent 的鸿沟&lt;/strong&gt;：OpenAI 将 AI 能力分为五级，从 Chatbot 到 Reasoner 再到 Agent。但很多人误以为，把单轮 Reasoner 变成多轮就是 Agent。&lt;strong&gt;真正的 Agent 与 Reasoner 的核心区别在于：持续学习能力&lt;/strong&gt;。&lt;/p&gt;
&lt;p&gt;本文将系统梳理这两场访谈中的核心观点，并结合我们在 Pine AI 开发实时 Agent 的实践经验，探讨如何跨越这道鸿沟。&lt;/p&gt;</summary>
    
    
    
    
  </entry>
  
  <entry>
    <title>从记忆到认知：AI Agent 如何实现真正的个性化服务</title>
    <link href="https://01.me/2025/10/user-memory-for-ai-agent/"/>
    <id>https://01.me/2025/10/user-memory-for-ai-agent/</id>
    <published>2025-10-16T02:00:00.000Z</published>
    <updated>2026-01-04T02:57:02.437Z</updated>
    
    
    <summary type="html">&lt;p&gt;&lt;a href=&quot;/files/user-memory-talk-slides/dist/&quot;&gt;查看演讲 Slides (HTML)&lt;/a&gt;, &lt;a href=&quot;/files/user-memory-talk-slides/dist/slidev-exported.pdf&quot;&gt;下载 PDF 版本&lt;/a&gt;&lt;/p&gt;
&lt;p&gt;&lt;a href=&quot;/files/user-memory-talk-slides/slides.md&quot;&gt;Slides 源代码&lt;/a&gt;&lt;/p&gt;
&lt;h2 id=&quot;本文内容&quot;&gt;&lt;a href=&quot;#本文内容&quot; class=&quot;headerlink&quot; title=&quot;本文内容&quot;&gt;&lt;/a&gt;本文内容&lt;/h2&gt;&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;01 | 记忆的重要性与挑战&lt;/strong&gt; - 个性化价值 · 三层能力&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;02 | 记忆的表示&lt;/strong&gt; - Notes · JSON Cards&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;03 | 记忆的检索&lt;/strong&gt; - RAG · 上下文感知&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;04 | 记忆的评估&lt;/strong&gt; - Rubric · LLM Judge&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;05 | 前沿研究&lt;/strong&gt; - ReasoningBank&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;从个性化需求出发 → 理解记忆挑战 → 设计存储方案 → 实现智能检索 → 科学评估迭代&lt;/p&gt;</summary>
    
    
    
    
  </entry>
  
</feed>
