Bojie Li (李博杰)
2025-03-14
直播主题:AI Agent,注定爆发?!
时间:2025 年 3 月 13 日 20:00——22:00
方式:极客公园微信视频号「今夜科技谈」直播(连麦)
直播嘉宾:
- 靖宇|极客公园 副主编
- 李博杰|PINE AI 首席科学家
- 宛辰|极客公园 记者
精华要点总结
- AI Agent 的核心特征是具备感知、规划和行动三大能力,能够自主收集信息、制定计划并执行动作
- 像 Manus 一样的通用 Agent 会模仿 “极客程序员” 而非普通人,具备计算思维,懂得何时使用代码和工具解决问题
- 当前 AI Agent 主要分为编译型 (如 Dify) 和解释型 (如 Manus) 两类,编译型是固定工作流,解释型是自主规划决策
- 编译型 Agent 与解释型 Agent 将长期共存,而非相互替代,不同场景有不同的最优解决方案
- 大模型存在 “100 倍成本定律”:芯片公司赚 10 倍,大模型公司再赚 10 倍,这揭示了模型定价与实际成本的巨大差距
- 基础模型是通用 Agent 能力提升的关键,人类很难想象比自己聪明 10 倍的东西,因此不要把人类的思维方式强加给 AI
- Manus 强调的 “Less Structure, More Intelligence” 与经典的《The Bitter Lesson》异曲同工,人类强加给 AI 的结构限制越少,AI 的能力上限就越高
- Claude 3.7 Sonnet 等新一代模型在工具调用和编程能力上有重大突破,为 Agent 发展奠定基础
- DeepSeek R1 的开源使得 RL (强化学习) 技术更易获取,降低了开发高质量 Agent 的门槛
- RL 训练是构建竞争壁垒的重要手段,可以将行业经验和专业知识转化为模型能力
- RL 训练所需的算力门槛没有想象的高,小模型经过 RL 训练后在一些垂直领域的能力可以超过大模型
- 多智能体架构不适合所有场景,在软件开发等领域可能会复制人类组织中的低效协作模式
- AI 编程工具在大型软件工程项目中也可以发挥很大作用,但需要高质量的代码工程基础,包括完善的文档、测试用例和标准化的接口
- 屎山代码 AI 编程工具难起作用,原因与新入职的实习生难以接手一样,都是代码中有太多没有文档化的 tribal knowledge
- Agent 技术的发展将推动软件工程实践的改进,促进代码质量和可维护性的提升,达到知名开源项目的标准,让更多项目变得 AI 友好
- Anthropic 提出的 MCP 协议为 Agent 生态系统的互联互通提供了标准化方案,将使多样化的专业服务相互连接而非相互替代
- OpenAI 的 Responses API、Realtime API 和 Anthropic 的 MCP 代表了 Agent 框架的发展方向
- Agent 的工作效率目前受限于视觉模型的延迟,人类在某些操作速度上仍有优势
- 虚拟机沙盒可以提供独立的工作环境,但需要更好的个人数据集成方案
- AI Agent 未来可能会分为 “快思考” (用户交互) 和 “慢思考” (后台处理) 两个部分协同工作
- 通用 Agent 是硬件、操作系统巨头的兵家必争之地,但大公司发布产品会相对谨慎
- 创业公司在 Agent 领域的机会主要在垂直领域,通过深耕特定场景积累专业数据和行业知识
- 编程、教育和人际沟通是最有可能率先出现成熟 Agent 应用的三大领域
2025-03-14
为什么需要一个三层隧道
你所在的 AI 公司是否经常遇到以下情况?
- 需要访问只对美国 IP 开放的应用或大模型 API,如 OpenAI、Anthropic、Google 等
- 需要连接到美国的公司内网,但不想频繁设置代理
很多人搭建的是应用层代理,那么就需要在环境变量中设置 HTTP_PROXY,HTTPS_PROXY 等,但很多软件并不支持直接用环境变量配置代理,例如:
- Docker 容器内部并不会感知到外部的环境变量,如果要用现成的 docker compose 文件,又想让 docker 内的服务自动用上代理,就要折腾一番了。
- Docker 访问 docker.io 拉镜像和 build image 的时候,需要单独配置代理。
- 各种软件源,例如 pip、npm 等,需要单独配置代理。
- 一些软件,如 Google Cloud CLI,并不会从环境变量中读取代理配置,需要单独配置代理。
- 一些软件,如 Cursor,直接使用 IP 地址访问服务器,且使用的是非标准的 Websocket 协议,一些代理软件不兼容,或容易出问题。
- Node.js 服务端的一些库并不会直接检测 HTTP_PROXY 环境变量,而是需要配置 HTTP Proxy Agent,其中一些库(如 axios)在代理模式下还有 bug。
- 一些编译型语言的代码(如 C++、Go)常常自己组装 HTTP 请求发送,可能根本不支持配置 HTTP 代理。
- 一些 App(如 OpenAI)使用额外机制检测网络环境,如果发现代理,可能会导致拒绝服务,或者降低智商(例如用较差的模型代替 SOTA 模型)。
2025-03-08
【本文首发于知乎回答《如何评价中国团队发布的通用型 AI Agent 产品 Manus?会成为下一个爆款吗?》】
总体来说,我觉得 Manus 是一个 idea 很好,但工程上还有很多打磨提升空间的产品。
关键创新:具备计算思维的 Agent
好多人都觉得它就是个更好的 computer use,其实第一眼我就发现一个根本区别:OpenAI Operator、Anthropic Computer Use 都是模仿普通人,而 Manus 是在模仿极客程序员。
OpenAI Operator / Deep Research 和 Anthropic Computer Use 打开的都是浏览器、桌面 GUI 和移动端 App,最后交付的结果是一段文字(最多带点 Markdown 格式)。而 Manus 一上来打开的是一个命令行终端,在里面用文本编辑器写了个 todo list,干活的过程中不断写代码做自动化,最后的交付件(Artifact)也是一段代码(交互式网页和图表)。
这让我一下子想到了 Jeannette Wing(周以真)博士在 MSR 给我们讲的 Computational Thinking(计算思维)。计算思维就是把日常生活和工作中的问题抽象化,然后用系统化的逻辑推理和自动化工具解决。我在科大期间也把计算思维介绍给了很多师弟师妹。
2025-03-08
【转载自网易科技公众号】
原标题为:《Manus 会开启 Agent 元年吗?和大厂离职的两位 AI 创业者聊了聊》
出品 | 网易科技态度栏目
作者 | 袁宁
编辑 | 丁广胜
像一颗巨石投入湖水, Manus 发布溅起的水花虽已逐渐退去,但激起的涟漪还在不断扩散。
Manus 会开启 Agent 元年吗?怎么理解 Agent 及其壁垒?当前是不是 Agent 的发展机会点?不同玩家如何迎接 Agent 的浪潮?当前 Agent 能代替实习生吗……
3 月 8 日,网易科技邀请了两位大厂离职,在 AI 创业一线的嘉宾——李博杰和彭康伟,分享他们的判断与思考。
李博杰,华为“天才少年”出身,曾任华为计算机网络与协议实验室副首席专家,微软学者奖得主。 2023 年投身 AI 创业,目前是 PINE AI 首席科学家,致力于为每个人和每个组织构建类似《Her》 里面 Samantha 的通用智能助理。
彭康伟,曾在腾讯 0-1 打造过月活破亿的 C 端产品, 2023 年离职创业,成立梦马智能,正在做新一代的 AI 内容平台。
作为 AI 浪潮下的创业者,他们如何在巨浪中寻找方向?透过他们的视角,又能看到一个怎样的 Agent 未来?网易科技整理了他们对十个关键问题的回答。
以下内容经《网易科技》不改变原意的编辑:
2025-02-17
【本文转自“蜗壳小道消息” 公众号】
当初只是一个灵光乍现的想法,拉着两个好友,历经两个多月正式上线,就这么在蜗壳存在了十年。
「10 年前」,正逢 2015 年春季学期选课,物理学院大一的张静宁在 QQ 群聊里参与热烈讨论。
“下学期的必修课哪个老师教的好?
“给分怎么样?”
“有没有什么有趣的选修课?”
群聊的生态封闭。讨论者们通常仅能得到一两位学长学姐随手打出的一句评价,犹如盲人摸象。这些只言片语的讨论难以筛选出真正有价值的信息,更难以留存。
张静宁想起了自己上网课(MOOC 课程)的经历:她学习 MOOC 是自发的、主动的。她可以提前了解课程内容、教师风格、课程难度等等,基于自己的兴趣、偏好、需求来选课,在 MOOC 课程的学习上有极强的主动性。
正逢侯建国院士在科大推出《新生“科学与社会”研讨课》,张静宁拉着好友,计算机学院的李博杰和常震,一起开发了 USTC 评课社区,促进校内课程信息公开,帮助学生找到更适合自己的课程。
项目从 2015 年 3 月 8 日开始,到 5 月 25 日发布内测,历时两个多月。
时至今日(2025 年 2 月 17 日),该网站已经持续运行了 3566 天, 14234 位小伙伴们为 17431 门课程贡献了 37176 篇点评。
2025-01-14
2025 年 1 月 12 日中午 13:00,父亲给我电话,说爷爷中午在家中突然去世了。
爷爷搞地质的一辈子
我爷爷年轻的时候是个学霸,上世纪 50 年代末考上了北京地质学院(中国地质大学的前身),学机械工程专业。那时候北京地质学院是很好的大学,出了很多人才,温总理是他的师弟,“嫦娥之父” 欧阳自远是他的师兄。当然,我爷爷远远不是北京地质学院的杰出校友。大三,赶上中苏交恶,苏联专家全部撤走,没有专家教课了。大四,爷爷进入了中国科学院地理研究所,成为了一名平凡的地质工作者。
爷爷虽然不是跑野外的职位,主要是坐在实验室里搞研究,但也要经常出差到全国各地做地质勘探。地质勘探可不是旅游,风餐露宿是常态。那个年代交通也不发达,光是坐绿皮火车去目的地就要几天。去的地方都是人迹罕至的地方(人多的地方也用不着勘探了),山是野山,水是野水。野外露营的时候遇到野生动物,走到半山腰上遇到地质灾害,都不是什么稀罕事。那个年代可没有手机和 GPS,要是迷路了就交代在山里了。
2025-01-12
【本文首发于知乎回答 《回顾互联网发展,有哪些底层逻辑看似简单但将在未来持续奏效?》】
数据是最重要的护城河。
互联网公司的护城河是数据
我非常喜欢老王的产品课,王慧文是校内、美团创始人之一,他的清华产品课非常经典,值得一遍一遍回味。里面讲到规模效应,社交网络有网络效应。网络效应的背后其实就是数据:我认识哪些朋友?跟这些朋友的亲疏远近怎么样?
老王的产品课里说复制一个微信很难,阿里和字节试图进攻微信但失败了。但如果某天有个先知 app,他知道一个人现实中所有的朋友关系,然后根据这个自动生成好友关系。两个人只要见面聊了几句,不用扫码就能自动推荐好友,当然加不加是用户自己的决定。这个先知 app 恐怕是可以跟微信一战的。这就是微信掌握了好友关系数据的价值。
但这个先知 app 里面没有微信的聊天记录,没有朋友圈的历史,因此还是缺了些什么。这就是对话历史数据的价值。如果这个先知更进一步,知道每个人每天都说了什么,做了什么,那恐怕微信也不是它的对手。
2025-01-03
【本文转自蜗壳进阶联盟微信公众号《对话 | 专访华为“天才少年”李博杰(下):放弃百万年薪投身创业,一名科大人的坚守与重塑》】
长文预警,本文共11221字,预计阅读时间29分钟
「对话」是蜗壳进阶联盟推出的系列深度访谈栏目,我们邀请并采访了科大的优秀前辈,他们在科大的大学生活当中走过了弯路,品尝过挫折,获得过成就。我们希望通过深度对话的方式展现他们人生生涯当中的种种历程与个人选择,希望通过这种对话的方式,前辈们的经历可以为科大的后辈们照亮更多的前路。
这一期的对话栏目,我们邀请到了李博杰师兄(个人主页:01.me/),李博杰是中科大1000校友、中科大MSRA联培博士、首批华为“天才少年”获得者、AI创业者、中科大评课社区联合创始人。曾任华为计算机网络与协议实验室助理科学家、副首席专家。曾在SIGCOMM SOSP、NSDI、ATC、PLDI 等顶级会议上发表多篇论文,曾获 ACM 中国优秀博士学位论文奖和“微软学者”奖学金。
本文由蜗壳进阶联盟原创 未经允许 不得转载
采访、编辑 | 冯文俊、陈磊、苏启晟
校对 | 赵国华
主题摘要
大学与工作的环境转变
如何培养能力适应工作岗位
创业挑战与思考
求职建议与准备策略
AI时代的就业与自我提升
AI是否会带来失业问题
如何拥抱AI工具赋能工作学习
2024-12-31
(本文是 2024 年 11 月笔者应开源中国邀请,为《2024 年 OSChina 年度 AI 盘点》撰写的文章)
2024 年大模型真正开始落地,大多数科技工作者在工作中至少使用一款大模型提升效率,很多国民级应用和手机厂商也接入了大模型。大模型开始往专业(Professional)模型和个人(Personal)模型两个方向分化。
专业模型
专业模型是旨在提升生产力的模型,例如 AI 辅助编程、写作、设计、咨询、教育等。一旦模型能力达到门槛,专业模型将带来很高的附加值。2024 年,专业模型已经在很多领域落地。例如,AI 辅助编程可以提升开发效率一倍以上,仅用每月数十美元的 API 调用或 IDE 订阅成本,就相当于每月上万美元的工程师。AI 生成图片、播客、直播等,可以上百倍提升画师、配音员、主播的工作效率。AI 在心理、法律、医疗等领域的咨询服务可达到初级专业人士水平,每小时收费相比模型成本也高上百倍。AI 虚拟外教已经可以媲美真人外教,由于发音标准,效果甚至超过大多数国内英语老师。未来,AI 辅助教学将改变一对多的传统教学模式,不仅使 AI 一对一教学成为可能,人类教师的教学内容准备效率和内容质量也将大幅提升。
2024-12-28
【本文转自蜗壳进阶联盟微信公众号《对话 | 专访华为“天才少年”李博杰(上):放弃百万年薪投身创业,一名科大人的坚守与重塑》】
长文预警,本文共10016字,预计阅读时间27分钟
「对话」是蜗壳进阶联盟推出的系列深度访谈栏目,我们邀请并采访了科大的优秀前辈,他们在科大的大学生活当中走过了弯路,品尝过挫折,获得过成就。我们希望通过深度对话的方式展现他们人生生涯当中的种种历程与个人选择,希望通过这种对话的方式,前辈们的经历可以为科大的后辈们照亮更多的前路。
这一期的对话栏目,我们邀请到了李博杰师兄(个人主页:01.me),李博杰是中科大1000校友、中科大MSRA联培博士、首批华为“天才少年”获得者、AI创业者、中科大评课社区联合创始人。曾任华为计算机网络与协议实验室的助理科学家、副首席专家。曾在SIGCOMM SOSP、NSDI、ATC、PLDI 等顶级会议上发表多篇论文,曾获 ACM 中国优秀博士学位论文奖和“微软学者”奖学金。
本文由蜗壳进阶联盟原创 未经允许 不得转载
采访、编辑 | 冯文俊、陈磊
校对 | 赵国华
主题摘要
大学期间的学习实践经历
如何看待数理基础
评课社区开发历程
如何转向AI的研究
学业规划与职业选择
选择读博的误区与建议