2025-01-14
纪念我的爷爷

2025 年 1 月 12 日中午 13:00,父亲给我电话,说爷爷中午在家中突然去世了。

爷爷搞地质的一辈子

我爷爷年轻的时候是个学霸,上世纪 50 年代末考上了北京地质学院(中国地质大学的前身),学机械工程专业。那时候北京地质学院是很好的大学,出了很多人才,温总理是他的师弟,“嫦娥之父” 欧阳自远是他的师兄。当然,我爷爷远远不是北京地质学院的杰出校友。大三,赶上中苏交恶,苏联专家全部撤走,没有专家教课了。大四,爷爷进入了中国科学院地理研究所,成为了一名平凡的地质工作者。

爷爷虽然不是跑野外的职位,主要是坐在实验室里搞研究,但也要经常出差到全国各地做地质勘探。地质勘探可不是旅游,风餐露宿是常态。那个年代交通也不发达,光是坐绿皮火车去目的地就要几天。去的地方都是人迹罕至的地方(人多的地方也用不着勘探了),山是野山,水是野水。野外露营的时候遇到野生动物,走到半山腰上遇到地质灾害,都不是什么稀罕事。那个年代可没有手机和 GPS,要是迷路了就交代在山里了。

爷爷放在家庭相册里的照片是他退休后的登山照

Read More

2025-01-12
数据是互联网和 AI 公司的护城河

【本文首发于知乎回答 《回顾互联网发展,有哪些底层逻辑看似简单但将在未来持续奏效?》

数据是最重要的护城河。

互联网公司的护城河是数据

我非常喜欢老王的产品课,王慧文是校内、美团创始人之一,他的清华产品课非常经典,值得一遍一遍回味。里面讲到规模效应,社交网络有网络效应。网络效应的背后其实就是数据:我认识哪些朋友?跟这些朋友的亲疏远近怎么样?

老王的产品课里说复制一个微信很难,阿里和字节试图进攻微信但失败了。但如果某天有个先知 app,他知道一个人现实中所有的朋友关系,然后根据这个自动生成好友关系。两个人只要见面聊了几句,不用扫码就能自动推荐好友,当然加不加是用户自己的决定。这个先知 app 恐怕是可以跟微信一战的。这就是微信掌握了好友关系数据的价值。

但这个先知 app 里面没有微信的聊天记录,没有朋友圈的历史,因此还是缺了些什么。这就是对话历史数据的价值。如果这个先知更进一步,知道每个人每天都说了什么,做了什么,那恐怕微信也不是它的对手。

Read More

2025-01-03
蜗壳进阶联盟专访华为“天才少年”李博杰(下):放弃百万年薪投身创业,一名科大人的坚守与重塑

【本文转自蜗壳进阶联盟微信公众号《对话 | 专访华为“天才少年”李博杰(下):放弃百万年薪投身创业,一名科大人的坚守与重塑》

长文预警,本文共11221字,预计阅读时间29分钟

「对话」是蜗壳进阶联盟推出的系列深度访谈栏目,我们邀请并采访了科大的优秀前辈,他们在科大的大学生活当中走过了弯路,品尝过挫折,获得过成就。我们希望通过深度对话的方式展现他们人生生涯当中的种种历程与个人选择,希望通过这种对话的方式,前辈们的经历可以为科大的后辈们照亮更多的前路。

这一期的对话栏目,我们邀请到了李博杰师兄(个人主页:01.me/),李博杰是中科大1000校友、中科大MSRA联培博士、首批华为“天才少年”获得者、AI创业者、中科大评课社区联合创始人。曾任华为计算机网络与协议实验室助理科学家、副首席专家。曾在SIGCOMM SOSP、NSDI、ATC、PLDI 等顶级会议上发表多篇论文,曾获 ACM 中国优秀博士学位论文奖和“微软学者”奖学金。

本文由蜗壳进阶联盟原创 未经允许 不得转载

采访、编辑 | 冯文俊、陈磊、苏启晟

校对 | 赵国华

主题摘要 

大学与工作的环境转变

如何培养能力适应工作岗位

创业挑战与思考

求职建议与准备策略

AI时代的就业与自我提升

AI是否会带来失业问题

如何拥抱AI工具赋能工作学习

Read More

2024-12-31
AI 的三叉路口:专业模型和个人模型

(本文是 2024 年 11 月笔者应开源中国邀请,为《2024 年 OSChina 年度 AI 盘点》撰写的文章)

2024 年大模型真正开始落地,大多数科技工作者在工作中至少使用一款大模型提升效率,很多国民级应用和手机厂商也接入了大模型。大模型开始往专业(Professional)模型和个人(Personal)模型两个方向分化。

专业模型

专业模型是旨在提升生产力的模型,例如 AI 辅助编程、写作、设计、咨询、教育等。一旦模型能力达到门槛,专业模型将带来很高的附加值。2024 年,专业模型已经在很多领域落地。例如,AI 辅助编程可以提升开发效率一倍以上,仅用每月数十美元的 API 调用或 IDE 订阅成本,就相当于每月上万美元的工程师。AI 生成图片、播客、直播等,可以上百倍提升画师、配音员、主播的工作效率。AI 在心理、法律、医疗等领域的咨询服务可达到初级专业人士水平,每小时收费相比模型成本也高上百倍。AI 虚拟外教已经可以媲美真人外教,由于发音标准,效果甚至超过大多数国内英语老师。未来,AI 辅助教学将改变一对多的传统教学模式,不仅使 AI 一对一教学成为可能,人类教师的教学内容准备效率和内容质量也将大幅提升。

Read More

2024-12-28
蜗壳进阶联盟专访华为“天才少年”李博杰(上):放弃百万年薪投身创业,一名科大人的坚守与重塑

【本文转自蜗壳进阶联盟微信公众号《对话 | 专访华为“天才少年”李博杰(上):放弃百万年薪投身创业,一名科大人的坚守与重塑》

长文预警,本文共10016字,预计阅读时间27分钟

「对话」是蜗壳进阶联盟推出的系列深度访谈栏目,我们邀请并采访了科大的优秀前辈,他们在科大的大学生活当中走过了弯路,品尝过挫折,获得过成就。我们希望通过深度对话的方式展现他们人生生涯当中的种种历程与个人选择,希望通过这种对话的方式,前辈们的经历可以为科大的后辈们照亮更多的前路。

这一期的对话栏目,我们邀请到了李博杰师兄(个人主页:01.me),李博杰是中科大1000校友、中科大MSRA联培博士、首批华为“天才少年”获得者、AI创业者、中科大评课社区联合创始人。曾任华为计算机网络与协议实验室的助理科学家、副首席专家。曾在SIGCOMM SOSP、NSDI、ATC、PLDI 等顶级会议上发表多篇论文,曾获 ACM 中国优秀博士学位论文奖和“微软学者”奖学金。

本文由蜗壳进阶联盟原创 未经允许 不得转载

采访、编辑 | 冯文俊、陈磊

校对 | 赵国华

主题摘要 

大学期间的学习实践经历

如何看待数理基础

评课社区开发历程

如何转向AI的研究

学业规划与职业选择

选择读博的误区与建议

Read More

2024-12-21
OpenAI o3:AGI 和 ASI 的曙光

本文首发于知乎回答《如何看待 OpenAI 最新发布的 o3 模型?有多强大?

o1 刚出来的时候,很多人还质疑这还达不到 AGI(通用人工智能)。o3 体现出的编程和数学能力,不仅达到了 AGI 的门槛,甚至摸到了 ASI(超级人工智能)的边。

o3 也进一步验证了 RL 和 test-time scaling 的价值,在高质量预训练数据基本耗尽,模型能力 “撞墙” 的情况下,提供了一条通过后训练和增加推理时间,继续提升模型智力,解决更困难问题的路径。

o3 具体的性能指标很多人都看到了,我就不再重复了。省流版:

  • o3 在 Codeforces 编程竞技中击败了 99.9% 的程序员,在 168076 名程序员中排名 175 名。甚至 o3 的作者都打不过 o3。
  • o3 在编程解决真实世界需求方面也比 o1 有明显提升,在 SWE-Bench 软件开发测试中,之前发布的 o1-preview 是 41.3%,o3 是 71.7%,也就是 70% 的真实世界需求,o3 可以直接做对,并通过单元测试。也就意味着只有剩下 30% 的工作需要人类程序员去编码完成了,而这部分工作 AI 也可以帮助人类程序员大大提升效率。
  • 在 AIME 2024 数学测试中做对了 96.7%,相当于在美国数学奥林匹克竞赛上只答错了一道题。
  • 在博士级别科学问题测试的 GPQA Diamond 中超过 o1 10 个百分点,而 o1 已经基本上是人类博士生的平均水平。
  • 图形逻辑推理的 ARC-AGI,o3 经过微调后,达到 87.5%,超过人类平均水平(85%)。
Read More

2024-11-16
知乎学术酒吧演讲:有哪个瞬间让你觉得这个世界出 bug 了?

2024 年 11 月 15 日晚,在知乎学术酒吧,我和李开复、刘知远、戴国浩等一众大佬,一起做了一个开放麦分享。

问题:

《漏洞 & Bug——有哪个瞬间让你觉得这个世界出 bug 了?》

在知乎站内,有多个关于 Bug 的高赞问题,比如《有哪个瞬间让你觉得这个世界出 bug 了?》《有哪些让你目瞪口呆的 Bug ?》

但这个世界出现 Bug 不可怕,可怕的是,AI 发现了一个 Bug。

近期,AI 首次发现真实世界中的重大安全漏洞?SQLite 中的一个漏洞,幸运地被谷歌研究者的 AI Agent 发现了,修复后并未造成任何损失。莫非 AI 再进化一番,微软的全球蓝屏事故就可以永久避免了?这个可能性令人激动不已。

回答:

Read More

2024-11-01
跟基础模型公司做朋友——六叉路口 podcast

Podcast 原始内容:六叉路口的播客《研发岗位本身就要拥抱 AI,然后用剩下的时间疯狂做实验——对话华为第一批天才少年李博杰》

以下内容约 3.5 万字,为笔者根据播客内容利用 AI 整理。感谢猎手 Leslie 的精彩访谈和后期,2 个小时的时间一口气讲了个痛快,没有一段是重录的。也感谢 AI 能让我用一个下午整理完三万字的内容,并且用之前写的其他资料做了补充。

核心观点总结:

  • 《她》和《黑镜》等科幻电影涉及 AI 的场景已经实现或接近实现,把科幻变成现实肯定会有巨大的价值。
  • 模型能力处于快速上升期,小规模 AI 公司要跟基础模型公司做朋友,不要做在模型上雕花、套壳的事情。
  • “20% 项目” 的创业成功率较高,根据日常工作和生活的需求先利用业余时间做兴趣项目,如果有泛化需求再扩展成商业项目,成功率较高。
  • AI 应用的很多性能问题并不是模型问题,而要用基于第一性原理的系统优化解决。
  • AI 行业大量工作未被发表或没有被开源,存在巨大的信息差。
  • 现代社会信息差巨大,AI 跟用户交流多了,可以知道每个人的知识边界,推荐的效率会高很多,有助于抹平信息差。
  • OpenAI o1 的强推理能力对模型在严肃场景下应用的可靠性很重要。
  • 大多数用户的日常生活需求现在能力最强的模型已经基本够用,重点是降低成本;AGI 可能很昂贵,主要用于解决人类科学中最重要的问题。
  • 有限的能源和芯片制造能力是 AGI 面临的重大挑战。
  • 创业公司招人需要扎实的计算机基础知识、强学习能力、强自驱力。
  • AI 辅助编程可以大幅提升程序员的工作效率,节约出来的时间可以用于探索 “20% 项目”,或者更好的工作生活平衡。
  • AI 提升效率后,会带来更多的需求,使更多的需求变成现实,甚至独立开发者就可以完成之前一个团队的开发工作。
  • 一个人的职业生涯是由一系列项目组成,重要的是每个项目都有影响力。不同的项目适合不同的方式,包括创业公司、小而美公司、社区、学术项目等。

全文:

Read More

2024-10-24
在字节 MarsCode 1024 码上奇妙夜的直播分享

Q: 最近一年来你觉得最想分享的一个产品?

A: 之前我提过一个说法,AI 一天,人间一年。过去一年有太多 exciting 的产品。如果一定要我选出一个的话,我会选 OpenAI o1,简单来说就是让 AI 学会了思考。这个思考最显著的体现就是数学和编程。我们不要把数学和编程理解的狭义了,其实这是当前大模型在商业场景下应用最大的挑战。

数学这块,目前大多数的大模型算数总是算不准确,比如 3.8 和 3.11 的大小都分不清,那么准确率就不高,在严肃的场景下不敢用,比如让他定个机票,让他帮我算账,万一弄错了怎么办。现在的模型计算准确了,很多严肃的场景就可以用了。

编程也并不是程序员才能用上的。我们观察到现在 AI 应用有一个重要的趋势,生成的内容不仅仅是文字,而是一个图文并茂的多模态内容,甚至是一个可以跟用户交互的小游戏、小程序,比如 Claude Artifacts,OpenAI Canvas,Google NotebookLM 生成 podcast,Perplexity 生成的图文并貌的 wiki。这些内容其实都是大模型生成的一段代码,然后动态渲染出来的。这种图文并茂的多模态内容就非常考验大模型的编程能力。

Read More

2024-10-20
由《小米创业思考》想到的

开始创业之前,老婆就给我买了《小米创业思考》,但我一直没看。最近几天才有空读了读,感觉收获很大。这类书我之前不太喜欢看,觉得这些经历都是经过加工和美化的,其中的一些忠告也未必听得进去。但有了亲身创业经历之后,再来看大佬的书,就感觉人家说的很有道理。

《小米创业思考》一书最精华的是第六章 “互联网七字诀”,即 专注、极致、口碑、快

MIUI 的开发思路充分体现了 “专注、极致、口碑、快” 互联网七字诀:

  • 专注:刚开始只做四个功能(电话、短信、通讯录和桌面),极度克制。
  • 极致:百变锁屏、百变主题,能够模拟任何手机,对体验极致追求。
  • 口碑:公司全员在论坛上跟用户沟通,跟用户交朋友。在 XDA 论坛上大受欢迎,在国外火了,最早的国际化从 MIUI 开始。
  • :每周迭代,采用互联网开发模式。

专注

专注是互联网七字诀中最重要的一条,也是适用于所有公司和产品的。

公司需要专注

雷军分享了他首次创业失败的经历。雷军技术很强,大二就修完了四年的学分,大三写的杀毒软件《免疫 90》卖了 100 万,在 90 年代这是很大的一笔钱了。于是,大四他就跟两位技术大神李儒雄和王全国(这两位现在也非常成功)一起创办了三色公司,但这次创业很快就以失败告终。

Read More
RSS