Bojie Li (李博杰)
2025-01-03
【本文转自蜗壳进阶联盟微信公众号《对话 | 专访华为“天才少年”李博杰(下):放弃百万年薪投身创业,一名科大人的坚守与重塑》】
长文预警,本文共11221字,预计阅读时间29分钟
「对话」是蜗壳进阶联盟推出的系列深度访谈栏目,我们邀请并采访了科大的优秀前辈,他们在科大的大学生活当中走过了弯路,品尝过挫折,获得过成就。我们希望通过深度对话的方式展现他们人生生涯当中的种种历程与个人选择,希望通过这种对话的方式,前辈们的经历可以为科大的后辈们照亮更多的前路。
这一期的对话栏目,我们邀请到了李博杰师兄(个人主页:01.me/),李博杰是中科大1000校友、中科大MSRA联培博士、首批华为“天才少年”获得者、AI创业者、中科大评课社区联合创始人。曾任华为计算机网络与协议实验室助理科学家、副首席专家。曾在SIGCOMM SOSP、NSDI、ATC、PLDI 等顶级会议上发表多篇论文,曾获 ACM 中国优秀博士学位论文奖和“微软学者”奖学金。
本文由蜗壳进阶联盟原创 未经允许 不得转载
采访、编辑 | 冯文俊、陈磊、苏启晟
校对 | 赵国华
主题摘要
大学与工作的环境转变
如何培养能力适应工作岗位
创业挑战与思考
求职建议与准备策略
AI时代的就业与自我提升
AI是否会带来失业问题
如何拥抱AI工具赋能工作学习
走出象牙塔
“学习到工作的转变”
蜗壳进阶联盟:之前讲到了师兄的大学生涯和对同学们的建议,师兄博士毕业后便走上了工作岗位。走出学校这座象牙塔到工作岗位,你觉得有哪些核心的转变?
李博杰:我觉得最大的一个区别就是说我到华为之后,意识到它是一家商业公司,而非纯研究机构,当时华为的2012实验室名为预研部门,算是偏研究的部门。但我们的工作仍然可以说是围绕商业应用展开,其实就是说提前一年多的时间进行研究,再用半年时间进行商业化。这种时间框架的明确性在学术研究中并不常见。虽然产品的实际转化并不是我们直接负责,但我们在研究和产品之间架起了一个桥梁,承担起了连接这两个领域的角色。
图:李博杰在华为科学家任命仪式上
在华为,最重要的是创造商业价值,这与在MSRA这样的学术环境有很大不同。MSRA的氛围相对纯粹,研究成果可以仅以论文形式发布,而在华为,我的工作必须能创造实际的商业价值。这种转变让我学习如何判断哪些研究方向具有商业潜力。同时,我意识到这一点的重要性,因为它直接影响到我们的研究方向和最终成果。我们不能仅仅满足于发表一篇论文,而是要确保我们的研究成果能够在商业上产生影响。
此外,我们作为一个平台部门,也接到来自多个产品部门的需求,比如云计算、手机、AI和存储等。需求的多样性使我们的工作更加复杂和富有挑战性。我们必须避免陷入外包公司那种低效的局面,因为如果变成外包公司就完蛋了。
我们的目标是要创造通用的解决方案,而不仅仅是为某一特定需求提供定制服务。比如,我们当时开发了一套比较先进的高性能远程过程调用(RPC)系统,在数据中心的性能比传统TCP快十倍甚至百倍。同时,在手机上,它能够利用无线网络的特性和操作系统协议栈的能力,提升上传和下载速度,使得上传照片的时间从十秒减少到一秒。这个 RPC 系统的关键是在多个领域都能用上,不管是数据中心的云计算、AI 和存储,还是手机的端侧都能用,是一个通用的技术。
总的来说,我在公司工作的体验与学术研究的主要区别在于:首先,更强调商业价值;其次,要致力于开发通用型的解决方案,而不是专用的定制项目。
蜗壳进阶联盟:那对于个人能力的变化,你认为又有哪些转变呢?
李博杰:我觉得主要有两个方面的变化,一个是沟通能力,另一个是管理能力。其实这两者都是和人打交道的能力。在学术部门,比如在MSRA,工作往往是比较单打独斗的。我负责一个项目,带几个小师弟一起完成,汇报关系相对简单,通常只需要向我的导师汇报就行。
但在华为,情况就大不相同了。一般来说,我们是每天都要开早会,带着团队讨论进展,而不是一周一次。如果进展出现问题,我还需要想办法和不同人沟通解决。此外,我还需要花很多时间与其他部门沟通需求和技术方案,确保客户的需求能够得到满足。这些都需要花费大量的时间和精力。在华为的这几年里,我甚至感受到自己从一个I人变成了一个E人,记得博士期间,我在做MBTI性格测试时,一直被测出来是非常明显的内向型I人,但从华为出来后,我已经转变为外向型的E人。
刚开始我刚去华为的时候,去其他部门出差,每次见到新面孔时,我总是记不住人名,于是在第二次再见面时就会感到尴尬,不好意思打招呼。那时我甚至请领导帮我打电话给其他部门不认识的同事,因为有时候觉得不认识就不好意思主动联系。但是当时的领导告诉我,这就是适应职场的过程,鼓励我多与人打交道。虽然到现在我觉得我与人交流的能力也还不算强,但至少在心态上已经有了非常大的转变。以前我害怕与人交流,现在我不再害怕,即使讲错了也没关系。
当然,我并不是说每个人都要从内向变成外向,这只是我个人的经历。但我确实认为,沟通能力在职场上是非常重要的,尤其是在一个需要频繁合作的环境中。
第二个方面是管理能力,诚实地说,我觉得现在我自己的管理能力还不够强。在公司里,个人能力总是有限的,不可能单打独斗,必须依赖团队来完成工作。因此,我需要管理团队的进度、招聘合适的人选,以及了解团队成员的进展情况。如果有人进展缓慢,我需要找出原因,可能是心态问题、工作能力不足,或者是遇到了技术困难,甚至可能是身体不适。有一次,我的领导告诉我,作为管理者,要具备察言观色的能力。这种能力就是能够敏锐地察觉团队成员的情绪和状态。例如,如果有下属和配偶发生争吵,作为领导也要敏感到这一点。那时我心里想,“我怎么会知道他们吵架了?他们又不会告诉我。”领导告诉我,如果你这样想,就不是合格的领导。
“为工作提前布局”
蜗壳进阶联盟:那对于还没进入工作岗位的同学,如何培养自己的这些能力,请问师兄是如何提前做好准备的?
李博杰:我觉得在学校可以多做一些事情,比如在本科期间参加社团活动,这样可以锻炼管理能力和人际交往能力。我记得在Linux用户协会的时候,我的社交能力非常差,甚至不敢和陌生人打电话,这种情况在我上大学之前表现得尤为明显。因为在初中和高中时,我一直在家里只知道学习,几乎没有参与其他活动,这让我在社交方面的能力得不到锻炼。那时我连去小卖部买东西都感到有些紧张。
我记得在组织活动时,我们需要购买水和做海报。每次去找制作海报的店家时,我都要找同学陪我,因为自己去的话会很紧张。这种陪伴让我在面对陌生人时稍微减轻了些许紧张感。订水的时候还得打电话联系,那个时候没有外卖,电话沟通时我常常感到无从下手,甚至不知道该如何开口。询问卖家时,我常常纠结于选择一块五的农夫山泉还是一块钱的其他水,这让我想了半天,旁边的同学都觉得我买水这么纠结非常搞笑。这些经历真的是在学校里慢慢锻炼出来的,所以我认为在学校多参加一些活动,比如学术活动、各类科研竞赛和社团活动,都是培养管理能力和人际交往能力的好机会。
蜗壳进阶联盟:确实,而且我觉得在学校里做这些事情的机会成本相对较低。
李博杰:没错,你说得很对。机会成本确实比较低。如果到了公司后出现问题甚至闯了祸,那成本就很高了,这就可能会导致职业发展受到影响,甚至影响个人成长。
投身创业浪潮
“做真正感兴趣的事”
蜗壳进阶联盟:师兄从华为出来就选择AI创业,师兄认为自己创业的核心动力是什么?
李博杰:我觉得主要还是出于兴趣。正如我之前提到的,我认识到AI这个东西非常重要,它会改变世界。AI不仅能够理解人类的语言,还能在各个领域中处理复杂的任务,比如自动驾驶、智能客服和医疗诊断等,这些都是传统技术难以解决的特定领域问题。AI的能力意味着它能够做很多通用的事情,而这正是我决定在AI领域做些事情的原因。至于为什么选择创业,我认为创业能更高效地利用资源,最大化地利用一些杠杆。比如,在大公司工作,虽然资源丰富,但用户的认可并不是完全属于你自己的。
当我创办自己的公司时,我意识到我需要清楚自己的能力与大公司的支持之间的区别。我觉得可能要有一个认识,就是要明确哪些能力是自己所具备的,哪些是依赖于大公司平台的。起初,我对这些并没有很清醒的认识,因此走了一些弯路。我曾认为管理团队并不难,可以轻松招募几个人,但实际上,创业招人远比在华为要困难得多。华为拥有良好的品牌效应,大家会觉得它更靠谱,同时在招人方面有成熟的体系和专业的HR支持,这些HR会在背后筛简历并打电话,而我必须自己打电话筛简历,工作量非常大,面临的挑战也随之加重。我在华为申请几个服务器根本就不是个事,但在创业公司就需要自己购买服务器并放置在机房,这个过程比我想象的要复杂得多,期间我们花了两个月的时间才把这件事情搞定,面临的困难包括设备采购和机房管理等。买机器放机房的事没有想象中那么简单,内部的办公系统和管理流程在大公司中是非常成熟的,那里的系统能够支持团队高效运作,而在创业公司则需要依赖外部工具如Slack、Notion等,这些工具的便利性远不及华为内部的系统,导致工作效率低下。创业面临的挑战远比我想象的要多,但我仍然想继续这条路,因为创业让我能把自己的想法变为现实。
图:李博杰第一次测试Agent创业demo的地方,位于Newport Beach
“创业挑战与思考”
蜗壳进阶联盟:创业时可以利用哪些杠杆具体有哪些呢?
李博杰:创业时有很多杠杆可以利用。首先是资本的杠杆,大公司的项目投资很大,而创业者可以通过吸引投资,借助投资人来实现资金的杠杆。吸引投资的关键在于能够清晰地展示你的商业模式和潜在的市场价值。其次是时间杠杆,这是指团队的力量。虽然大公司也有团队的杠杆,但在创业公司,你需要组建自己的团队,借助团队的力量来共同推进项目,团队的重要性在于它不是一个人,而是多个人的协作与贡献,这在创业中是非常关键的。
此外,还有未来的杠杆,类似于期权。许多创业者的财富自由并不是因为公司的盈利,而是因为他们的股份期权兑现了。这意味着他们的财富自由实现路径来自于公司未来的潜在收益。只有当公司具备长期价值时,大家才能看到更大的故事。换句话说,就是通过期权提前兑现未来的收益,这在创业中是至关重要的。
蜗壳进阶联盟:师兄在创业过程中的思考非常前瞻性,师兄似乎很享受这个思考的过程。能否分享一下你是如何培养这种思考能力的?
李博杰:我觉得这可能源于我小时候的培养。我的奶奶对我影响很大,她总是教我凡事都要问“为什么”。这种习惯让我在面对问题时,愿意去探索背后的原因和逻辑。她不仅鼓励我提问,还常常与我讨论生活中的各种事情,比如自然现象、社会问题和家庭琐事等,这些讨论帮助我建立了深入思考的能力。我想,这种思维方式帮助我在思考时更加深入。
蜗壳进阶联盟:师兄从工作转向创业过程中,应该结识了不少伙伴。能否分享一些有趣的故事?
李博杰:确实有很多有趣的事情。创业的过程中,往往会遇到许多意想不到的连接,就像乔布斯所说的“connecting the dots”,这意味着那些看似无关的经历最终会在某个时刻串联起来。我创业的时候,和一位同学的合作就是一个例子。我们两个其实并没有直接的交集,他是14级的学生,而我大约是10级的,年级差异让我们的经历有了不同的视角。他在科大是微软学生俱乐部的会长,而我正好与微软有很多学术合作,涉及到一些技术和项目的对接。因此,我们在多个合作项目中有了很多的接触和交流,这种就是“connecting the dots”。
这位同学在伯克利的一个顶尖AI团队有工作经历,那个团队是AI领域中非常强的一个组,专注于许多前沿的AI技术。我在华为则参与了很多AI Infra的项目。我们两个都是从一个纯系统领域转到了一个AI Infra的方向,然后也有创业的想法,所以之后我们也开始合作创业。
蜗壳进阶联盟:在如今的环境下,求职和内卷压力很大,创业的形势似乎也不太乐观。然而,很多同学仍然对创业充满想法,会考虑创业时机的问题,师兄对创业时机有什么看法呢?
李博杰:创业的时机有很多种。首先,有一种是连续创业者,他们从毕业开始就不想去大公司,而是选择创业。这类人通常从小就受到创业的熏陶,心中有强烈的生意意识,能够不断尝试。第二种是在大公司工作一段时间后,发现行业机会而选择创业的人。我就是属于这一类,曾在大厂里工作,发现了市场中的机会后决定出去实践自己的想法。第三种人是在实现财富自由后选择创业,他们可能有了一定的经济基础,但不知道接下来该做什么,于是开始创业,去探索自己感兴趣且有价值的事情,创造出第二曲线的可能性。
我认为这三种类型的创业者各有特点。连续创业者往往具备很强的业务敏感性,大公司转型者则更注重行业机会分析,而财富自由者则往往追求个人兴趣和价值实现,还是要综合考虑个人的情况去选择自己创业的时机。
洞见
“给同学们的求职建议”
蜗壳进阶联盟:在求职方面内卷也很严重。这种内卷现象使得同学们在求职时倍感压力。师兄对于即将进入工作岗位的同学有什么建议呢?
李博杰:关于求职,我觉得可以从两个角度来看。首先是如何获得更好的offer,其次是如何选择offer。首先,如何拿到更好的offer,我认为关键在于把自己的简历和相关材料包装得更符合目标公司的需求。我觉得这点非常重要。很多没有工作经验的同学可能会忽视这一点,他们以为自己的学术成果和高GPA就足够了,甚至会觉得自己有好几篇论文,这种自信来源于学术成绩,但实际上公司更需要的是能迅速上手、解决问题的人。很多人会发现,我这个学术成果也挺好,但到了公司却没有合适的部门匹配他们的能力,这往往是因为在准备简历时没有考虑到如何与目标岗位相匹配。
其次,在面试过程中,如何更好地展示自己的能力也是非常重要的。我建议同学们可以先从一些相对不那么心仪的公司开始练习面试,因为很多人初次面试时会紧张,不知道如何回答问题,这种情绪在求职中是非常普遍的。实际上HR和面试官常问的问题是相似的,因此,通过这种“练手”,可以积累一定的面试经验,自然能更好地应对更高要求的公司。此外,多面几家公司,互相比较offer也是个不错的策略。很多同学因为只面对一个公司的offer而被坑,所谓“被坑”的原因在于他们只想去某个公司,而最终只能接受最低的薪资。当HR问到是否还有其他offer时,如果回答没有,就会处于被动局面。这是因为公司都是商业独立的,期望以最低的成本雇佣合适的人才,这种商业逻辑直接影响到薪资的谈判。因此,拥有其他的offer作为背书,能够增加在谈判中的筹码,这一点也非常重要。
在选择offer方面,我觉得要综合考虑多个因素。其中最关键的一点是小环境比大环境更重要。这与选择学校的道理类似,团队氛围和直属领导的素质会直接影响一个人的职业发展。以华为为例,不同部门可能给人的感受截然不同,甚至可以说是两个公司。有的部门领导不懂技术,只关心表面工作,而有的部门则有技术背景的领导,既关心技术细节,又愿意给予很多指导。这种指导内容包括职业发展建议、技术难题解答等,提高了同事们的工作能力和团队的整体表现。这种情况下团队氛围良好,能促进个人和职业的快速成长。在这样的环境中,自己成长的速度也会加快,尤其是在团队中与有上进心和技术信仰的同事们共同讨论有深度和有价值的问题时,个人的学习和进步会得到极大的提升,因此选择工作时,团队的氛围和领导的能力是非常重要的。
蜗壳进阶联盟:那如何在求职过程中了解团队风格和领导风格,因为这对自己的发展很重要。但在求职之前,似乎很难接触到这些信息,师兄觉得这个问题该如何解决呢?
李博杰:求职前确实很难接触到面试公司领导的情况。对于从事研究的博士生来说,这个问题可能稍微好一些,因为研究领域的圈子本身就不大。比如,进入某公司后,领导可能也在这个领域做过研究,这些人脉可能更多的是在科研过程中通过交际自然形成的。
比如说,我在做研究时,必然要参加学术会议,这些会议通常是领域内的重要交流场所。在会议上,我不仅要听报告,还需要主动去认识一些人,与其他人交流,在这个过程中,我会逐渐认识一些同行,增加自己的社交圈子,建立良好的联系。
当然,这里也涉及到一个关键点,那就是social能力。很多人会问,既然现在有这么多便利的渠道,比如论文、课程和公开资料,为什么还要花钱去参加线下会议呢?其实,线下会议的一个主要目的是为了人际交流和建立联系,尤其是面对面的互动。开学术会议的目的实际上就是为了social和认识人。在会议中,我经常看到一些资深的前辈,他们通常在听完重要报告后,会主动去外面交流,而不是坐在会议室里听报告。
当然,我认为“要有social的资本”,这一点非常重要。一般来说,资深人士在遇到你时,第一个问题可能就是:“你之前发过什么论文?”如果你没有相关的背景,可能就会让他们失去兴趣。所以说,在科研的过程中多参加相关的活动和讨论,可以帮助你积累见识和信息,帮助你提前了解公司中团队的情况。
“AI发展与应用”
蜗壳进阶联盟:接下来想请师兄谈谈对AI的看法。去年师兄做了一次名为“Chat向左,Agent向右”的分享,师兄能聊聊关于Agent产品或技术的看法吗?
李博杰:首先,大模型所有与现实世界交互的部分都必须依赖于Agent。Agent的作用是作为中介,帮助用户与外部环境沟通。举个例子,假如用户想查天气,需要调用一个天气API,或是订外卖、打电话,这些操作都需要依赖Agent来协调和执行。这些Agent在与外部世界交互时承担着重要的功能,确保信息的准确传递和操作的顺利进行。Agent可以在多个场景中应用,例如在购物、预约和信息查询等。
图:李博杰发表的名为《Chat向左,Agent向右》的讲座,原文链接https://zhuanlan.zhihu.com/p/668553858
其次,凡是涉及复杂工作流的场景也都需要Agent。例如,想要创建一个助手来总结我之前的学习笔记并据此提问,这就涉及到Agent。因为我的学习笔记数量庞大,不可能一次性全部输入到大模型中。在这种情况下,需要一个外部Agent来提取或总结相关内容,这个过程可能包括信息的筛选、归纳和重点提取,以简化信息处理的复杂性。接着,生成的内容可能还不足以回答问题,这时可能需要重新提问,使用不同的方法进行搜索,获取新的信息,再给出答案。这种情况通常发生在知识库中的信息未能涵盖用户当前的需求时。实际上,处理信息的复杂性在于Agent需要通过多次迭代和反馈来不断优化答案,确保最终生成的内容能够满足用户的需求。
这就是所谓的Agent工作流,它需要一步一步地完成任务。在这个过程中,反馈机制非常重要。Agent必须根据用户的反馈和环境的变化,调整其下一步的行动,以确保任务的有效推进。例如,如果生成的内容不完整,Agent可能会要求用户进一步澄清需求或提供更多上下文信息。这种反馈不仅是简单的输入和输出,而是一个动态、互动的过程,正如人类在处理事务时一样,必须根据环境变化逐步调整行动。
我们在处理事务时也是如此,不能一次性将所有输入都准备好,然后直接输出。我们根据环境的变化和反馈,逐步进行下一步的行动,这种灵活性在处理复杂任务时尤为必要,正如人类在实际操作中一样,必须灵活应对,逐步推进,确保每一步的决策都是基于最新的反馈和信息。
“AI时代下的机会把握”
蜗壳进阶联盟:AI发展非常迅速且充满不确定性,比如以前计算机视觉(CV)领域曾经非常火热,而现在似乎无人问津了。师兄认为在AI这样发展非常快的环境中,作为个人如何把握方向和抓住机会呢?
李博杰:我认为主要有两个方面。首先是发挥比较优势。正如我之前提到的,选择一个领域并不是因为它最热门,而是要考虑自己的优势。比较优势的具体定义是指在特定领域中,借助自己的技能和经验,获取相较于他人的竞争优势。热门领域意味着会有很多人参与,竞争也会非常激烈。如果我在某个领域没有优势,半路出家杀进来盲目跟风并不明智,这种竞争的压力会让我处于劣势。例如,在创业时,我不会选择基础大模型的训练,因为我对基础模型的理解有限,而当时已经有很多人专业从事这个领域了。因此,找到自己在某个领域的独特优势至关重要,才能看到别人未曾发现的机会。我认为这就是比较优势的重要性。
第二个方面是方向的选择。人工智能领域发展非常迅速,许多旧的算法,比如一些传统的计算机视觉和自然语言处理算法,可能很快就会过时。新的算法层出不穷,像transformer等基础技术的发展也极为迅速。我们不能指望某个技术在十年后仍然适用。连OpenAI都说自己没有护城河,那我一个人怎么会护城河呢?所以我认为首先要打好基础,掌握AI领域那些长期有用的理论和算法。此外,持续学习也非常重要,保持开放的心态是关键,永远保持学习的心态,不断吸收新知识。
我个人认为,在这一波AI创业中,许多AI资深人士的失败率反而较高,原因在于他们的思维模式相对固化,不愿意接受新技术,而这可能会导致很大的问题。正如字节跳动的一句口号所说,“always day one”,也就是永远保持第一天的心态,无论是创业还是做研究,始终应以开放的态度面对新事物。
蜗壳进阶联盟:那么师兄认为个人是否有能力把握未来AI的发展趋势,或者预测未来会出现哪些新的风口?个人是否能够做到这些,还是说我们的重点应该放在培养快速学习的能力上,以便在机会出现时及时转变方向?
李博杰:这两者都很重要。首先,预判未来的发展趋势确实很关键,这也可以理解为一种研究品味。例如,关于通用人工智能(AGI)是否能实现,这个问题就存在分歧。有些人认为AGI永远无法实现,而我则相信它是有可能的。这种看法反映了研究者在思维上的差异,尤其是对AGI的实现及其潜在影响的不同看法。此外,在技术细节方面,比如生成视频和图像时,长期来看是扩散模型更靠谱,还是自回归模型更有效,都会影响研究方向的选择。这些不同的模型在应用场景上有着各自的优势和限制。
图:李博杰在知乎先行者沙龙做报告
这种能力不仅仅依赖于理论知识的积累,更需要时间和实践经验的锻炼。同时也必须保持快速学习的能力,以便在新机遇出现时能够灵活应对和调整。随着技术发展,我们也需要不断修正自己预测未来的模型,不断打磨自己的 research taste。比如大模型之前和之后,好的 research taste 评判标准可能是完全不同的。
“拥抱AI的提升”
蜗壳进阶联盟:现在看来AI发展得非常迅速。师兄觉得这个技术会带来失业问题吗?在AI时代,大家似乎都担心自己会被替代,师兄认为该如何提升自己的不可替代性?
李博杰:这个问题很重要。关于不可替代性和失业问题,确实会有一些人失业,但失业往往是因为这些人不愿意学习新知识。如果他们愿意以开放的心态去学习和掌握 AI 技术,也就是如果说他愿意去用这个”always day one”的心态去学好 AI,就一定不会失业。实际上,AI 大大提升了我们的工作效率。比如,写代码时使用 AI 的话,效率可能会提高几倍。我原来可能一个礼拜的工作,现在可能两天就能搞定,这使得工作效率的对比尤为明显。
如果我能率先掌握这些先进的 AI 工具,我的工作和学习效率就会显著高于他人,特别是在别人还不会使用 AI 的时候,我的先发优势就将使我脱颖而出。
第二个问题是,整个社会的需求是否会因此缩减。我认为不会。虽然AI降低了成本,但整体需求会增加。举个例子,我之前有很多小项目想做,但因为没有时间和团队,无法实现,而且雇团队还得管理,复杂性也很高。然而,现在AI的能力已经足够强大,我只需要一个小团队就能完成原本需要大团队的项目。这样,许多之前只存在于我脑海中的想法都能变为现实,更多的创意也能得以实现。
再比如,很多偏传统的行业其实是没有数字化的工作流程,依靠的只是简单的 Excel 表格等工具,缺乏自动化管理。每个行业的工作流程都不一样,定制化开发的成本非常高,做很多定制化开发的成本算不过来。华为也是很久之前就不再做这种行业定制化开发了,这个原因就是因为这个软件的成本太高了。
如今,随着 AI 开发代码能力的提升,只要一个行业有明确的文档描述需求,就可以根据这些需求开发出合适的软件。这样一来,开发效率提高,很多行业的数字化转型和自动化就变得可行。因此,我认为 AI 能够激发许多新的需求,不必过于担心失业问题。
当然,失业问题确实会客观存在,这就像当年的工业革命一样,机器取代了人工劳动。如果一个人不愿意学习操纵机器,依然想继续手工劳动,最终可能会被淘汰。那么同样,假如我是程序员,我写代码,却拒绝学习 AI 辅助编程,固执地坚持一行一行手写代码,那未来也有可能面临被淘汰的风险。
蜗壳进阶联盟:师兄提到AI可以大幅提高个人的工作效率,能分享一下师兄在日常工作和学习中如何使用AI工具吗?有没有什么好的方法推荐给同学们?
李博杰:我觉得有几个工具挺好的。首先,在写代码方面,我觉得Cursor是一个非常不错的选择。Windsurf 也是一个类似的 AI 辅助代码开发工具。如果更有钱的话,可以尝试 Devin 这种自动化程度更高的工具。
图:AI编程辅助工具Cursor
另外,我平时使用较多的工具是AI聊天助手,用于解决日常问题。由于我自己是搞AI的,我可能会选择自己部署一套,用的是一个叫做OpenWeb UI的开源软件。这个开源工具的特点是,可以根据自己的需求进行定制。这个工具的使用体验比ChatGPT更好,因为ChatGPT主要面向普通用户,而为了节约成本,它会在某些功能上做很多trick。例如,上传一本书时,它不会直接将整本书放入模型的prompt中,而是会截取一些节选来回答。这种方式虽然能节省运行成本,但有时会导致回答不够准确,我不希望他给我在书里边只摘了只剩一章,导致他回答的东西不正确。这样的话,可能会影响我获取信息的完整性。我宁可多花点钱,来确保回答的正确性,所以我可能会更倾向于使用这种更专业的工具。
无论选择哪个工具,关键是要经常使用。例如,很多时候我突然想起一个问题,而不想花时间去搜索。通过AI,我可以快速得到常识性的答案,这大大提升了我学习新知识和解决问题的效率。我自己学新知识的能力也得到了显著的提升。现在像o1这样的模型在推理能力方面表现出色,能有效解决数学和理工科相关问题,虽然不保证完全正确,但至少能提供一个思路,帮助我们理解问题。我记得当初上大学的时候,许多课程都是数学和物理的,如果不懂题目,根本不知道该去哪里找答案。有时只能找其他同学询问,但万一那个同学也不会或者他也做错了,那就会很复杂和麻烦。那时候,老师或者助教可能只是给你打一个叉,但你仍然不知道为什么错,书上也没有参考答案,导致我在学习过程中遇到了很大的困难。通过AI的帮助,现在我们可以更方便地获取所需的信息,解决了很多学习上的困扰,我觉得有现在有AI的话可以给我们很多方便。另外,我觉得用AI学习英语也是非常实用的。特别是ChatGPT支持语音聊天,发音标准,对学习口语也很有帮助。
蜗壳进阶联盟:现在科大的很多非计算机专业的同学都在考虑转向AI领域,因为大家都觉得AI非常火热,想要转行,希望能参与到这一趋势中。师兄怎么看这种现象?对这些非计算机科班的同学转向AI,师兄有什么建议?
李博杰:我觉得并不是所有人都需要转向AI。我们可以把AI理解为一种工具,类似于计算机。其实很多学习计算机专业的人实际上是在制造计算机,但大多数人只需要学会如何使用计算机就足够了,AI也是如此。并不是每个人都需要学会如何构建一个AI模型或训练更好的模型。
我注意到,现在很多人对错过AI机会感到恐慌,会有所谓的FOMO,即“fear of missing out”,因此都想转行。这个现象反映出一种紧迫感,很多人害怕错过AI带来的机遇,然而,AI的算法发展变化迅速,有可能会形成泡沫,很多人进入这个领域后会面临激烈的竞争,最后可能很多人又是卷的要死。所以,除非你在算法方面确实有天赋,能够在这方面做出一些创新,否则我建议大家冷静一点,冷静的方式包括深入调研AI技术的应用,了解自己所在领域的需求,更多地去尝试利用现有的优秀模型和世界上最好的AI产品,看看这些工具如何能为你所在的领域带来改变,这样的做法可能更为实际。
蜗壳进阶联盟:非常感谢师兄的分享!师兄对同学们还有什么其他建议或者寄语吗?
李博杰:哈哈哈,我觉得可以这样说吧,我希望师弟师妹们在科大都能过得开心快乐,找到自己真正感兴趣的事情。在寻找兴趣的过程中,大家可以多尝试不同的领域,积极参与各种活动,以帮助自己更好地探索。这是一个重要的过程。大学教育的关键并不在于你学到了多少知识,而是培养出一种学习能力,以及发现自己真正的兴趣和方向,这是我认为大学生活中最重要的一些事情。而且建议师弟师妹们在追求知识的同时,也要多与他人交流,拓展视野,积累人脉,这将对未来的职业发展大有裨益。随着你们知识的积累、能力的培养、人脉的拓展,未来将会有更多的机会在等着你们。
图:在科大参加谈海生老师实验室的学术讨论,也是李博杰和其妻子的第一次见面
2024-12-31
(本文是 2024 年 11 月笔者应开源中国邀请,为《2024 年 OSChina 年度 AI 盘点》撰写的文章)
2024 年大模型真正开始落地,大多数科技工作者在工作中至少使用一款大模型提升效率,很多国民级应用和手机厂商也接入了大模型。大模型开始往专业(Professional)模型和个人(Personal)模型两个方向分化。
专业模型
专业模型是旨在提升生产力的模型,例如 AI 辅助编程、写作、设计、咨询、教育等。一旦模型能力达到门槛,专业模型将带来很高的附加值。2024 年,专业模型已经在很多领域落地。例如,AI 辅助编程可以提升开发效率一倍以上,仅用每月数十美元的 API 调用或 IDE 订阅成本,就相当于每月上万美元的工程师。AI 生成图片、播客、直播等,可以上百倍提升画师、配音员、主播的工作效率。AI 在心理、法律、医疗等领域的咨询服务可达到初级专业人士水平,每小时收费相比模型成本也高上百倍。AI 虚拟外教已经可以媲美真人外教,由于发音标准,效果甚至超过大多数国内英语老师。未来,AI 辅助教学将改变一对多的传统教学模式,不仅使 AI 一对一教学成为可能,人类教师的教学内容准备效率和内容质量也将大幅提升。
2024-12-28
【本文转自蜗壳进阶联盟微信公众号《对话 | 专访华为“天才少年”李博杰(上):放弃百万年薪投身创业,一名科大人的坚守与重塑》】
长文预警,本文共10016字,预计阅读时间27分钟
「对话」是蜗壳进阶联盟推出的系列深度访谈栏目,我们邀请并采访了科大的优秀前辈,他们在科大的大学生活当中走过了弯路,品尝过挫折,获得过成就。我们希望通过深度对话的方式展现他们人生生涯当中的种种历程与个人选择,希望通过这种对话的方式,前辈们的经历可以为科大的后辈们照亮更多的前路。
这一期的对话栏目,我们邀请到了李博杰师兄(个人主页:01.me),李博杰是中科大1000校友、中科大MSRA联培博士、首批华为“天才少年”获得者、AI创业者、中科大评课社区联合创始人。曾任华为计算机网络与协议实验室的助理科学家、副首席专家。曾在SIGCOMM SOSP、NSDI、ATC、PLDI 等顶级会议上发表多篇论文,曾获 ACM 中国优秀博士学位论文奖和“微软学者”奖学金。
本文由蜗壳进阶联盟原创 未经允许 不得转载
采访、编辑 | 冯文俊、陈磊
校对 | 赵国华
主题摘要
大学期间的学习实践经历
如何看待数理基础
评课社区开发历程
如何转向AI的研究
学业规划与职业选择
选择读博的误区与建议
2024-12-21
本文首发于知乎回答《如何看待 OpenAI 最新发布的 o3 模型?有多强大?》
o1 刚出来的时候,很多人还质疑这还达不到 AGI(通用人工智能)。o3 体现出的编程和数学能力,不仅达到了 AGI 的门槛,甚至摸到了 ASI(超级人工智能)的边。
o3 也进一步验证了 RL 和 test-time scaling 的价值,在高质量预训练数据基本耗尽,模型能力 “撞墙” 的情况下,提供了一条通过后训练和增加推理时间,继续提升模型智力,解决更困难问题的路径。
o3 具体的性能指标很多人都看到了,我就不再重复了。省流版:
- o3 在 Codeforces 编程竞技中击败了 99.9% 的程序员,在 168076 名程序员中排名 175 名。甚至 o3 的作者都打不过 o3。
- o3 在编程解决真实世界需求方面也比 o1 有明显提升,在 SWE-Bench 软件开发测试中,之前发布的 o1-preview 是 41.3%,o3 是 71.7%,也就是 70% 的真实世界需求,o3 可以直接做对,并通过单元测试。也就意味着只有剩下 30% 的工作需要人类程序员去编码完成了,而这部分工作 AI 也可以帮助人类程序员大大提升效率。
- 在 AIME 2024 数学测试中做对了 96.7%,相当于在美国数学奥林匹克竞赛上只答错了一道题。
- 在博士级别科学问题测试的 GPQA Diamond 中超过 o1 10 个百分点,而 o1 已经基本上是人类博士生的平均水平。
- 图形逻辑推理的 ARC-AGI,o3 经过微调后,达到 87.5%,超过人类平均水平(85%)。
2024-11-16
2024 年 11 月 15 日晚,在知乎学术酒吧,我和李开复、刘知远、戴国浩等一众大佬,一起做了一个开放麦分享。
问题:
《漏洞 & Bug——有哪个瞬间让你觉得这个世界出 bug 了?》
在知乎站内,有多个关于 Bug 的高赞问题,比如《有哪个瞬间让你觉得这个世界出 bug 了?》《有哪些让你目瞪口呆的 Bug ?》
但这个世界出现 Bug 不可怕,可怕的是,AI 发现了一个 Bug。
近期,AI 首次发现真实世界中的重大安全漏洞?SQLite 中的一个漏洞,幸运地被谷歌研究者的 AI Agent 发现了,修复后并未造成任何损失。莫非 AI 再进化一番,微软的全球蓝屏事故就可以永久避免了?这个可能性令人激动不已。
回答:
2024-11-01
Podcast 原始内容:六叉路口的播客《研发岗位本身就要拥抱 AI,然后用剩下的时间疯狂做实验——对话华为第一批天才少年李博杰》
以下内容约 3.5 万字,为笔者根据播客内容利用 AI 整理。感谢猎手 Leslie 的精彩访谈和后期,2 个小时的时间一口气讲了个痛快,没有一段是重录的。也感谢 AI 能让我用一个下午整理完三万字的内容,并且用之前写的其他资料做了补充。
核心观点总结:
- 《她》和《黑镜》等科幻电影涉及 AI 的场景已经实现或接近实现,把科幻变成现实肯定会有巨大的价值。
- 模型能力处于快速上升期,小规模 AI 公司要跟基础模型公司做朋友,不要做在模型上雕花、套壳的事情。
- “20% 项目” 的创业成功率较高,根据日常工作和生活的需求先利用业余时间做兴趣项目,如果有泛化需求再扩展成商业项目,成功率较高。
- AI 应用的很多性能问题并不是模型问题,而要用基于第一性原理的系统优化解决。
- AI 行业大量工作未被发表或没有被开源,存在巨大的信息差。
- 现代社会信息差巨大,AI 跟用户交流多了,可以知道每个人的知识边界,推荐的效率会高很多,有助于抹平信息差。
- OpenAI o1 的强推理能力对模型在严肃场景下应用的可靠性很重要。
- 大多数用户的日常生活需求现在能力最强的模型已经基本够用,重点是降低成本;AGI 可能很昂贵,主要用于解决人类科学中最重要的问题。
- 有限的能源和芯片制造能力是 AGI 面临的重大挑战。
- 创业公司招人需要扎实的计算机基础知识、强学习能力、强自驱力。
- AI 辅助编程可以大幅提升程序员的工作效率,节约出来的时间可以用于探索 “20% 项目”,或者更好的工作生活平衡。
- AI 提升效率后,会带来更多的需求,使更多的需求变成现实,甚至独立开发者就可以完成之前一个团队的开发工作。
- 一个人的职业生涯是由一系列项目组成,重要的是每个项目都有影响力。不同的项目适合不同的方式,包括创业公司、小而美公司、社区、学术项目等。
全文:
2024-10-24
Q: 最近一年来你觉得最想分享的一个产品?
A: 之前我提过一个说法,AI 一天,人间一年。过去一年有太多 exciting 的产品。如果一定要我选出一个的话,我会选 OpenAI o1,简单来说就是让 AI 学会了思考。这个思考最显著的体现就是数学和编程。我们不要把数学和编程理解的狭义了,其实这是当前大模型在商业场景下应用最大的挑战。
数学这块,目前大多数的大模型算数总是算不准确,比如 3.8 和 3.11 的大小都分不清,那么准确率就不高,在严肃的场景下不敢用,比如让他定个机票,让他帮我算账,万一弄错了怎么办。现在的模型计算准确了,很多严肃的场景就可以用了。
编程也并不是程序员才能用上的。我们观察到现在 AI 应用有一个重要的趋势,生成的内容不仅仅是文字,而是一个图文并茂的多模态内容,甚至是一个可以跟用户交互的小游戏、小程序,比如 Claude Artifacts,OpenAI Canvas,Google NotebookLM 生成 podcast,Perplexity 生成的图文并貌的 wiki。这些内容其实都是大模型生成的一段代码,然后动态渲染出来的。这种图文并茂的多模态内容就非常考验大模型的编程能力。
2024-10-20
开始创业之前,老婆就给我买了《小米创业思考》,但我一直没看。最近几天才有空读了读,感觉收获很大。这类书我之前不太喜欢看,觉得这些经历都是经过加工和美化的,其中的一些忠告也未必听得进去。但有了亲身创业经历之后,再来看大佬的书,就感觉人家说的很有道理。
《小米创业思考》一书最精华的是第六章 “互联网七字诀”,即 专注、极致、口碑、快。
MIUI 的开发思路充分体现了 “专注、极致、口碑、快” 互联网七字诀:
- 专注:刚开始只做四个功能(电话、短信、通讯录和桌面),极度克制。
- 极致:百变锁屏、百变主题,能够模拟任何手机,对体验极致追求。
- 口碑:公司全员在论坛上跟用户沟通,跟用户交朋友。在 XDA 论坛上大受欢迎,在国外火了,最早的国际化从 MIUI 开始。
- 快:每周迭代,采用互联网开发模式。
专注
专注是互联网七字诀中最重要的一条,也是适用于所有公司和产品的。
公司需要专注
雷军分享了他首次创业失败的经历。雷军技术很强,大二就修完了四年的学分,大三写的杀毒软件《免疫 90》卖了 100 万,在 90 年代这是很大的一笔钱了。于是,大四他就跟两位技术大神李儒雄和王全国(这两位现在也非常成功)一起创办了三色公司,但这次创业很快就以失败告终。
2024-10-08
(本文首发于知乎回答《2024 诺贝尔物理学奖授予人工神经网络机器学习,为什么会颁给 AI 领域?》)
一些人开玩笑说今年的诺贝尔物理学奖,好多搞物理的都没听说过获奖的这两个人……
人工神经网络与统计物理的关联不是偶然的
7 月初本科毕业 10 年回科大返校的时候,跟几位搞数学和物理的同学聊起了 AI,我吃惊的发现如今 AI 的很多基础概念是源自统计物理,比如 diffusion(扩散模型)和 emergence(涌现)。
@SIY.Z 也给我讲了很多 AI 经典算法背后的统计物理基础,比如此次获奖两人的重要成果 RBM(受限玻尔兹曼机)。
这种关联并不是偶然的,因为统计物理研究的是大量粒子组成系统的行为,而人工神经网络也是大量神经元组成的系统。从人工神经网络的早期发展历程,能够清楚地发现这种关联:
Hopfield 网络
1982 年,Hopfield 在研究人类记忆的原理,希望创造一个数学模型,用于解释和模拟神经网络如何存储和重建信息,尤其是在大脑中神经元是如何通过相互连接形成记忆的。
具体来说,这项研究的目的就是要构造一个支持 “语义模糊匹配” 的 CAM(Content-Addressable Memory,内容寻址内存),在存储阶段把需要存储的多条数据放进去,而在重建阶段,放入一个部分丢失或被修改的数据,需要找到与之最匹配的原始数据。
Hopfield 网络利用了物质特性中的原子自旋,这种特性使每个原子可以被看作一个小磁铁。这就是为什么 Hopfield 网络以及后续演进出来的人工神经网络这么像统计物理里面的 Ising 模型。Ising 模型就是用来解释为什么物质具有铁磁性的。
2024-10-02
9 月 20-21 日受邀参加 2024 云栖大会,花了接近两天的时间把三个展馆都逛了一遍,几乎每个感兴趣的展位都做了交流。
- 一号馆:基础模型的突破与挑战
- 二号馆:算力与云原生,支撑 AI 的核心架构
- 三号馆:应用落地,AI 赋能千行百业
我之前的研究方向是二号馆的计算基础架构和云原生,现在主要做 AI 应用,对一号馆和三号馆的内容也很熟悉,所以聊了两天下来,真的有把云栖大会玩通关的感觉。
会后我对着录音机讲了两个多小时,然后让 AI 整理出了这篇近 3 万字的文章。9 月 22 日没能整理完,平时工作又忙,国庆节期间就抽了点时间跟 AI 一起修改,加上录音总共花了大约 9 个小时。以往没有 AI 的时候简直不敢想象 9 小时能写出 3 万字。
全文提纲:
一号馆(基础模型):AI 的第一推动力
- 视频生成:从单一生成到多样化场景的突破
- 从单一文本生成视频到多模态输入生成
- 动作参考生成:从静态图像到动态视频
- 基于口型同步与视频生成的数字人技术
- 语音识别与合成
- 语音识别技术
- 语音合成技术
- 音乐合成技术
- 未来方向:多模态端到端模型
- Agent 技术
- 推理技术:百倍成本下降背后的技术推动力
- 视频生成:从单一生成到多样化场景的突破
三号馆(应用):AI 从 Demo 走向千行百业
- AI 生成设计:生成式 AI 的新范式
- PPT 生成(通义千问)
- 图文并茂的聊天助手(Kimi 的 Mermaid 图)
- 用图片形式展示生成内容(汉语新解)
- 设计稿生成(Motiff)
- 应用原型生成(Anthropic Claude)
- 智能消费电子:期望高,进展慢
- AI 辅助运营:从热点信息推送到粉丝互动
- AI 在教育中的颠覆性应用:从个性化到场景化学习
- AI 生成设计:生成式 AI 的新范式
二号馆(计算基础设施):AI 的算力基础
- CXL 架构:云端资源的高效整合
- 云端计算与高密度服务器:算力集群的优化
- 云原生与 Serverless
- 机密计算:AI 时代的数据安全与信任转移
结语:基础模型、算力与应用的两个 Bitter Lesson
- 云栖大会的三个展馆体现两个 Bitter Lesson
- 第一课:基础模型是 AI 应用的关键
- 第二课:算力是基础模型的关键