Bojie Li (李博杰)
2023-01-23
长文预警:《MSRA 读博五年》系列之一,约 12000 字,未完待续……
2021 年 7 月 31 日,ACM 中国图灵大会上,我站在主席台上等待 ACM 中国优秀博士学位论文奖,没想到走上台来为我颁奖的是包校长,我的双腿不由自主地有些颤抖。这是我唯一一次近距离见到包校长。包校长高兴地说,看到获奖人中有我们中科大的,说明中科大也是可以培养大师的,希望以后你们能够成为大师,报效祖国,回归母校。
颁奖典礼的主持人刘云浩教授让我们说说博士论文的标题和导师,我脱口而出,《基于可编程网卡的高性能数据中心系统》,导师是中科大的陈恩红教授和微软的张霖涛博士,还要特别感谢华为的谭焜博士。我能清楚地记住博士论文的标题,它就挂在自己的主页上。在公司里,经常有人给我发私信,问我你就是某某论文的作者吗?我就不好意思地说,是的……
很多人也许认为,我是那种一心学习的博士,其实我的博士生活比很多人想象的有趣很多,真应了 MSRA(微软亚洲研究院)这句格言 “Work hard, play harder”。
研究小白
联合培养
MSRA(微软亚洲研究院)跟国内的多所高校有联合培养博士生项目。其中,跟中科大的联合培养项目已经持续多年。大三下学期,MSRA 到学校面试几十位候选人,从中选出十几位学生到 MSRA 进行暑期实习和大四一年的实习,并在暑期实习结束后确定下来大约 7 位学生成为联合培养博士。这些联合培养博士将在中科大完成第一年的硕博课程,而后面四年将在北京的 MSRA 进行学术研究,最后取得中科大的博士学位。
MSRA 选拔联合培养博士的要求是所谓 “三好” 学生:数学好、编程好、态度好。这个规矩据说是前院长沈向洋博士定下来的。我本科因为整天在少年班学院机房和 LUG 活动室倒腾各种 Linux 网络服务,不怎么好好学习,成绩自然也不好看,GPA 只有 3.4(满绩 4.3),其中数学分析(二)还挂过科。面试官当时就问我,数学成绩怎么这么差。大概是我高中曾经在编程竞赛(NOI)中得过奖,简历上又有很多在LUG搞的网络服务项目,最后我竟然被联合培养博士项目录用了。其他被联合培养项目录用的同学 GPA 都起码是 3.7,大部分都是 3.8 以上的大神。
2023-01-23
从故纸堆里发现了 2004 年石家庄电视台送我留念的 VCD 盘,经过修复和转码,19 年前播出的《大明星李博杰——记华罗庚金杯赛金奖得主》访谈节目终于重见天日。
从这个 13 分半钟的视频中,可以看出我当年有多胖 :) 视频 11:25 开始是当众揭短的体育问题 :)
2023-01-22
时间:2023 年 5 月 1 日 10:58
地点:河北翠屏山迎宾馆
交通信息 :河北翠屏山迎宾馆位于石家庄市鹿泉区迎宾馆路 1 号。
- 由于翠屏山迎宾馆地处西郊,不通地铁,公共交通较为不便,建议打车出行。
- 高铁:
- 乘车:距离石家庄高铁站最近路线 16 公里、走高架 22 公里,不堵车情况下约需 35 分钟车程。
- 公共交通:可乘 320 路/空 320 路直达(需步行 1.3 公里),需 1 小时 20 分钟;或乘地铁 3 号线转地铁 1 号线转旅游 5 路,需 1 小时 10 分钟。
- 石家庄高铁站晚上 22 点后打车排队很长,如果较晚抵达,建议提前联系我们接站。
- 飞机:
- 乘车:距离石家庄正定国际机场 53 公里,不堵车情况下约需 50 分钟车程。
- 公共交通:从正定机场可乘机场大巴 1 号线(每小时一班)转地铁 1 号线转旅游 5 路,需 2 小时 10 分钟。
- 正定机场晚上打车不便,如果较晚抵达,建议提前联系我们接站。
- 由于婚礼 10:58 正式开始,建议 4 月 30 日抵达石家庄。北京出发的如果时间紧张也可以考虑乘坐 5 月 1 日的早班高铁(06:26 至 08:34 出发的 5 个班次)。
住宿信息 :
- 尽量安排住河北翠屏山迎宾馆 6 号楼和 9 号楼,已预留房间。如果有特殊情况,我们将安排附近酒店。
- 早餐预计在 6 号楼,7:00~10:00。伴郎伴娘及工作人员需要较早出发,来不及用早餐,将在 6 号楼和 9 号楼安排简餐。
- 6 号楼和 9 号楼之间距离 560 米,步行需 8 分钟。
2022-12-13
有个经典笑话,一学生选了一门课《选择与未来》,结果到了课堂才发现讲的是《期权与期货》,因为它们的英文都是 Options and Futures。前几天开会的酒店正好在上海期货交易所对面,就想到一个问题:我们的对未来的判断和选择,是根据什么做出的呢?
最近,我读了两本书《天资差异》(Gifts Differing)和《4D 卓越团队》(How NASA Builds Teams),发现这就体现了不同人思维方式的不同。感觉(Sensing)与直觉(iNtuition)、思考(Thinking)与情感(Feeling)就是两对最关键的差异。
在正文之前,请您不妨思考,在《西游记》中,孙悟空、猪八戒、唐僧、沙僧师徒四人的性格有什么差异,又是如何团队合作的呢?
2022-12-12
感谢许辰人教授、黄群教授邀请,非常荣幸于 2022 年 12 月 12 日为北京大学计算机网络课程做了一个 guest lecture。
Abstract: 数据中心网络、广域网和无线网络为万物互联的智能世界提供了通信基石。
数据中心网络传统上为容易并行的 Web 服务设计。但如今 AI、大数据、HPC 都是大规模异构并行计算系统,对通信性能都提出了很高的要求,厚重的软件栈造成巨大的开销,这就要求数据中心网络的通信语义从字节流演进到包括消息语义、同步和异步远端内存访问、RPC 在内的内存语义,软硬结合实现极致的时延和带宽。未来,我们期望把数据中心作为一台计算机,一方面实现异构计算、存储设备间的对等直通,让数据中心互联像主机内部总线一样高性能;另一方面通过 Serverless 让分布式系统编程像单机编程一样便捷。
大规模直播和短视频点播、实时音视频通信等应用对广域网传输的稳定性提出了新挑战。互联网巨头纷纷自建全球加速网络,并设计 QUIC 等新型传输协议,实现优质用户体验。此外,由于我国西部能源成本低,东数西算成为国家战略,通过 Regionless 调度,实现 “全国一体化大数据中心”。
手机、PC、穿戴设备、智能家居、智能车等智能终端的无缝协同、5G to B 等工业互联网应用都需要稳定的低时延和高带宽,这需要无线协议栈优化,甚至无线内存语义以支持 Gbps 级别的带宽。此外,通过鸿蒙的 “分布式超级终端” 编程框架,可以使能更紧密的分布式协同,实现数据和服务无缝流转。
Download Slides PDF (2022-12-15 更新)
Download Slides PPTX (2022-12-15 更新)
演讲全文:
- 第一篇:计算机网络的新黄金时代(一):数据中心
- 第二篇:计算机网络的新黄金时代(二):广域网
- 第三篇:计算机网络的新黄金时代(三):无线网络
2022-12-10
最近几天大家都在玩 ChatGPT,真的非常厉害,虽然不是万能的,但是这是第一个让我感受到不像人工智障的 AI 对话系统,对指代、记忆上下文等难题处理得也非常好。尤其是在编程问题方面,有时候比 StackOverflow 还好用。如果我的候选人表现成这样,我肯定会优先录用的。
目前 ChatGPT 主要的缺点是:
- 知识库更新不足、覆盖度不够全,不能回答最近发生的事件,不能回答比较偏门的知识。建议与搜索引擎或者知识图谱相结合,先用 prompt 词搜索出一些结果,然后再用 NLP 的方法把搜索结果整合起来。据说有一些研究团队已经在这个方向上努力了。
- 逻辑推理能力不足,稍微复杂一点的逻辑就很容易搞错,而且搞错了还回答得一本正经。如何解决任意复杂的逻辑问题是一个很大的挑战。能识别看上去正确但实质上荒谬的回答就更难了。
- 目前还只支持文本,不支持多模态。目前已经可以让 ChatGPT 生成 prompt,再输入到 DALL-E 里面生成图片。未来,支持多模态输入和多模态输出的生成模型将使人机交互更自然,可能成为下一代的人机交互范式。
- 单次回答的成本目前较高,需要数美分,显著高于一次 Google 搜索的成本。如果能通过算法或硬件的改进降低成本,或者与推荐、广告相结合产生新的商业模式,就能够有商业盈利的空间。
今年可以说是 AI 生成内容的 “元年” 了。前几个月我们都被 CV 领域的 stable diffusion(DALL-E 2)震撼了,现在 ChatGPT 又为 NLP 设立了新的 SOTA。Stable diffusion 和 ChatGPT 恰好都是 OpenAI 做的,OpenAI 的背后金主是微软,这也算是微软在 AI 领域扳回的重要一局了。前些年,一直是 Google Deepmind 的 Alpha 系列在抢风头,从下围棋到蛋白质、矩阵计算。
能跟人自然交流的智能助理是无数科幻电影中的场景,也是各大公司 20 年前就设立的 vision,今天终于看到了变成现实的曙光。智能助理可能孕育出下一个万亿美金级别的产业,就像移动互联网颠覆 PC 互联网、视频颠覆文字一样,成为新的人机交互范式,深刻改变人类的工作和生活。
以下是我在 ChatGPT 中尝试的一些例子:
2022-12-10
首先,是业务规模。由于地缘和文化的原因,大多数国内公司在出海上面都遇到一些困难,主要是国内市场,比欧美市场相对来说就小很多。同样是公有云,欧美市场 AWS、Azure、Google Cloud 就比国内阿里、腾讯、华为云的营收和市值高。由于开发成本基本上是可以平摊的,美国公司开发人员的人均薪酬就比国内的高,可以雇佣相对来说更优秀的人才;也可以产出更多的利润来支撑相对远期的研究,例如 OpenAI、Deepmind 和 Microsoft Research。ChatGPT 这样的突破性创新很难来自开发节奏紧张的产品部门,一般是来自没有太多短期商业变现压力的研究部门。
2022-09-03
2022-07-27
计算机网络与协议实验室
华为计算机网络与协议实验室是 2012 实验室中央软件院分布式与并行软件实验室的下属部门,位置分布在北京、上海、杭州、深圳、以色列特拉维夫。
愿景:扎根筑基石,创新引领分布式通信未来
定位:华为公司在计算机网络与协议技术领域的软件发动机,涵盖理论突破、技术发明、技术创新和精品交付。站在本技术领域最前沿,研究并突破计算原生网络、广域网准确定性通信世界级技术难题,打造业界领先的分布式通信全栈,协同ICT、终端、云、智能车等主力产品团队共同构筑差异化通信竞争力,逐步壮大产业生态,助力商业成功。
团队:由业界顶尖领军专家、天才少年、博士和工程师混编特战队、海外军团共同组成的高水平创新团队。技术研究成果显著,2018年至今,已有5篇论文被全球网络通信顶级会议SIGCOMM录用;并连续3届都有关键技术入选华为公司10大发明。
2022-07-22
就在这里更新和预告我(将)走过的城市吧!
(2022 年 7 月 22 日)由于疫情,最近已经有 4 个月没有挪窝了,错过了五一的婚礼,又错过了 520 一起领证,我们也 4 个月没有见面了。
现在到哪里都要最近 14 天的行程卡,我可以拿出最近 10 年的行程!与行程卡的逻辑相同,短时间的途径某地不计入,但转机/转车一般会计入。 自 2022 年 12 月 13 日起,行程卡退出了历史舞台。
自 2012 年到 2022 年 7 月,共计走过 42 个城市,旅行 259 次(从 A 城市到 B 城市就算一次,如果再回到 A 城市就算两次了),其中 2019 年甚至旅行了 63 次。拿到这个统计数据的时候,我还是相当震惊的,虽然最近 3 年出差多,19 年还去日本逛了 12 个城市,但也没想到会这么多。为什么出差这么多呢?我的第一个项目主力是在杭州,因此 19 年 6 月到 20 年 5 月大半时间在杭州。目前的项目我带着三拨人,分别在杭州、上海和以色列,唯独没有北京的;另外作为架构师还经常需要参加研讨。大概是上帝觉得我比较适合异地吧。
在中科大和微软亚洲研究院联合培养博士期间(2013 年大四实习 ~ 2019 年博士毕业),需要经常往返于合肥和北京之间,在学生中应该已经算比较多的了。没想到工作之后的出差次数更多,航旅纵横 2021 年超过了 97% 的用户。比我还多的那 3% 用户那简直是空中飞人了。挺后悔的是,读博的时候我还是太抠了,经常舍不得车票钱,跟女朋友聚少离多。另外一点遗憾的是出行之后经常懒得写总结,我的记性不好,时间久了就只能凭照片和聊天记录来回忆了。
截至 2023 年 11 月,我已经去过了 71 个城市,旅行 380 次,相比一年前又增加了 29 个城市,主要来自我们婚礼后去新疆的蜜月旅行,以及我三个月的美国之行。其实 “城市” 有点难定义,在美国,城市对应 County 可能更合理一些,把跨 County 的行程都记录下来的话,那美国的行程又增加了很多次 “旅行”(其中在湾区内部和洛杉矶-尔湾其实不能被称为旅行),我可能都记不全了。
当然,我没有权限从通信运营商那里获取基站连接数据。行程数据采集自订票记录、出差记录等,由于有些票并不是我自己订的,有些旅行可能漏掉了。例如,2014 年 6 月从 MSRA 结束实习回合肥本科毕业的时间已无据可查。据实习证明上的 2013 年 7 月 9 日至 2014 年 5 月 30 日,已确认北京到合肥日期。
如果您发现有误,欢迎联系我更正。
我的足迹
2025
开始日期 | 结束日期 | 城市 |
---|---|---|
2025-05-05 | 2025-05-05 | 北京 |
2025-05-02 | 2025-05-05 | 太原 |
2025-05-02 | 2025-05-02 | 岚县 |
2025-05-01 | 2025-05-02 | 太原 |
2025-04-19 | 2025-04-30 | 北京 |
2025-04-14 | 2025-04-19 | 上海 |
2025-03-22 | 2025-04-14 | 北京 |
2025-03-17 | 2025-03-22 | 上海 |
2025-03-02 | 2025-03-17 | 北京 |
2025-03-01 | 2025-03-02 | 北戴河 |
2025-03-01 | 2025-03-01 | 山海关 |
2025-02-22 | 2025-03-01 | 北京 |
2025-02-17 | 2025-02-22 | 上海 |
2025-02-10 | 2025-02-17 | 北京 |
2025-02-08 | 2025-02-10 | 湖州 |
2025-01-15 | 2025-02-08 | 北京 |
2025-01-12 | 2025-01-15 | 石家庄 |
2025-01-01 | 2025-01-12 | 北京 |
2024
开始日期 | 结束日期 | 城市 |
---|---|---|
2024-10-08 | 2024-12-31 | 北京 |
2024-10-06 | 2024-10-08 | 杭州 |
2024-10-06 | 2024-10-06 | 太原 |
2024-10-04 | 2024-10-06 | 岚县 |
2024-10-03 | 2024-10-04 | 太原 |
2024-09-30 | 2024-10-03 | 石家庄 |
2024-09-25 | 2024-09-30 | 北京 |
2024-04-24 | 2024-09-25 | 合肥 |
2024-09-22 | 2024-09-24 | 北京 |
2024-09-19 | 2024-09-22 | 杭州 |
2024-09-15 | 2024-09-19 | 西安 |
2024-08-18 | 2024-09-14 | 北京 |
2024-08-18 | 2024-08-18 | 长沙 |
2024-08-17 | 2024-08-18 | 吉隆坡 |
2024-08-14 | 2024-08-17 | 新加坡 |
2024-08-13 | 2024-08-14 | 马六甲 |
2024-08-10 | 2024-08-12 | 吉隆坡 |
2024-08-10 | 2024-08-10 | 深圳 |
2024-07-21 | 2024-08-10 | 北京 |
2024-07-20 | 2024-07-21 | 岚县 |
2024-07-19 | 2024-07-20 | 太原 |
2024-07-07 | 2024-07-19 | 北京 |
2024-07-05 | 2024-07-07 | 合肥 |
2024-06-10 | 2024-07-05 | 北京 |
2024-06-09 | 2024-06-10 | 太原 |
2024-06-08 | 2024-06-09 | 岚县 |
2024-06-07 | 2024-06-08 | 太原 |
2024-06-01 | 2024-06-07 | 北京 |
2024-06-01 | 2024-06-01 | 密云 |
2024-06-01 | 2024-06-01 | 怀柔 |
2024-05-06 | 2024-06-01 | 北京 |
2024-05-04 | 2024-05-06 | 太原 |
2024-05-03 | 2024-05-04 | 古交 |
2024-05-03 | 2024-05-03 | 太原 |
2024-05-02 | 2024-05-03 | 大同 |
2024-05-02 | 2024-05-02 | 应县 |
2024-05-01 | 2024-05-02 | 大同 |
2024-04-21 | 2024-05-01 | 北京 |
2024-04-16 | 2024-04-21 | 迪拜 |
2024-04-06 | 2024-04-16 | 北京 |
2024-04-04 | 2024-04-06 | 武汉 |
2024-03-29 | 2024-04-04 | 北京 |
2024-03-28 | 2024-03-28 | San Francisco |
2024-03-17 | 2024-03-28 | 洛杉矶 |
2024-02-22 | 2024-03-17 | 北京 |
2024-02-22 | 2024-02-22 | 香港 |
2024-02-19 | 2024-02-22 | 新加坡 |
2024-02-19 | 2024-02-19 | 厦门 |
2024-02-18 | 2024-02-19 | 北京 |
2024-02-16 | 2024-02-18 | 太原 |
2024-02-15 | 2024-02-16 | 岚县 |
2024-02-13 | 2024-02-15 | 太原 |
2024-02-13 | 2024-02-13 | 古交 |
2024-02-12 | 2024-02-13 | 太原 |
2024-02-08 | 2024-02-12 | 石家庄 |
2024-01-01 | 2024-02-08 | 北京 |