2022-12-12
计算机网络的新黄金时代

感谢许辰人教授、黄群教授邀请,非常荣幸于 2022 年 12 月 12 日为北京大学计算机网络课程做了一个 guest lecture。

Abstract: 数据中心网络、广域网和无线网络为万物互联的智能世界提供了通信基石。

数据中心网络传统上为容易并行的 Web 服务设计。但如今 AI、大数据、HPC 都是大规模异构并行计算系统,对通信性能都提出了很高的要求,厚重的软件栈造成巨大的开销,这就要求数据中心网络的通信语义从字节流演进到包括消息语义、同步和异步远端内存访问、RPC 在内的内存语义,软硬结合实现极致的时延和带宽。未来,我们期望把数据中心作为一台计算机,一方面实现异构计算、存储设备间的对等直通,让数据中心互联像主机内部总线一样高性能;另一方面通过 Serverless 让分布式系统编程像单机编程一样便捷。

大规模直播和短视频点播、实时音视频通信等应用对广域网传输的稳定性提出了新挑战。互联网巨头纷纷自建全球加速网络,并设计 QUIC 等新型传输协议,实现优质用户体验。此外,由于我国西部能源成本低,东数西算成为国家战略,通过 Regionless 调度,实现 “全国一体化大数据中心”。

手机、PC、穿戴设备、智能家居、智能车等智能终端的无缝协同、5G to B 等工业互联网应用都需要稳定的低时延和高带宽,这需要无线协议栈优化,甚至无线内存语义以支持 Gbps 级别的带宽。此外,通过鸿蒙的 “分布式超级终端” 编程框架,可以使能更紧密的分布式协同,实现数据和服务无缝流转。

Download Slides PDF (2022-12-15 更新)

Download Slides PPTX (2022-12-15 更新)

演讲全文:

Read More

2022-12-10
ChatGPT 初体验

最近几天大家都在玩 ChatGPT,真的非常厉害,虽然不是万能的,但是这是第一个让我感受到不像人工智障的 AI 对话系统,对指代、记忆上下文等难题处理得也非常好。尤其是在编程问题方面,有时候比 StackOverflow 还好用。如果我的候选人表现成这样,我肯定会优先录用的。

目前 ChatGPT 主要的缺点是:

  1. 知识库更新不足、覆盖度不够全,不能回答最近发生的事件,不能回答比较偏门的知识。建议与搜索引擎或者知识图谱相结合,先用 prompt 词搜索出一些结果,然后再用 NLP 的方法把搜索结果整合起来。据说有一些研究团队已经在这个方向上努力了。
  2. 逻辑推理能力不足,稍微复杂一点的逻辑就很容易搞错,而且搞错了还回答得一本正经。如何解决任意复杂的逻辑问题是一个很大的挑战。能识别看上去正确但实质上荒谬的回答就更难了。
  3. 目前还只支持文本,不支持多模态。目前已经可以让 ChatGPT 生成 prompt,再输入到 DALL-E 里面生成图片。未来,支持多模态输入和多模态输出的生成模型将使人机交互更自然,可能成为下一代的人机交互范式。
  4. 单次回答的成本目前较高,需要数美分,显著高于一次 Google 搜索的成本。如果能通过算法或硬件的改进降低成本,或者与推荐、广告相结合产生新的商业模式,就能够有商业盈利的空间。

今年可以说是 AI 生成内容的 “元年” 了。前几个月我们都被 CV 领域的 stable diffusion(DALL-E 2)震撼了,现在 ChatGPT 又为 NLP 设立了新的 SOTA。Stable diffusion 和 ChatGPT 恰好都是 OpenAI 做的,OpenAI 的背后金主是微软,这也算是微软在 AI 领域扳回的重要一局了。前些年,一直是 Google Deepmind 的 Alpha 系列在抢风头,从下围棋到蛋白质、矩阵计算。

能跟人自然交流的智能助理是无数科幻电影中的场景,也是各大公司 20 年前就设立的 vision,今天终于看到了变成现实的曙光。智能助理可能孕育出下一个万亿美金级别的产业,就像移动互联网颠覆 PC 互联网、视频颠覆文字一样,成为新的人机交互范式,深刻改变人类的工作和生活。

以下是我在 ChatGPT 中尝试的一些例子:

Read More

2022-12-10
是什么在阻碍国内团队研究 ChatGPT 这样的产品?

首先,是业务规模。由于地缘和文化的原因,大多数国内公司在出海上面都遇到一些困难,主要是国内市场,比欧美市场相对来说就小很多。同样是公有云,欧美市场 AWS、Azure、Google Cloud 就比国内阿里、腾讯、华为云的营收和市值高。由于开发成本基本上是可以平摊的,美国公司开发人员的人均薪酬就比国内的高,可以雇佣相对来说更优秀的人才;也可以产出更多的利润来支撑相对远期的研究,例如 OpenAI、Deepmind 和 Microsoft Research。ChatGPT 这样的突破性创新很难来自开发节奏紧张的产品部门,一般是来自没有太多短期商业变现压力的研究部门

Read More

2022-09-03
领证照片 @北京市丰台区民政局

文字内容待补充,先放出来几张照片吧~

戳此看领证照片

Read More

2022-07-27
计算机网络与协议实验室 & 分布式与并行软件实验室业务简介

计算机网络与协议实验室

华为计算机网络与协议实验室是 2012 实验室中央软件院分布式与并行软件实验室的下属部门,位置分布在北京、上海、杭州、深圳、以色列特拉维夫。

愿景:扎根筑基石,创新引领分布式通信未来

定位:华为公司在计算机网络与协议技术领域的软件发动机,涵盖理论突破、技术发明、技术创新和精品交付。站在本技术领域最前沿,研究并突破计算原生网络、广域网准确定性通信世界级技术难题,打造业界领先的分布式通信全栈,协同ICT、终端、云、智能车等主力产品团队共同构筑差异化通信竞争力,逐步壮大产业生态,助力商业成功。

团队:由业界顶尖领军专家、天才少年、博士和工程师混编特战队、海外军团共同组成的高水平创新团队。技术研究成果显著,2018年至今,已有5篇论文被全球网络通信顶级会议SIGCOMM录用;并连续3届都有关键技术入选华为公司10大发明。

Read More

2022-07-22
2012 年以来,我走过的城市(持续更新中)

每年旅行多少次?

自 2012 年以来,截至目前,我已经去过了 个城市,旅行 次(从 A 城市到 B 城市就算一次,如果再回到 A 城市就算两次了)。

哪些城市呆得天数最久?

注:如果 1 月 1 日进入,1 月 2 日离开,按照 2 天计算,存在重复,因此总天数是超过日历天数的。

如果把除北京、合肥外的城市认为是旅行(包括出差),则旅行的总天数占比为 ,共计 天。

Read More

2022-07-03
Architecture of USTC iCourse.club

This article summarizes the technical architecture of USTC iCourse.club. Founded in 2015, iCourse is a Flask-based website aiming at rating courses in USTC (University of Science and Technology of China). Although it is only a small website from a technical point of view, it offers a glimpse of the architecture of a typical web service.

Read More

2022-06-27
从 LUG GitLab 迁移了 100+ 个仓库到 GitHub

USTC LUG GitLab 即将停止对校外用户服务,虽然我是校内邮箱,但是为了预防哪天突然被拔网线,把我的所有仓库都备份到本地了,并把公开仓库挂到了 GitHub 上。作为 LUG GitLab 的第一个用户,我一共有 209 个仓库,其中个人仓库 123 个。LUG GitLab 从 2013 年 3 月 14 日(Pi Day)创立,至今已经运行 9 年,创立时间甚至比 Telegram 还稍微早几个月。GitLab 和 VPN 是我创立的运行至今的年头最长(9 年)的网络服务,服务的用户数以千计,目前我都早已离开管理和运维团队,但对这些服务还是有很多感情的。

我的 GitHub 主页:https://github.com/bojieli

我的 USTC LUG GitLab 主页:https://git.lug.ustc.edu.cn/boj

这些公开的仓库主要是我在科大做的课程作业、本科的各种项目、在 LUG 做的网络服务。在 MSRA 读博期间做的大部分项目都没有开源,我只把 SocksDirect 的源码放出来了,还放出来了几篇 paper 的 LaTeX 源码,其中一些做了脱敏处理,没有保留内部 commit 信息。工作之后的源码就更不可能随意公开了,已经开源的 MindSpore AKG 项目也是在开源时对内网 commit 信息做了脱敏处理的(开源之后的内部贡献者就是直接在公开 repo 上开发了,但开源之后我已经离开 AKG 项目)。

因此,从 GitHub 的 contributions(贡献统计)可以看到,最多的一年是 2016 年,有 2000+ contributions;去年和前年都只有少得可怜的 contributions;2013-2015 年都有 1000+ contributions;2017-2019 年就只有几百了,一是由于项目没有开源,二是由于我个人也比较脱离写代码的一线,整天琢磨新的 research idea,变成了 PPT 工程师,在实际写代码实现 idea 上花的时间并不多,这也是我博士后期发 paper 比较少的原因。

Read More

2022-06-01
羚羊木雕(张之路)

“那只羚羊哪儿去啦?”妈妈突然问我。

妈妈说的羚羊是一件用黑色硬木雕成的工艺品。那是爸爸从非洲带回来给我的。它一直放在我桌子角上。这会儿,我的心怦怦地跳了起来,因为昨天我把它送给了我的好朋友万芳。

Read More

2022-05-15
PI Review 导师评价网

作为 USTC 评课社区 的创始人之一,我愿意在个人主页上推广评课社区的几位合作者 2021 年的又一个心血之作 PI Review(https://pi-review.com/)。

距离 2015 年创办评课社区已经过去 7 年,评课社区已经有超过 1.6 万条点评,在科大学生中具有很大的影响力,很多同学选课的时候都会参考评课社区上的点评。凡是读过博士或者硕士的同学大概都会认同,导师对学生这几年的生活和前途是至关重要的。虽然已经有很多评价导师的网站,比如导师推荐人、Rate My Supervisor、研控等,但都有很多问题,这里是一个比较详细的评测。PI Review 的创始人发现目前并没有一个令人满意的网站,因此 2021 年创立了 PI Review,今年又完善和新增了很多功能。

PI Review 实行匿名制,只需要用学校邮箱验证即可发表点评,但邮箱验证仅仅是为了防止 spam,邮箱地址永远不会公开,我们也不会发送垃圾邮件。发表的点评都是匿名的。欢迎各位小伙伴分享自己或者其他朋友的导师,如果觉得好可以帮自己拉合作者入坑,如果觉得不好就帮师弟师妹避坑。

PI Review 目前建议 分5个维度评价导师,包括 Advisor Style & Mentorship(hands-on or hands-off 等)、Expectations(发 paper、工作时间的要求等)、Funding & Support(工资、实习等)、Research(研究)、Lab Culture(文化)。当然,这只是个参考,大家也可以按照自己的维度评价导师。

我自己读博期间,两位微软联合培养的导师对我都非常好,给我了很多指导和帮助,我也在 PI Review 上写了评价,感兴趣的可以翻出来看看,搜索导师的功能应该是比较好用的。

Read More
RSS