Bojie Li (李博杰)
2013-07-25
万通驿馆的无线网络是需要用户名密码进行认证的。在 Windows 上,只要连接上 “Vantone Inn” 这个接入点,就会弹出浏览器窗口,显示用户认证界面。访问任意 HTTP网址,也会跳转到认证界面。认证成功后,无线网络就畅通无阻了。今日某同学问我,这个接入点怎么这么NB,能强制电脑弹出窗口,莫非是病毒?
这个问题我也不知道,于是就抓了抓包,然后 Google 了一把。为了便于理解,我们先不讨论自动弹出浏览器,先想想如何实现“访问任意 HTTP 网址都会跳转到认证界面”。
2013-07-24
根据微软小学者项目的要求,我要给必应的产品提一些建议。我注意到,在 MSRA,似乎大多数人用的是 Google,为什么大家不用微软自家的 bing 呢?下面是一些技术层面的比较。
精确匹配能力
搜索关键词是 “b4: experience with a globally-deployed software defined wan”,是 SIGCOMM 2013 的一篇 paper,大约6月时被公布出来。
在 Google 中,只输入了三个关键词,自动补全就已经出来,结果第一条是 paper 本身,第二条是 SIGCOMM 官方网站,第一页的10条结果全部是相关的。
2013-07-23
科大主要有四条出校线路:教育网(CERNET)、电信、移动、联通。
这四个出口各有各的特征,我们一一道来:
教育网
- 教育网全称“中国教育与科研计算机网”(CERNET),连接了全国高校和科研机构。主节点在北京(总部在清华科技园,Google 旁边),科大是安徽省核心节点。
- IPv4 带宽 2G
- IPv6 带宽 2G,比较宽松(六维就是 IPv6,很快的)
- 教育网内南北互通白天比较拥挤,晚上网络比较通畅。其他运营商的南北互通问题可能更严重。
- 到国内其他运营商、国外的访问都很慢
- 网络上的路由路径不一定是地理上最短的,例如科大到北京的流量可能要经过上海。
- 访问 CERNET 定义的“免费地址”以外的IP,要按流量收费。虽然不直接对我们收费,但尽量为学校省钱吧 :)
- 大家访问教育网内资源,建议使用 IPv6
2013-06-24
注:以下内容纯凭记忆,由于已经过去一个多月,不保证准确性。由于面试前没有签保密协议,本文透露了比较多的细节,如果有不合适的内容,请联系 bojieli AT gmail.com。
本来是想稳稳地保研,在创业团队好好干的,没想去 MSRA……因此直到申请截止前几天,我才从班主任那里知道这个消息,班主任说有个“微软小学者”奖,5000块钱呢,我想这么多奖学金肯定要啊,就用一天晚上用 MS Word 赶写了两页 Resume,第二天去教学秘书处开成绩单,比 deadline 晚一天提交了申请。后来才知道这个“微软小学者”跟“实验班”在某种程度上是绑在一起的,不过那个奖学金目前还没有得到任何消息。
根据邮件收件人列表,大概有67人报名微软实验班。面试时间是下午。面试前一个星期左右,西区的一位老师联系我,说有一位叫马毅的研究员,很牛,做图像的,想从少院招一个学生。他说我的项目经历和动手能力不错,但数学成绩不好,担心我能不能做得来,可以给我一个单独面试的机会。他说不 care 你的 overall GPA,比较 care 的是数学课程和专业课程的成绩。他让我看马毅博士的一篇代表作,不仅要看懂,还要理解其精髓。我回来一看,是把一个矩阵分解成一个稀疏矩阵和一个低秩矩阵之和的通用算法,可以用于图像去噪、视频监控等。就只看懂这么多,中间那些矩阵的复杂推导是一点也看不懂。我就觉得这个机会还是留给数学专业的同学吧。
2013-05-14
GNU (GNU’s Not Unix) 计划
由 Richard Stallman 在1983年9月27日公开发起的,目标是创建一套完全自由的操作系统。GNU 项目贡献了很多一流的软件,包括 GCC、Emacs 等。
2013-05-13
昨天,mirrors.ustc.edu.cn 遇到了一件诡异的事情。mirrors 有三条接入线路,IP分别是 202.38.95.110,202.141.160.110,202.141.176.110。mirrors-lab 是 mirrors 上的一台 LXC 虚拟机,有三个IP:10.8.95.2,10.8.140.2,10.8.10.2。
在 mirrors 主机上,配置了 iptables 将主机上的 50000~51000 端口直接映射到虚拟机内:
1 | -A PREROUTING -p tcp -d 202.38.95.110 -m multiport --dports 50000:50100 -j DNAT --to 10.8.95.2 |
在虚拟机的 50000 端口运行了 rsync daemon,但只有 rsync://202.38.95.110:50000 能够访问,另外两个IP都是超时。诡异的是,我们在 mirrors 虚拟机和主机上用 tcpdump 抓包,看起来 SYN 已经收到,ACK 包也已经送出。tcpdump 抓入站包是在 netfilter 之前,我们抓的是物理网卡 eth0,入站包在被抓到时应该还没到 iptables,出站包在被抓到时已经通过了 iptables。更诡异的是,在与 mirrors 同属于一个网段的 blog 服务器上,三个IP访问都是正常的。为什么回复包发不出局域网呢?
2013-03-19
请先阅读:关于开源软件镜像联盟(非技术篇),谢谢
一、DNS or 301?
Update: 之前我对DNS的CNAME理解错误,现在更正。参考文献:https://tools.ietf.org/html/rfc3568
DNS方案(如果说得不对欢迎拍砖):
每个镜像分配一个二级域名,以便分别调度;NS记录设置为主站
用户从运营商DNS查询IP
主站根据来源IP(运营商DNS的IP)返回一个或多个镜像节点的IP地址
运营商DNS把这个IP返回给用户,同时缓存一定期限
用户与镜像节点建立连接,进行下载
301方案:域名A记录解析到主站
用户与主站建立连接,发起HTTP请求
主站根据用户来源IP返回HTTP 301状态,跳转到一个镜像节点
用户与这个镜像节点建立连接,进行下载
2013-03-19
Terminology: (好蛋疼啊,感觉挺别扭的)
- 镜像:Ubuntu, CPAN, PyPi之类的
- 镜像站:一个高校的开源镜像站,每个镜像站做了若干镜像
- (镜像)节点:同时做了一个镜像的各镜像站
镜像联盟维护者:
仿照Debian的开发模式,镜像联盟维护者可以分为Mirrors Maintainer和Mirrors Developer。Mirrors Developer是拥有镜像联盟主站维护权限和决策投票权的核心开发人员;参与镜像联盟开发、镜像维护的均可申请成为Mirrors Maintainer。
2012-11-27
欢迎使用USTC Blog。USTC Blog在千呼万唤之后,终于上线了!这是一个值得庆贺的时刻,但也意味着我们今后几天将与bug和feature进行持续斗争。
YY一下,什么时候blog能到下面这张图的访问量呢?
上图是mirrors.ustc.edu.cn的流量图
2012-11-27
Dr. Bojie Li is Co-Founder and Chief Scientist of Pine AI. Dr. Li was an Assistant Scientist and Associate Chief Expert with Computer Network and Protocol Lab, Distributed and Parallel Software Lab, Central Software Institute, Huawei 2012 Labs. In 2019, Dr. Li obtained his Ph.D. in Computer Science from University of Science and Technology of China (USTC) and Microsoft Research Asia (MSRA), supervised by Prof. Lintao Zhang and Prof. Enhong Chen. He has published papers on top conferences such as SIGCOMM, SOSP, NSDI, ATC, and PLDI. He is a recipient of ACM China Doctoral Dissertation Award and Microsoft Research Asia Ph.D. Fellowship Award.
李博杰现任 Pine AI 联合创始人、首席科学家。李博杰曾任华为 2012 实验室/中央软件院/分布式与并行软件实验室/计算机网络与协议实验室的助理科学家、副首席专家。2019 年,李博杰在中国科学技术大学与微软亚洲研究院的联合培养博士生项目中取得计算机科学博士学位,导师为张霖涛教授和陈恩红教授。他在 SIGCOMM、SOSP、NSDI、ATC、PLDI 等顶级会议上发表多篇论文,曾获 ACM 中国优秀博士学位论文奖和 “微软学者” 奖学金。

