太空探索与数字生命
太空探索需要的燃料太多了
小时候院子里有一个搞航天的老爷爷,他经常给我科普一些航天知识。我印象最深的就是他家墙上贴着一幅太阳系航天地图,就类似下图的样子。
老爷爷跟我说,这个太阳系航天地图看起来是不是很像火车线路图?只是上面标的数字都不是距离,而是速度的变化量(Delta-V)。
他年轻的时候也希望建成像火车一样四通八达的航天网络,只是里面的车站不再是北京西、上海虹桥,而是地球表面、近地轨道、地月转移轨道、火星转移轨道、火星表面等等。但遗憾的是,人类迄今为止,这张图里大多数的车站都还没去过。
这里面最重要的原因就是人类的能源技术在太空面前太落后了。现在的火箭都是靠喷出推进剂来推进的,如今最快的喷出速度只有大约 4500 米/秒。这远比子弹的速度快,但在太空面前仍然不算一个很快的速度,例如第一宇宙速度就要 7900 米/秒,考虑到空气阻力和 250 千米轨道处的重力,需要大约 9200 米/秒的速度增量才能进入 250 千米高处的地球轨道。
更致命的是火箭所需携带的燃料质量是随所需速度变化量指数增长的。还在上小学的我不理解,推进剂的喷出速度不变,难道不应该是速度跟烧掉燃料的量成正比吗?比如汽车的油箱里面多一倍的油,就能多走一倍的路程啊。
老爷爷说,烧掉的燃料越多,火箭越轻,烧掉同样的燃料就能增加更多的速度。这就是著名的齐奥尔科夫斯基公式。我说的汽车例子没错,但那是因为汽车油箱的质量仅占汽车质量的很小一部分,因此可以做一阶近似。如果汽车需要开几万公里,油箱的质量占到了汽车总质量的一大部分,那就像火箭一样,所带燃油的质量需要随行驶距离指数增长了。
高中接触微积分之后,我才明白这个指数关系是怎么推出来的,一阶近似是什么意思,也永远不会忘记 ln(x) 的导数是 1/x 了。
指数增长是非常可怕的。
其实第一步到达近地轨道(Low Earth Orbit,LEO),就需要 9.2 千米/秒的速度增量,达到第一宇宙速度。初始质量需要是最后送上轨道的载荷质量的 e ^ (9200/4500) = 7.7 倍,也就是燃料至少得是载荷质量的 6.7 倍。这还没有考虑燃料储罐的质量等额外开销。这仅仅是上面太阳系航天地图中距离地球表面最近的第一站。
设想我们有 4 个乘客,一共 300 公斤,坐着一辆 2 吨重的轿车,每次出行就需要消耗 13 吨重的燃油,而且出行一次车就报废了,这成本能不高吗?这就是太空探索为啥总是耗资巨大。即使 SpaceX 搞的可回收火箭解决了火箭本身的成本问题,测控成本也能随规模化降下来,火箭的燃料成本仍然比飞机高很多。例如 A380 客机平均每座百公里油耗不到 3 升,跟家用轿车相当,越洋飞行 1 万公里每人只要 300 升油。但坐火箭起码要几吨火箭燃料(老爷爷当年给我讲的传统火箭燃料单价高于航空煤油,但 SpaceX 用液氧和航空煤油把燃料价格降下来了),缩短时间的代价肯定是价格更贵。当然,如果能 1 万美金 1 小时从中国到美国,还是有很多有钱人愿意买票的。
第二步是克服低地球轨道到无限远处地球轨道的重力势能,需要 3.3 km/s 的速度增量,这就是第二宇宙速度和第一宇宙速度的差值。有了这个第二宇宙速度,就可以到达地图中蓝色和黄色线路的交叉点,也就是脱离了地球的引力范围。燃料的量至少是载荷质量的 15 倍。
第三步是脱离太阳系,需要第三宇宙速度 16.7 km/s 和第二宇宙速度 5.5 km/s 的速度增量,这就是地图上黄色线路从地球出发,到达地图顶部的太阳系之外所需的速度。总共需要 18.2 千米/秒的速度增量(不考虑引力弹弓之类的优化),燃料的量需要至少是送上轨道载荷质量的 56 倍,单级火箭已经很难满足需求了。
话说大学物理课上这个离开太阳系所需速度增量很多人都算不对,我目前也没有发现哪个大模型能算对。例如,GPT-4o 总是认为脱离太阳系需要在达到第二宇宙速度基础上再加上太阳在地球位置的逃逸速度 42.1 km/s - 地球公转速度 29.8 km/s = 12.3 km/s,认为从地面出发总共的速度增量是 24.8 km/s,远远超过了正确值。
老爷爷说,幸亏我们是生活在地球上,如果我们生活在更大的木星上,那么现在的技术基本上不能让我们脱离木星引力的束缚。单是木星的第一宇宙速度 33 km/s 就已经需要燃料是载荷质量的 1500 倍,工程上基本上已经不可行了。如果要完全脱离木星引力,达到 53 km/s,就需要燃料是载荷质量的 10 万倍,这基本上宣判了有工质推进的死刑。
为什么这么多科幻小说把太空探索的基地选在月球或者火星?从图上很容易看出,逃离月球的引力范围只需要 2.6 km/s,燃料只需载荷质量的 0.8 倍;逃离火星的引力范围只要 5.7 km/s,燃料只需载荷质量的 2.5 倍。相比之下,逃离地球引力需要 12.5 km/s,燃料需要是载荷质量的 15 倍。这就像是要做海上贸易,在上海肯定比乌鲁木齐方便。
如果我们想买往返票,去一趟火星再回来,需要的燃料载荷质量比就等于从地球去火星的,再乘以从火星返回地球的。这里是相乘不是相加,因为在火星降落的载荷需要包括返回地球所需的全部燃料。
从地球去火星,如果不依赖火星大气刹车,那么需要先相对地球加速,后相对火星减速,一共需要 18.5 km/s 的速度增量。如果减速段完全依靠火星大气层的摩擦力来刹车(实际中会有很多工程问题),最少需要 12.9 km/s 的速度增量,燃料和载荷总重至少需要是载荷质量的 17 倍。从火星返回地球,如果完全利用地球大气做刹车,最少需要脱离火星引力和火-地轨道迁移的 6.1 km/s 速度增量,燃料和载荷至少需要是载荷质量的 4 倍。往返两程一起考虑,燃料质量至少需要是有效载荷的 68 倍。实际中由于火箭发动机难以重复利用,实际需要的燃料更多。
每个行星的巨大引力,加上指数级的燃料质量需求,造访一个没有补给的行星再回来已经非常困难了,要想不做补给的造访两个星球再回来几乎就是不可能的。因此,如果火箭推进技术没有显著突破,星际航行注定是困难而受限的。
太空探索的时间窗口紧张
有了燃料,是不是就能说走就走了?
当然不是,因为不同时间行星的相对位置不同,指定出发和到达日期之后,就可以计算出一条轨道曲线,进而得知所需的燃料质量。把出发日期画在横轴上,把到达日期画在纵轴上,再把需要相同燃料质量的出发和到达日期画成一条蓝色曲线,这些蓝色曲线就像一圈一圈的年轮,年轮的中心是需要最小燃料质量的最优发射时间。
奇怪的是,我用老爷爷当年告诉我的中文名字 “年轮图” 搜不到想要的结果,只能用它的英文名字 Porkchop Plot 搜到。
可以看到,在 2005 年,要从地球去火星,至少需要 125 天(图中的红色横线表示相同在途天数),如果需要节约燃料,就至少需要 200 天,而且只有一个星期的短暂时间窗口。在不合适的时间从地球出发,如果还想保持燃料的量在合理范围内,就需要相当长的时间(例如 9 月到 11 月出发,需要至少 350 天时间)。
需要这么长的时间是因为我们的燃料太有限了,只足够把火箭加速到摆脱星球的引力,却无法在漫长的旅途中不断加速。在地球到火星漫长的旅途中,其实火箭大多数时候都是处于关机状态,靠惯性和引力在轨道上滑行。
老爷爷给我看过年轮图后,我就明白,在当前的推进技术下,太空探索永远不可能是一场说走就走的旅行。
今天的太空探索就像波利尼西亚人的远洋航行
我爷爷喜欢给我讲波利尼西亚人的航海壮举。爷爷说,南太平洋的复活节岛距离最近的岛屿都有 2000 多公里远,但一千年前就已经有波利尼西亚人住在这里,并且留下了复活节岛石像。波利尼西亚人是怎么跨越两三千公里迁徙到这里的?
波利尼西亚人在南太平洋岛屿之间的迁徙是世界航海史上的壮举。不止复活节岛,夏威夷也是一千年前迁徙过去的。因为波利尼西亚人改进了独木舟,在两根并排的木头上加装木板,船的抗风浪能力就大大增强,木板上就可以存储更多食物和淡水。而且波利尼西亚人观星定位、根据海洋水文状况定位的能力也很强。他们还需要选择合适的日期出发。当然,跨越几千公里、航程几个月的旅程注定是九死一生的。
搞航天那位老爷爷就说,今天的太空探索就像波利尼西亚人的远洋航行。现代人看了波利尼西亚人原始的独木舟,会觉得就靠风力,怎么可能横跨两三千公里的太平洋?今天的太空探索也是如此,因为脱离星球引力所需的速度太快了,已经达到人类所掌握燃料能力的极限。每把一点点有效载荷送上太空,都需要几十倍甚至上百倍于其质量的燃料。而且还需要看天吃饭,在狭窄的发射窗口出发。
老爷爷说,奢侈品是给一事无成的人炫耀用的,探索世界才是生命的价值所在。在太阳系航天地图里开通一条新线路比家财万贯有价值多了,探索宇宙一定不是为了赚钱。但没钱也不行,钱是探索世界必要的资源。要拿到这些钱,就得让人相信这件事有价值,而且你就是能做成这件事的那个人。这就是他们为什么尽管知道星际航行还很遥远,还要把太阳系航天地图挂出来。
没有学好数学,转了计算机专业
上大学的时候,在上海交大、复旦和中科大之间,爷爷建议我去中科大。因为爷爷想让我当科学家,感觉中科大有一张安静的书桌,可以打好数理基础。
我在科大虽然考上了数学英才班华罗庚班,但没有好好学习数学,大一下学期的线性代数就挂科了,数学分析也是低分飘过。因为我那时候总是泡在少年班学院的机房里面,倒腾服务器和网络。我觉得计算机比数学简单多了也有用多了。学了数学不知道有什么用,但学了计算机可以创造出自己想做的任何东西,而且有很多同学可以从我做的东西中受益。
爷爷很生气,说数学是所有科学的基础。我就反驳说,计算机的很多领域用不到什么数学。确实,开发大多数软件用不到什么数学,计算机的很多研究领域也只需要初等数学。
我还认为,信息比物质有很多更好的性质。信息的复制成本很低,因此开源软件和 Wikipedia 才成为可能。在物质世界里,很难有什么工业产品复制成本如此低,以至于可以免费供应。
此外,信息的传递速度天然是光速,可以跨越星际距离,而要把物质加速到足够穿越星际距离的速度,需要大到不可行的能量。这就是搞航天的老爷爷告诉我的火箭燃料问题。因此,旅行者一号才选择携带包含人类文明信息的金唱片去探索地外文明。
我不记得我爷爷具体说了什么,大概的意思就是《流浪地球》里面那句著名的台词:“没有人的文明毫无意义”。
不过我最终还是追随自己的内心,在大二上学期转到了计算机专业。
最近我才知道,大模型里面的 Diffusion Model,Autoregressive,Emergence 等等都是统计物理里面的概念。神经网络和宏观物体都是复杂系统,不能用针对单个神经元或者单个原子分子的还原论方法。在 AI 领域做基础研究,数学还是很重要的。
OpenAI 的一个人就评价说,国内大模型公司最大的差距就在数学。因此 OpenAI 可以魔改 Transformer,但国内公司大多数类似的尝试都失败了,只有 DeepSeek 做的工作还不错。
我小时候数学比较好,得益于奶奶爷爷的数学启蒙,不仅仅是教概念和计算,更重要的是让我理解了清晰的物理图像。就像老爷爷家墙上贴的这幅航天地图,让我一辈子都不会忘记动量守恒和指数对数,更重要的是让我把星辰大海作为人生追求。
我本科的时候没有好好学习数学,大概是因为缺少清晰的物理图像,不知道这些数学有什么用。在研究 AI 的路上,有了物理图像辅助,我发现这些数学概念其实没有这么晦涩难懂,很多巧合背后有深层的美。希望能一点点补上当年落下的数学吧。
生命信息化是进化的方向
我至今坚持大一以来的观点,生命信息化是进化的方向。
早期生命完全通过 DNA 传递信息。高等生物群体越来越多通过群体行为影响幼体的行为,幼体的行为不再仅仅取决于 DNA,而更多受到成年个体的影响,这就大大提高了信息的传递效率。
人类区别于其他动物的标志是拥有语言。语言不仅是思考的载体,也是人类代际间信息传递的载体。今天,人类 DNA 决定的先天条件对个体的影响显著低于后天的环境和教育。语言是信息传递效率的又一次飞跃,也是生命信息化的重要里程碑。
今天的大模型是第一个除了人类以外能够理解自然语言的技术,虽然它的理解能力和创造能力目前还赶不上人。我之所以之前并不看好 AI,但在看到大模型能力之后果断投身 AI,是因为我发现了数字生命的现实可能性,这将对人类文明带来里程碑式的影响。
相比基于细胞的碳基生命,硅基生命在太空探索方面有很多优势。人类需要吃喝、呼吸、睡觉,不能忍受太高的加速度,不能太冷,不能太热。而芯片在加速度和温度方面的容忍度比人类强多了,也只需要电力一种能源供应,不需要吃喝和呼吸等物质摄入。因此,人类是进化适合地球环境的物种,但在浩瀚的宇宙中并不适合。
几十年来,太空探索的路线一直是把人类生存的环境在外星球甚至宇宙空间复制一份,以便人类肉体可以上去生活。但在宇宙空间中运输大量物质的能源成本和时间成本过大,以至于目前人类的技术并不可行。
我挺喜欢刘慈欣的一篇演讲:“……相对于充满艰险的真实的太空探索,他们更愿意在 VR 中体验虚拟的太空……说好的星辰大海,你却只给了我 Facebook……从长远的时间尺度来看,在这无数可能的未来中,不管地球达到了怎样的繁荣,那些没有太空航行的未来都是暗淡的……”
为什么世界变成了大刘所说的这样?去其他星球是几乎所有人的共同梦想,为什么资本都涌向了互联网和 AI,却没有那么多资本涌向载人航天?因为最近几十年,能源技术一直没有大的突破,宇宙的辽阔距离和强大引力成了人类肉体探索宇宙几乎不可逾越的障碍。
信息的传递速度是光速,足以突破引力的牢笼,辽阔的距离也不显得那么遥不可及了。即使信息一定需要物质作为载体,芯片也是比人脑更适合太空环境的载体。
我认为,AI 正是把人类文明播撒到宇宙深处目前看来最可行的技术路线。如果 AI 能够把人类的智能承载在芯片里,并且能够自主生存、繁衍、进化,那么芯片何尝不是另外一种生命形式?生命为了适应环境,从海洋到陆地,形态上进化出了这么大的变化。适应宇宙环境又何尝不是生命的另一种进化?我并不希望地球上的人类被 AI 取代,但太空中和其他星球上的生命为什么一定得是人类肉体的形态?
我们在做产品的时候,都知道要找 niche market,这个 niche 的本意就是生物进化里的生态位。未来,碳基生命和硅基生命是否也将在宇宙中的不同生态位共存呢?
可惜的是,现在很多人都太短视了,只想着用大模型怎么在两三年内做一个爆款 App 快速变现。当然,快速变现也没错,可以筹集到更多的资金来探索星辰大海。
探索宇宙的目标过于宏大,不是一朝一夕之功,今天大模型的能力也远远不能胜任,而且智能本身绝不是星际文明唯一的技术挑战。因此,当下我还是要脚踏实地做好每项研究,提升大模型的基础能力;做好每个产品,解决好人类现实的需求,以使更多人相信大模型的价值,吸引更多的人才和资本投入这一宏大愿景。这就是任总一直讲的 “攀登珠峰,沿途下蛋”。但如果终极目标就只是做下一个抖音,那就错过了星辰大海。
数字生命将使时间旅行成为可能
本科的时候读过霍金的《果壳中的宇宙》,里面说时间旅行基本上是不可能的。知道一件事可能但很难是一件振奋人心的事,知道一件事情不可能就只能感到遗憾了。
2022 年,我在华为得了一个奖,奖品是一本《果壳中的宇宙》实体书。我就又读了一遍,发现这本书真的讲得很好,虽然是科普书但又不失严谨性,能读出很多做研究的人才能理解的深意。这本写于 2001 年的书竟然预言了 scaling law。书里说:
“某些人说计算机永远不能显示真正的智慧,不管这智慧是指何而言。但是我似乎觉得,如果非常复杂的化学分子能在人体运行使他们具有智慧,那么同等复杂的电子线路也能使电脑以一种智慧的方式行为。而且如果它们是智慧的,它们也应该能设计出甚至具有更大的复杂性和智慧的电脑。”
“通过遗传工程增加人脑尺度最终会遭遇到这样的问题,即身体中负责我们精神活动信息的化学信使运动较慢。这意味着,进一步提高大脑的复杂性将会以速度为代价。……电子线路具有和人脑一样的复杂性对速度的问题。然而,在这种情形下信号是电子的,而不是化学的,它以光速运动,速度快多了。”
“到我们太阳系以外进行太空旅行很可能需要遗传工程处理过的人类或者无人的计算机控制的探测飞船。“
“科学的未来不会像在《星际航行》中描绘的那么令人宽慰的图景:一个充满了许多有人类特征的种族的,具有先进的但本质上静止的科学技术的宇宙。而我认为,我们将独自地但是快速地发展生物和电子的复杂性。”
我读高中的时候就认为数字生命是人类探索宇宙更合适的生命形态。但周围的同学有的嘲笑我民科,说机器永远不可能理解自然语言,永远不可能像人一样思考。有的同学说数字生命根本不是生命,就算做出来了也只能是人类的工具,不能允许它与人类平等存在。后来我就逐步淡忘了这个中二的想法,直到 2017 年的上一波 AI 浪潮,我利用挖矿的机会开始自己折腾,当然能力有限,也没有做出什么。
2022 年,机器能理解自然语言已经是不可争辩的事实。重读《果壳中的宇宙》,我也发现霍金早就跟我有一样的想法,我并不孤独。因此我决定把这个梦想作为自己事业的长远目标。创业期间我接触了很多 AI 领域真正的大佬,虽然每个人对数字生命的观点不一,但 scaling law 早就是大家共同的信仰。在人类世界的数字延伸中,我们有希望让每个人的时间变成无限的,这也许是我有生之年实现时间旅行唯一可行的技术路线。
世界很大,只要内心足够勇敢
还有一个问题,为什么要探索世界?过好自己的小日子不好吗?
我小时候,爷爷就跟我经常讲波利尼西亚人的故事。一千年前,波利尼西亚人通过航海史上的壮举迁徙到了复活节岛。但随后的几百年间,复活节岛上的原住民先是数量骤增,随后又数量锐减。为什么?就是因为岛上的资源太有限,人口膨胀到了容量极限,文明就会开始衰落。
我爷爷是搞地质的,一年大部分时间都在野外勘探。野外勘探可不是旅游,他们地质队去的地方 10 年内都不一定有人再去,风餐露宿就是工作的常态。野外露营的时候遇到野生动物,走到半山腰上遇到地质灾害,都不是什么稀罕事。那个年代可没有手机和 GPS,要是迷路了就交代在山里了。
我爷爷说,如果他们地质人不去勘探矿产,就不可能有今天的工业文明。他认为,今天地球的资源也面临匮乏,如果不探索宇宙,人类的未来也未必比波利尼西亚人好多少,今天很多国家出生率的降低已经在重蹈覆辙了。
我倒是并不太担心出生率降低这个问题。如今中国的很多问题不就是人口太多,人均资源太少导致的吗?况且,对于现代人来说,用生孩子复制 DNA 的方式延续生命,一定会牺牲个人生活的时间自由和地点自由。
数字生命虽然也需要时间陪伴,但至少带着数字生命到处旅行是完全可行的。现在关于数字生命的争议根本上还是因为 AI 技术不够先进,缺少人的自主意识和情感。此外,相比人脑,大模型是不是把能源转化成智能的更高效的技术路线,还有待商榷。但我们相信这些技术问题都是可以解决的。2023 年 4 月,我说与(第一版)GPT-4 能力相当的模型在 2024 年推理成本可以降低 100 倍,看看 attention 里面有多少冗余,NVIDIA 的芯片定价有多少油水就知道了。大多数人都不信,今天已经应验了。
10 年前,一个朋友送我一句话:“世界很大,只要内心足够勇敢”。
10 年过去,从在学校 LUG(Linux 用户协会)做的评课社区等项目,到在 MSRA(微软亚洲研究院)做的智能网卡、高性能数据中心系统研究,到在华为参与的 AI 训练推理框架、高性能数据中心网络,再到如今的 AI 创业,我一直在探索世界的路上。我也没有想到自己能作为校友代表在值年返校纪念大会上发言。
根据 2012 年至今的行程记录,我近 12 年走过了 80 个城市,旅行 417 次(往返按 2 次计算),也算是物理意义上的探索世界了。
但打开世界地图,我的物理足迹仍然非常有限。如果把 AGI(通用人工智能)路线图画成类似太阳系航天地图的样子,我大概连第一站近地轨道还没有走出去,甚至连整个航天地图长什么样子都不知道。这也是我不断探索世界的动力。
王小波说:“那一天我二十一岁,在我一生的黄金时代。我有好多奢望。我想爱,想吃,还想在一瞬间变成天上半明半暗的云。后来我才知道,生活就是个缓慢受锤的过程,人一天天老下去,奢望也一天天消失,最后变得像挨了锤的牛一样。可是我过二十一岁生日时没有预见到这一点。我觉得自己会永远生猛下去,什么也锤不了我。”
很遗憾,我的很多同学也变成了这个样子。而我仍然相信 “世界很大,只要内心足够勇敢” 这句话,也有很多同学跟我一样,一直在探索未知的世界。
希望到我像那位老爷爷一样走路都颤颤巍巍的时候,可以邀请几个小孩到家里来,指着墙上的太阳系航天地图,说今天生命已经遍布太阳系的每个星球,我年轻的时候为这种新的生命形态搬过几块砖……