Bojie Li (李博杰)
2024-07-21
Web3 最大的两个优势是通证经济(tokenomics)和信任(trust)。通证经济解决的是利益分配的问题。这篇文章主要讲信任问题。
传统 Web2 的信任本质上是对人的信任。我敢把数据放在苹果和谷歌,是因为我相信苹果和谷歌不会出售我的数据。我敢在脉脉上匿名吐槽公司,是因为我相信脉脉不会把我的身份信息泄露。但显而易见的是,在利益面前,人并不是那么可信的。
Web3 能够如何更好地解决信任问题?我认为,Web3 的信任有三大来源:密码学信任(Cryptographic Trust)、去中心化信任(Decentralized Trust)和经济学信任(Economic Trust)。
密码学信任的本质是信任数学,去中心化信任的本质是信任大多数人不会串通起来作恶,经济学信任的本质是信任大多数人不会做亏本的买卖。因此,这三种信任是可靠性递减的。
那为什么不只用密码学信任呢?因为很多问题是单靠密码学信任无法解决的。这三种信任虽然可靠性递减,应用范围却是递增的。
接下来,我们就逐一介绍这三种信任。
密码学信任
- 如何既不透露我是谁,又能证明我的身份?例如,脉脉需要验证我是某家公司的成员,但我又不希望把我的确切身份告诉脉脉,这可能吗?
- 有随机性的在线游戏如何保证公平性?例如,一个德州扑克的游戏平台如何证明自己的发牌是绝对公平的,没有庄家在悄悄看牌?
2024-07-21
太空探索需要的燃料太多了
小时候院子里有一个搞航天的老爷爷,他经常给我科普一些航天知识。我印象最深的就是他家墙上贴着一幅太阳系航天地图,就类似下图的样子。
老爷爷跟我说,这个太阳系航天地图看起来是不是很像火车线路图?只是上面标的数字都不是距离,而是速度的变化量(Delta-V)。
他年轻的时候也希望建成像火车一样四通八达的航天网络,只是里面的车站不再是北京西、上海虹桥,而是地球表面、近地轨道、地月转移轨道、火星转移轨道、火星表面等等。但遗憾的是,人类迄今为止,这张图里大多数的车站都还没去过。
这里面最重要的原因就是人类的能源技术在太空面前太落后了。现在的火箭都是靠喷出推进剂来推进的,如今最快的喷出速度只有大约 4500 米/秒。这远比子弹的速度快,但在太空面前仍然不算一个很快的速度,例如第一宇宙速度就要 7900 米/秒,考虑到空气阻力和 250 千米轨道处的重力,需要大约 9200 米/秒的速度增量才能进入 250 千米高处的地球轨道。
更致命的是火箭所需携带的燃料质量是随所需速度变化量指数增长的。还在上小学的我不理解,推进剂的喷出速度不变,难道不应该是速度跟烧掉燃料的量成正比吗?比如汽车的油箱里面多一倍的油,就能多走一倍的路程啊。
2024-07-06
科大 2024 值年返校有近 5000 人参加,我们 2010 级少年班学院的回来了大约 1/4。
尊敬的各位领导、各位老师,亲爱的校友们:
大家下午好!我是 2010 级 00 班的李博杰,非常荣幸能作为校友代表发言。转眼间,本科毕业已经十年了。
首先,我要向母校表达我最诚挚的感谢。从 2010 年到 2019 年,从本科到硕士、博士,我认识了一批优秀的同学和校友,至今都是我最好的朋友,也是创业中的合作伙伴。读博期间,我老婆实验室的谈老师邀请我做一个学术报告,我跟我老婆就是那时认识的。
2024-05-05
(本文是我的知乎回答《事业心很强的男生适不适合做人生伴侣?》)
开始创业之后,认识很多创业者,大多数都是事业心很强的男生。
发现一个有趣的现象:这些创业者单身率明显比同龄人高。而且婚姻的稳定程度也比同龄人低。
单身率高
在 AI、移动互联网和 Web3 领域,创业成功的联合创始人,基本上身价至少一个小目标;创业没成功的联合创始人,基本上也有非常光鲜亮丽的履历,比如名校毕业,大厂高职级,各种头衔和奖项。他们/她们肯定是不愁找到很好的伴侣的。但为什么单身率这么高,婚姻稳定度这么低呢?
核心原因就是事业心很强的男生大多数时间和兴趣都在事业上,对生活、感情和家庭的投入比较少。
2024-04-22
一个月前知乎《新人物》的访谈视频终于发布了。我还是第一次参加此类带生活内容的访谈,这绝对不是公司的 PR,因为全程都没有出现我们公司的名字和产品,甚至很少有人知道我们公司真实的名字。
感觉知乎还是挺有做媒体的操守的,采访之后没有让我看视频,就直接发布了,所有剪辑、标题和旁白都是知乎小编做的。
(04:16,215 MB)
视频拍摄地:
- 北京办公室
- 家里(访谈,跟老婆一起做饭,还有一些照片)
- 树村郊野公园(我经常跑步的地方,那个会飞的电动蝴蝶是我 2017 年做的,拍摄过程中被挂到了树上,还是我们非常强悍的摄影师小哥哥爬到树上给摘下来的)
2024-04-17
来源:搜狐科技采访《国内大模型不好做?字节百度和独角兽混战出海,70多款 AI 产品谁先赚到钱?》
出品 | 搜狐科技
作者 | 梁昌均
“我现在每天从上午9点到下午3点,一起跟国外团队开会,进行远程开发、内测或修 Bug。”马上就要在海外发布 AI 产品的创业者李博杰,最近一段时间变得异常忙碌。
这是一款面向 C 端的 AI 评估产品,可以用来帮助用户推荐不同的 AI 模型或产品,他希望将这款产品打造成“大模型时代的抖音”。
一年多前,李博杰选择从华为离职创业的时候,就决定进军海外。那时,国内大模型还处于火热比拼技术的阶段,但现在越来越多的公司都选择了跟他相同的方向。
无论是字节、百度、阿里,还是 MiniMax、月之暗面、零一万物等大模型独角兽,都在加速出海,掘金全球市场。
不少企业正在闷声发大财。搜狐科技了解到,多个出海产品实现了用户和营收的快速增长,甚至开始走向盈利,还有产品在获得 AI 加持后流量暴涨,今年有望实现七八千万元的利润。
移动互联网时代,中国公司出海跑出了 TikTok,现在大家都在尝试打造 AI 时代的 TikTok。这是巨大的机遇,但也充满着挑战。
2024-04-15
(本文首发于知乎回答:《如何培养在计算机系统领域的研究品味(Research Taste)?》)
转眼间从科大本科毕业已经接近 10 年了。昨天跟老婆讨论我们科大系统圈子同学近期的发展,就发现 research taste 是决定学术成果最关键的因素。第二关键的因素则是动手能力。
什么是 research taste?我认为,research taste 就是找到未来有影响力的研究方向和研究课题。
很多同学技术很强,也就是动手能力很强,系统实现能力很强,但是仍然做不出来有影响力的研究成果,主要原因就是 research taste 比较差,选的研究方向要么只是蹭热点,缺少自己的思考;要么过于小众,没有人关注。
博士生的 research taste 靠导师
我认为,research taste 早期主要靠导师培养,后续主要靠自己的愿景。
2024-04-14
(本文首发于知乎回答:《目前大语言模型的评测基准有哪些?》)
必须吹一波我们 co-founder @SIY.Z 的 Chatbot Arena 呀!
Chatbot Arena 是基于社区评价的大模型评测基准。上线一年来,Chatbot Arena 已经有超过 65 万次有效用户投票。
Chatbot Arena 见证大模型的快速进化
最近的一个月,我们在 Chatbot Arena 上见证了几件非常有趣的事情:
- Anthropic 的 Claude-3 发布,大杯 Opus 模型的性能超越了 GPT-4-Turbo,中杯 Sonnet 和小杯 Haiku 模型的性能也追平了 GPT-4。这是 OpenAI 以外的公司首次夺得排行榜的首位。Anthropic 的估值已经 $20B,直逼 OpenAI 的 $80B 了,OpenAI 是应该有点危机感了。
- Cohere 发布了迄今最强的开源模型 Command R+,104B 模型的性能追平 GPT-4,当然跟 GPT-4-Turbo 还有一定差距。我今年年初接受甲子光年采访的时候提出了 2024 年大模型四大趋势(《AI 一天,人间一年:我与 AI 的 2023|甲子光年》):“多模态大模型能够实时理解视频,实时生成包含复杂语义的视频;开源大模型达到 GPT-4 水平;GPT-3.5 水平开源模型的推理成本降到 GPT-3.5 API 的百分之一,让应用在集成大模型的时候不用担心成本问题;高端手机支持本地大模型和自动 App 操控,每个人的生活都离不开大模型。” 第一个是 Sora,第二个是 Command R+,都已经应验。我还是重复这个观点,如果一家主要做基础模型的公司 2024 年还训练不出 GPT-4 的话,就不用再折腾了,浪费了大量算力,最后连开源模型都比不上。
- 通义千问发布了 32B 开源模型,几乎可以达到 top 10,不管中文英文都很能打。32B 模型在成本上的杀伤力还是很强的。
- OpenAI 被 Anthropic 的 Claude Opus 超过了,自然也不示弱,马上发布了 GPT-4-Turbo-2024-04-09,又夺回了排行榜上第一的宝座。不过 OpenAI 迟迟没有发布 GPT-4.5 或者 GPT-5,而且大家期待的多模态模型一直没有出来,这是有点令人失望的。
2024-04-07
本视频是 B 站 Up 主 “苹果冒个泡儿” 对我的采访视频,原视频链接
整个采访半个小时,是一次录完的,除了 Up 主加的片头之外,基本上没有剪辑,也没有提前准备问题的回答。
(27:07,136 MB)
2024-03-29
(全文约 4 万字,主要内容来自 2023 年 12 月 21 日在中科大校友会 AI 沙龙上的 2 小时报告,也是 2024 年 1 月 6 日知乎 AI 先行者沙龙 15 分钟报告内容的技术扩展版本,文章经笔者整理和扩展)
非常荣幸来到科大校友会 AI 沙龙分享一些我对 AI Agent 的思考。我是 1000(2010 级理科实验班)的李博杰,2014-2019 年在中科大和微软亚洲研究院读联合培养博士,2019-2023 年是华为首届天才少年,如今我跟一批科大校友一起在做 AI Agent 领域的创业。
今天是汤晓鸥教授的头七,因此我特别把今天的 PPT 调成了黑色背景,这也是我第一次用黑色背景的 PPT 做报告。我也希望随着 AI 技术的发展,未来每个人都可以有自己的数字分身,实现灵魂在数字世界中的永生,在这个世界里生命不再有限,也就不再有分离的悲伤。
AI:有趣和有用
AI 的发展目前一直有两个方向,一个是有趣的 AI,也就是更像人的 AI,另外一个方向就是更有用的 AI,也就是更像工具的 AI。
AI 应该更像人还是更像工具呢?其实是有很多争议的。比如说 OpenAI 的 CEO Sam Altman 就说,AI 应该是一个工具,它不应该是一个生命。而很多科幻电影里的 AI 其实更像人,比如说 Her 里面的 Samantha,还有《流浪地球 2》里面的图丫丫,黑镜里面的 Ash,所以我们希望能把这些科幻中的场景带到现实。只有少数科幻电影里面的 AI 是工具向的,比如《钢铁侠》里面的贾维斯。
除了有趣和有用这个水平方向的之外,还有另外一个上下的维度,就是快思考和慢思考。这是一个神经科学的概念,出自一本书《思考,快与慢》,它里面就说人的思考可以分为快思考和慢思考。
所谓的快思考就是不需要过脑子的基础视觉、听觉等感知能力和说话等表达能力,像 ChatGPT、stable diffusion 这种一问一答、解决特定问题的 AI 可以认为是一种工具向的快思考,你不问它问题的时候,它不会主动去找你。而 Character AI、Inflection Pi 和 Talkie(星野)这些 AI Agent 产品都是模拟一个人或者动漫游戏角色的对话,但这些对话不涉及复杂任务的解决,也没有长期记忆,因此只能用来闲聊,没法像 Her 里面的 Samantha 那样帮忙解决生活和工作中的问题。
而慢思考就是有状态的复杂思考,也就是说如何去规划和解决一个复杂的问题,先做什么、后做什么。比如 MetaGPT 写代码是模拟一个软件开发团队的分工合作,AutoGPT 是把一个复杂任务拆分成很多个阶段来一步步完成,虽然这些系统在实用中还有很多问题,但已经是一个具备慢思考能力的雏形了。
遗憾的是,现有产品中几乎没有在第一象限,兼具慢思考和类人属性的 AI Agent。斯坦福 AI 小镇是个不错的学术界尝试,但斯坦福 AI 小镇里面没有真人的交互,而且 AI Agent 一天的作息时间表都是事先排好的,因此并不是很有趣。
有趣的是,科幻电影里面的 AI 其实大部分是在这个第一象限。因此这就是目前 AI Agent 和人类梦想之间的差距。因此我们在做的事情跟 Sam Altman 说的正好相反,我们希望让 AI 更像人,同时又具备慢思考的能力,最终演进成一个数字生命。