2025 AI 巅峰对话精选:对话李飞飞、OpenAI 团队及行业先锋
2025:AI 站稳脚跟的一年
“这一年,我们一直在与未来的架构师们对话——从 Harvey 到 OpenAI。但在展望未来之前,我们必须回顾那些在正确时机拥抱新技术、捕捉到‘魔法时刻’的瞬间。”
r/legaladvice 实验
Winston Weinberg 和 Gabe 多年前就相识了,但 Harvey 的契机并非源于商业计划,而是源于一个 Reddit 帖子。他们采用了 GPT-3(当时虽然公开但被忽视了),并将其对准了混乱的 r/legaladvice。他们专注于房东和租客的纠纷,使用了原始的‘思维链’提示,然后做了一件大胆的事:他们没告诉律师那是 AI。
律师认可率 (%)
来源:Harvey 针对 100 个案例的内部测试
“我们给 OpenAI 的总法律顾问发了一封冷启动邮件。他的回复是:‘噢,我完全不知道模型在法律领域竟然这么厉害。’”
空间智能不仅仅是一个“功能”——它是进化史上解决过的最难的问题。
李飞飞博士认为,动物进化出眼睛主要是为了在脑海中重建三维世界。这是导航、交互和操作的基础。人类是操作的大师,但我们仍然在生成这一端苦苦挣扎。
“如果我现在让你闭上眼睛,在脑海里为你周围的环境建模……这并不容易。在经过训练之前,我们并没有能力生成极其复杂的三维模型。”
想象一下这样一个世界:AI 让我们触手可及地拥有这种能力——流畅的交互性、可编辑性,以及将物理世界数字化呈现的力量。它不仅仅是一个工具,它为人类开启了一个完全不同的世界。
关于“替代”的辩论
我认为许多岗位的取代会发生得非常快。这将是痛苦的,也是一个重大的政治问题。我们将看到围绕这一现象出现庞大的民粹主义运动。
最终会发生什么?百分之 X 的白领工作消失了。那些人该做什么?
他们会转向物理世界。机器人数据创建、服务员、治疗师——这些人们渴望人类互动的领域。物理世界的自动化速度将远慢于数字世界。虚拟世界具有自我强化的收益,而物理世界没有。
接下来播报
丹·亨德里克斯谈超人工智能的地缘政治
新的核威慑
丹·亨德里克斯谈为什么超人工智能竞赛映照着冷战——以及网络先发制人如何成为新的第一击。
“我们已经从讨论 AI 如何取代程序员,转向讨论 AI 如何取代国家主权。从空间智能到全球主导地位的转变,其速度快到条约都难以跟上。”
共同脆弱性学说
回想一下核战略。各国放弃第一击并不是出于仁慈,而是因为 共同脆弱性。如果你把我消灭了,我的发射井里仍有足够的弹药来终结你。我们正接近 AI 的类似转折点。
当一个国家即将实现所有 AI 研究的自动化——本质上是创造一个 AI 构建更快 AI 的自举循环时——这被视为一个“关键”时刻。它是一种超级武器。而对此的回应将不仅仅是联合国的一封严厉信函。
“各国将试图 相互威慑 ,以防止对方开发出足以摧毁其他国家的超级武器。”
局势变得不稳定。中国看到美国即将取得突破,便对数据中心发起了先发制人的网络攻击。俄罗斯盯着美中竞争,决定通过高级间谍活动进行监视,因为软件工程不再仅仅是“技术”——它是国家实力的基础。
努巴·阿费扬:不再只是“射门尝试”
“我在1987年创立了一家公司,那时24岁的移民还不怎么创业……只有IBM的高管才会被信任去掌管2300万美元。”
批判
为什么创业被视为是“随机的、特立独行的且感性的”?
“博弈化”谬论
我们把医疗、气候和粮食安全当作一场运气游戏。“哦,我们尝试了20件事,其中一件成功了。”作为一名工程师,这令人反感。我们需要让创业成为一种科学化的职业,而不是一场豪赌。
你所说的“博弈化”是什么意思?
这种想法认为失败本就是常态。我们投入辛苦赚来的钱去做那些“几乎不可能完成的事”。我们不能仅仅将其称之为“射门尝试”。我们必须不断完善流程本身。
推理时扩展(Test-Time Scaling)革命
来自 OpenAI 的 Brandon McKinzie 和 Eric Mitchell 正在见证一场“神奇”的转变。这不再仅仅关乎模型的大小(预训练);而是关乎模型在说话前思考了多少(推理时)。
视觉推理扩展斜率
一旦模型将算力分配给特定的工具和视觉裁剪,斜率就会显著变陡。
视觉自我意识
模型现在可以估计自身的不确定性。它会告诉你:“我看不清你说的那个东西。”它不再产生幻觉,而是通过处理图像或裁剪某个区域来提升视觉效果。
交付给工具
为什么要让大语言模型(LLM)尝试在其上下文中“硬啃”复杂的估值模型?更有效率的做法是让它编写代码用正确的方式去完成。我们正在从“无所不知”的大模型转向“专家协调员”型的大模型。
随着这些模型学会将任务委托给工具,下一个挑战是训练它们进行深入、自主的研究。接下来:Isa Fulford 将探讨深度研究的前沿领域。
灵光一现的瞬间
除了推理模型的理论突破之外,还有训练现场最直观的现实。Isa Fulford 谈论将深度研究转化为现实中的“品味”与“磨砺”。
“这确实是那种我们认为在浏览任务上进行训练会有用……但看到它真正起作用并亲手操作模型时,感觉还是挺不可思议的。坦白说,虽然我们预料到它会奏效,但它表现得这么好还是让我们感到惊讶。”
“这是一种直观的体验,就像是,噢,这条路铺满了草莓。”
在墓地中创新
在 Conviction,我们寻找技术如何让“糟糕”的市场突然变好。Arvind Jain 在企业搜索领域创立了 Glean——而这个品类曾被所有人认为是死路一条。
SaaS 带来的解锁
在 SaaS 出现之前的世界,搜索是不可能实现的。你连服务器都找不到,更别提数据了。但 SaaS 改变了底层逻辑:系统变得开放、无版本区分,并可通过 API 实现互操作。
“最大的问题实际上已经解决了:我可以轻松地将所有的企业信息汇集到一处。”
规模检查
1,000,000,000
如今单个现代企业客户内部的文档数量。
数据爆炸:过去 vs. 现在
2004 年 Arvind 在 Google 搜索工作时,整个互联网的规模仅相当于如今的一家大公司。
“妈妈以后每天晚上都能陪我们吃晚饭了。”
— 一位医生的丈夫,通过 Abridge 分享
Shiv Rao 将超速增长带来的“多巴胺冲击”——那些冲刺、交易和规模扩张——与 “催产素冲击” 区分开来。后者才是支撑一家公司走过医疗保健领域建设中那段“电线杆式的漫长旅途”的关键。
Abridge 并不只是在优化病历记录;它正在为那些因职业倦怠而徘徊在退休边缘、奋斗了几十年的医疗工作者们赢回时间。当一位乡村医生意识到,因为一个 AI 工具,她真的能回家见到孩子们时,这项技术就不再只是一个抽象的推理模型,而是成了释放人类潜能的关键。
这些对话提醒我们,我们正生活在历史的一个关键转折点。当我们结束对这些领军建设者的观察时,我们发现了一个共同点:无论是枯燥的模型训练,还是“沉寂”市场的复苏,其目标都是为真正重要的事情腾出空间。
当代码
遇见 良知
从 Arvind Jain 关于企业终将“记住”一切的愿景,到 Shiv Rao 博士将“人情味”带回医疗保健的使命,我们这一路走来感慨良多。它留给了我们一个问题:如果 AI 解决了我们的效率危机,那么我们要用换回的时间去做什么?
“AI 最终的投资回报率不是电子表格上的百分比;而是在那些真正重要的时刻,恢复人的参与和陪伴。”
— 结语感悟
“寻觅”意义
Arvind 在 Glean 的工作证明,我们面临的痛苦并非信息匮乏,而是注意力的贫瘠。通过自动化“寻找”的过程,我们释放了“创造”的潜力。未来的企业不再是一个数据库,而是一个活生生的有机体。
Shiv Rao 的观点
“如果医生盯着屏幕看,他们就没在看病人。AI 修正了这种注视。这既简单,又意义深远。”
摩擦指标
85%
预计到 2026 年,高产专业人士的“键盘疲劳”将减少。
我们正在从一个“我们使用的工具”的世界,迈向一个“我们信任的伙伴”的世界。这个转型过程虽然混乱、喧杂,但它终于到来了。
人们很容易迷失在 LLM 的炒作中——那些基准测试、Token 数量和估值狂潮。但在与 Arvind 和 Shiv 交流后,杂音散去。剩下的是一幅非常清晰的图景:增强而非替代。
Arvind 正在为全球劳动力构建“内部大脑”,确保没有任何天才创意会再因信息孤岛而湮灭。Shiv 正在重塑诊室这一“神圣空间”,确保无论是绝症诊断还是新生命的诞生,记录它们的都不再是键盘的敲击声,而是人类双眼的见证。
“感谢聆听这一转变。下一章由你书写。”
前行之路
集成。 AI 从独立的标签页转移到所有应用程序的后台。
代理化。 系统开始执行多步操作,而不仅仅是响应提示词。
无形化。 我们不再谈论“AI”,而是重新开始谈论“工作”本身。