对话黄仁勋:深度解析推理模型、机器人与“AI 泡沫”伪命题
2025年回响
崛起中的 AI工厂
回望这“数倍指数级增长”的一年,黄仁勋指出,尽管规模法则(Scaling Laws)本在预料之中,但推理能力的激增以及“盈利性代币”(Profitable Tokens)的出现,甚至让这场变革的缔造者们都感到意外。我们正从预录制的软件时代,跨入每一次都是即时生成的智能时代。
开启新时代的三类工厂
AI已不再仅仅是软件,而是重型基础设施。为了支持代币的生成——被黄仁勋称为“AI工厂”的生产过程——美国正见证着三类截然不同的工业设施拔地而起,这不仅引发了技术设施的革新,更带动了电工、管道工等熟练工种的巨大需求。
- 1. 芯片制造厂 台积电与SK海力士正不断扩大晶圆代工产能。
- 2. 超级计算机工厂 专为Grace Blackwell架构与液冷机架打造的设施。
- 3. AI工厂 专用于代币生成(推理)的数据中心。
“每当你使用这种软件时……AI都是有史以来第一次被即时生成的,就像智慧本身。我称之为AI工厂,因为它生产的代币将供应全球。”— 黄仁勋
放射科悖论
杰弗里·辛顿曾有名言,预言AI将使放射科医生被淘汰。现实如何?AI已渗透进放射科的每一个角落,然而对人类放射科医生的需求却反而 增加了。这恰恰说明了AI对劳动力市场影响的反直觉本质。
既然放射科医生在AI无处不在的情况下依然蓬勃发展,那么劳动力恐慌又该如何解释?答案在于区分 任务 与 目标 的工作定义。
任务 并非 目标.
生产力悖论之破解:为何自动化反而带来了 更多的 雇佣,而非减少?答案在于区分工作的机械行为与其终极的人本目标。
案例研究:放射医学
“我们让他们变得越高效,需求就会越多。全球医疗健康事业尚未触及发展的顶峰。”
案例研究:法律
“法律的初衷是提供保护。这绝非单纯的合同审查。自动化使律师能够专注于冲突调解中更具人性关怀的环节。”
“若世间问题皆已界定且再无新疾,那么生产力的提升确会令经济萎缩。但显而易见,它将推动经济增长。”
经济中的“空吸效应”
我们面对的并非劳动力过剩,而是严峻的短缺。工厂、货运、护理——这些受限于人力供给的领域,正渴求通过自动化来维持社会运转。
新兴产业预测
正如汽车催生了维修业(十年滞后期),十亿台机器人将创造出 全球规模最大的维修与保养产业。
劳动力严重短缺领域(情境严重性分析)
串联线索
我们已经探讨了机器人技术如何通过区分“任务”与“目的”来化解体力劳动危机。但对于机器人或任何系统而言,执行任务都依赖于深层的、隐藏的基础设施。现在,我们揭开外壳,揭示智能本身的职能解剖结构。
五层
技术蛋糕。
人们往往误以为 AI 仅仅是一个聊天机器人。事实上,它是一系列复杂问题的“混沌交织”,并被结构化为一个明确的工业技术栈。
应用层
生物学、Harvey、全自动驾驶、机械人类。
模型层
理解信息(生物、物理、语言)。
基础设施
硬件与软件的编排。
芯片
算力。
能源
转化为智能的原始投入。
超越人类语言
我们倾向于将 AI 拟人化,认为它只懂英文。但分子不讲英文,蛋白质也不讲英文。“模型层”实际上是各种信息模态的多元图谱。
图 3.1:模型层必须能够解读多样的信息结构,而非仅仅是文本。
创新的氧气
失去开源,AI 生态系统将会窒息。虽然前沿实验室可能出于投资回报率的考量而选择闭源模型,但世界上的其余部分——初创企业、大学、工业制造——都依赖于预训练的开源基础来构建专业工具。
“无论你在政策制定上作何决定, 请勿破坏创新的飞轮。 不要忘记开源。不要忘记生物学。”
分析完成
该结构是多元的、分层的,且依赖于开放交流。
下期预告
“神级 AI”的神话与末日论叙事 →
承上启下
在确立了现代 AI 技术栈是构建在开源基础之上的“千层蛋糕”后,我们现在必须面对那个威胁并扼杀此类务实创新的理论幽灵:关于“神级 AI”的夸张言论。
“神级 AI 根本
并不存在。”
认为单一模型能同时精通人类语言、基因组语言、物理学和分子生物学的想法,无异于一场“史诗级”的幻想。
我们不能坐等神明来提振经济。世界需要的是在下周而非下个世纪阔步前行。人工智能不过是下一个计算机产业——而地球上没有哪个国家不需要计算机。
“毁灭论”叙事的用意
科幻小说式的政策
极具威望的人士描绘了一幅“末日景象”。虽然这很适合大银幕,但将科幻小说带入政府听证会却会造成实质损害。它扼杀了初创企业,并令非技术背景的决策者感到困惑。
监管俘获
为什么首席执行官们会主张监管自己的行业?其意图往往是“过河拆桥”。这是防止新兴初创公司进行有效竞争的经典手段。
“我不认为公司应该向政府游说以监管其他公司……他们的意图显然存在深层的利益冲突。”
安全悖论
为何成本下降会使人工智能更安全,而非更危险。
对智能体的监管
人们担心廉价的AI会导致危险且缺乏监控的智能体。事实恰恰相反。如果人工智能的边际成本下降,我们就能负担得起在每个“行动型AI”周围部署数百万个“监控型AI”。
“这与降低维护社会安全的边际成本并无二致。这就如同在每个角落都布设警力。”
这种安全机制的本质是经济性的。
要实现这种“数字守护者”的生态系统,智能的价格必须崩塌。接下来,我们将探讨驱动这种成本骤降的代币经济学,以及行业向基础研究的回归。
延续关于监管及“神级AI”叙事的辩论……
当世界正忧虑于如何管控巨头垄断之力时,真正的革命已在经济领域悄然发生。智能成本正呈崩塌式下降,权力正从少数精英手中流向大众。
代币经济学
丰盈时代
“如果你告诉我,十年内代币生成的成本将降低十亿倍,我并不会感到意外。”
2024 年度基准
百倍级骤降
仅在一年之内,GPT-4 级模型每百万代币的成本就暴跌了超过一百倍。
“曾经动辄耗资数十亿、非超级计算机不可完成的任务,如今在高性能个人电脑上即可初现雏形。”
黄仁勋的观察
复合加速效应
“深度求索” (DeepSeek) 悖论
“DeepSeek 的论文,或许是硅谷研究人员在过去两年中所读过的最重要的一篇。”
与孤立主义的叙事相反,美国的 AI 实验室正从全球开放研究中获益匪浅。创新并非零和博弈;成本的降低,实则是源于全球范围内架构改良的集体反馈闭环。
从通才迈向专才
我们正从单纯追求规模的时代,迈向注重研究与专业化的时代。模型不再需要“漫无边际”地消耗资源。
- 微型细分市场的初创公司正发掘效率之源。
- 向垂直领域专业化分化(如:编程)。
- 预训练不过是“学会如何学习”。
当智能变得廉价且专业化时,世界将会如何?
算力成本的断崖式下降,不仅仅是基础设施的变革,它更将从根本上改写软件工程师的职业定义。
编码的消亡,
工程的诞生。
为什么“AI原生”的十亿级用户应用并非社交网络的新形态——它代表着人类意图与机器执行之间屏障的瓦解。
倘若我们的工程师都不再编写代码,而是在解决问题,那将是我莫大的欣慰。
范式转移
任务(编码)
将指令转化为语法。极易被 AI 替代(如 Cursor, Copilot)。
目的(工程)
发现未知问题并设计解决方案。这种需求是无穷无尽的。
“如果目的不在于编写代码,而在于解决问题,那么我们突然间便有了做不完的工作。”
可编程性护城河
为什么英伟达拒绝固化的 ASIC?因为算法的演进速度快于硅片。摩尔定律已近停滞,但算法创新却要求每年实现百倍跨越。
- 固定架构: 固然适用于昨日的 CNN,但在今日的 SSM 面前已显过时。
- 可编程架构: 能够适应 Transformer、Mamba、扩散模型以及未来的一切。
年度性能贡献
“ChatGPT 时刻”
之于生物学
正如语言模型学会了预测下一个 Token,生物模型也正在学习预测下一个蛋白质结构。随着 多模态、合成数据与长上下文计算 的交汇,生命的物理基质正被数字化。
蛋白质理解
解码生物结构的语言。
生成式生物学
设计新型蛋白质和分子(例如 Lot 蛋白质)。
世界基础模型
针对细胞、化学物质及物理相互作用的统一模型。
“我们正在为物理世界的重工业构建基础设施。”
我们已经实现了编程者的数字化。目前我们正致力于将生物学数字化。但要真正完成这一闭环,AI 必须走下屏幕,进入物理环境。最后的壁垒并非语言或蛋白质——而是物理学。
承接
在探讨了 AI 如何重塑软件工程之后,这场对话现在从屏幕跃向了街头。智能已不再仅仅局限于生成代码;它正开始在物理空间中穿梭。
……的时代 具身推理
自动驾驶汽车仅仅是序幕。我们正从“感知汽车”迈向“推理汽车”——这些机器不再仅仅遵循数字轨道,而是能够实时思考新颖的场景。这一根本性的转变正在加速通用机器人的实现进程。
自动驾驶的四个时代
第一时代:数字轨道
智能传感器、精细地图、人工工程化算法。(早期 Waymo/Mobileye)。
第二时代:模块化深度学习
感知、世界模型与规划作为独立模块。执行过程较为脆弱。
第三时代:端到端模型
现状。神经网络直接处理从输入到输出的全过程。(特斯拉 FSD/现代技术栈)。
第四时代:推理系统
能够通过推理链“思考”分布外(OOD)事件的汽车。这代表着未来。
垂直化悖论
为何通用模型不足以应对工业机器人:满意度与故障容忍度的权衡。
“没人关心那 90% 的成功,人们只在意那 10% 的失败。”
“一个人之所以能对‘勤杂工’的工作侃侃而谈却从未亲身体会,是因为他从未真正做过那行。”
— 论垂直整合的必要性
垂直领域的“套壳”公司并未过时。要弥合从 99% 准确率到物理工作所需的 99.9999% 之间的鸿沟,需要深厚的行业同理心。
机器人:比汽车发展更快?
下阶段展望
扩展机器人规模和智能推理汽车需要庞大的物理基础设施。这种具身智能的爆发导致了一个关键瓶颈……
承接
我们已经阐明了机器的物理演进——从自动驾驶汽车到自主机器人。但无论机器多么智能,都会产生无止境的渴求。当我们从 AI 的“躯干”转向其“血液”时,话题转到了统领所有增长的唯一资源: 能源。
智能的
热力学
“没有能源,就没有工业增长;没有增长,就没有繁荣。”
能源务实主义
叙事已经转变。纯可再生能源时间表的理想主义观点已与 AI 需求的纯粹物理现实正面交锋。黄仁勋认为,尽管风能和太阳能至关重要,但从数学逻辑来看,它们不足以支撑数据中心近期的爆发式增长。
- — 天然气: 未来十年必要的过渡桥梁。
- — 核能(SMR): 长期来看的必然解决方案。
- — 需求驱动绿色科技: AI 巨大的电力需求实际上正在 加速 电池和太阳能领域的创新,而非阻碍。
“全方位”能源策略
AI 基础设施能源来源(预测需求)
“末日论者是在晚宴上听起来很聪明的人。
乐观主义者则是推动人类进步的人。”
2026:地缘政治堆栈
步入 2026 年,讨论的焦点转向了中美关系。黄仁勋提出,“脱钩”论过于天真。与其将技术视为铁板一块的单一整体,我们更应将其视作一个堆栈。
中美技术挂钩
防火墙之下深藏的繁荣引擎
“世界上最强大的军事力量,是以世界上最强大的经济体为支撑的。”
我们已经确保了运行机器所需的能源。我们已经分析了维持硬件流动的地缘政治博弈棋局。然而,庞大的基础设施和全球贸易需要海量资本的支撑。
泡沫迷思。
要理解 AI 的经济逻辑,就必须穿透聊天机器人的表象。我们目睹的并非一场投机泡沫,而是全球 2 万亿美元研发领域的底层平台重构。
根本性转变
“首先要意识到的是,我们需要退后一步,审视正在发生的实相。摩尔定律已基本走向终结。你无法再让 CPU 独自承担所有工作。”
即使今天没有 OpenAI、Anthropic 和 Gemini,英伟达也依然会是一家市值数千亿美元的公司。
这种需求并非仅仅由生成式文本驱动,而是由计算物理学驱动的。我们正在从通用计算转向加速计算。从经典的机器学习和数据处理(SQL、XGBoost)到分子动力学——技术栈的每一层都需要加速,以保持其通缩属性。
水面下的冰山:超越聊天机器人
自动驾驶汽车
英伟达的自动驾驶业务正逼近 100 亿美元大关。为无人驾驶出租车(Robo-taxi)训练世界模型需要海量的算力储备。
数字生物学
制药巨头正将湿实验室转化为超级计算机。模拟正在取代传统的试错法。
金融量化
整个量化交易行业正在从人为特征提取的数学模型,转向由人工智能发现的预测特征。
两万亿美元的重新分配
传统的研发支出被分配给物理实验、湿实验室和人力驱动的分析。
企业正逐渐意识到,为了保持竞争优势,其研发预算必须转化为基础设施预算。
那两万亿美元现在正流向超级计算机。这并非为泡沫印制的“新钱”,而是资本的重新定向。
“给我举个初创公司的例子,谁会说‘不,我们已经够了’?他们都对算力极度渴求。再给我举个研究员的例子,谁会说‘我有足够算力’?每个人都渴望算力。”
怀疑论往往源于对那些步履蹒跚的企业的观察。但创新正发生在前沿——在四万家初创公司中,在数字生物学中,在像 Cursor 这样的编程助手里。我们正从“搜索”(检索链接)迈向“答案”(知识合成)。这不是泡沫,而是智能的工业化。
从投机转向战略
在上一篇章中剖析了炒作周期的本质,并对当前估值的可持续性提出质疑之后……
这 定论。
虽然市场显现出过热的典型征兆,但底层效用暗示,这与其说是泡沫,不如说是对预期的修正。“AI 泡沫”的本质并非技术的失败,而是时间表的回归理性。
市场情绪
短期波动在所难免,但长期资本支出依然看涨。
真正的风险
不在于技术采用,而在于执行。胜负将取决于落地实效,而非一纸宣言。