E216|对话机器人投资人:投资也得看论文,规模性商业化还很远
具身智能:是 GPT-3 爆发前夜,还是泡沫破裂前夕?
“大家都在等待机器人赛道的‘ChatGPT时刻’,但现实与估值之间还隔着一道巨大的鸿沟。”
最近机器人领域确实火得有点“离谱”。前几天 1X 发布了能进家庭的人形机器人 NEO,那个精美的广告片确实震撼,但回过头看,这和 2023 年 AI 初创公司的套路如出一辙:看起来无所不能,实则是在实验室里经过无数次失败才拍出的那一次成功。
现在的现状是,各家公司的产能规划都是每年 10 万台起步,高盛甚至预测到 2035 年全球人形机器人出货量将达到惊人的数字。但尴尬的是,真实的订单还没落地,股价和估值就已经冲到了天上。
行业野心:全球人形机器人出货量预测
数据来源:Goldman Sachs Equity Research (模拟估算)
“我觉得现在的估值确实没法和技术现状匹配。在 Scale-up(规模化)和 Generalization(泛化能力)这两个关键指标上,还没有实质性的飞跃。但对于 VC 来说,这就是在‘提前站位’,布局那个不可错过的未来。”
“机器人赛道的爆发会有两个阶段。第一阶段是技术上的 GPT 时刻,机器人能直接理解语言、视觉指令并分解动作。但这只是第一步,真正的‘苹果时刻’还需要从硬件规模化和数据反馈闭环中产生。”
BERT 时代 (2017-2018)
算法架构初现,数据开始堆积,但还没产生“智能涌现”的惊艳感。这正是当下机器人的现状。
GPT 时刻
标志是“端到端”的泛化。你对它说‘去厨房拿杯水’,它能自动处理 L0 到 L3 的逻辑,而不是靠预设代码。
Editor's Note
“所谓‘具身智能’,就是让 AI 拥有身体。不仅要有大脑,还得有在物理世界感知和行动的能力。”
“美国强在软件和大模型,
但中国硬件产品的迭代速度,
甚至可以做到一天迭代三次。”
这种软件与硬件、硅谷与深圳的张力,正构成了机器人赛道最有趣的景观。美国人在实验室里改代码、刷论文,而深圳的工厂里已经开始了一场关于供应链和真实场景数据的“巷战”。这种战略打法的异同,正是我们接下来要深挖的核心:为什么在机器人领域,最后胜出的可能是那个更懂“整合”的人?
中美机器人战事:
战略与打法的异同
刚才我们还在纠结GPT是不是泡沫,但转头看机器人领域,你会发现这里的硝烟味儿可现实得多。如果说大模型是虚空的灵感,那机器人就是灵感落地的骨骼与肌肉。
很多人问我,为什么美国有 Tesla Optimus 和 Figure AI,我们还要卷这个赛道?其实看了一圈你会发现,这根本不是一个维度的竞争。美国的逻辑是“第一性原理”加上“暴力美学”:先定一个宏大的愿景,然后靠世界顶尖的AI天才去算、去堆,试图用算法直接接管物理世界。
但国内的打法完全不同。我们更像是在“从土地里长出来”。你去看深圳的这些机器人公司,他们甚至不在意第一步是不是完美,他们在意的是能不能跑通。这种差异,本质上是“科学家文化”与“工程师红利”的正面硬刚。
在深圳,机器人甚至可以一天迭代三次
这不是夸张。在南山区或者龙华区,你早上改个零件图纸,中午就能在隔壁加工厂拿到样件,下午装机测试,晚上代码跑通。这种供应链的肉搏速度,是硅谷那种“等一个定制件要两周”的环境无法想象的。
每日硬件迭代极限
相比之下,海外实验室周期通常以“周”为单位
竞争力雷达图:中美博弈维度
Editor's Note: 数据的力量
你看这张图就能明白,国内的优势集中在场景数据和迭代速度上。当美国在搞通用大模型(General Purpose)时,国内已经在工厂、物流、甚至家庭场景里刷掉几万次Bug了。这叫“农村包围城市”。
投资逻辑大辩论:投“具身智能”还是“先进制造”?
Venture Capital A:
“我们要投的是下一个‘物理世界的OpenAI’!如果只是卷硬件成本,那不就是传统的代工厂吗?没有大脑的机器人是没有灵魂的。”
Practical Investor B:
“别扯那些虚的。大模型能不能落地,最后还不是得看灵巧手能不能捏起一颗葡萄?在中国,不谈制造能力的具身智能全是空中楼阁。”
“所谓的‘弯道超车’,
其实就是在最脏最累的硬件场景里,
跑出最快的数据闭环。”
这是国内机器人商业化的核心杀手锏。相比海外严苛的隐私和准入限制,国内的工厂、园区甚至街道对机器人的实测容忍度更高。这种“宽容度”转化为了极其宝贵的长尾 corner cases 数据。
Next Chapter:
先投“上半身”还是“下半身”?探讨技术突破的投资优先级 →
先投“上半身”
还是“下半身”?
既然聊完了国内场景的“广度”,咱们得钻进实验室,聊聊投资布局的“深度”了。
“下半身”:运动控制的护城河
现在的共识是:机器人的“腿”已经快卷不动了。四足、双足的平衡算法,在开源社区的加持下,已经从实验室走进了工厂。投资人现在看运动控制,看的是“鲁棒性”——能不能在冰面上走,能不能被踹一脚不倒。
“上半身”才是星辰大海
灵巧手(Dexterity)和大脑(Foundation Models)。如果说下半身是移动,上半身就是生产力。现在的钱,都在往这里砸。
Editor's Note: 灵巧手
不仅仅是五个手指头。它涉及到多传感器融合、触觉反馈(Haptics)以及在毫米级精度下的物体操纵。
“没有触觉数据,
机器人永远学不会真正的灵巧性。”
— Rodney Brooks 的预言
1X 的“骗局”还是“特洛伊木马”?
聊到 1X(OpenAI 投资的那家公司),圈子里争议很大。大家在视频里看到机器人在收纳房间,动作流畅得不像话,第一反应都是:这绝对是远程操控(Teleoperation)!
没错,它就是远程操控。但这恰恰是它的高明之处。这是一种“特洛伊木马”战略。
所以,争议的焦点不在于它现在是不是“真AI”,而在于这种数据采集模式能不能跑通。如果 1X 能把人类操作的每一个细腻的触碰都变成训练集,那“大脑”的进化速度将是指数级的。
硬核术语:Teleoperation (远程操控)
不仅是“遥控车”。在具身智能中,这通常指通过VR头显或动作捕捉衣,由人类实时接管机器人的关节。目的是解决 AI 在复杂任务中的“冷启动”问题,生成高质量的训练轨迹数据(Data Collection)。
技术路线的争论固然精彩,但资本毕竟是逐利的。
接下来,我们要聊聊那个最现实的问题:这玩意儿造出来,到底谁在买单?
真实的商业化落地:
谁在买单?
既然聊完了 1X 那个让人又爱又恨的“特洛伊木马”,咱们得聊点现实的:如果人形机器人还没法在家里给我洗袜子,那现在到底是谁在挥舞着支票簿?
仓储与物流的“极致内卷”
别盯着那些花哨的后空翻了。现在的买家基本都在看 ROI(投资回报率)。在巨大的物流分拣中心,机器人不需要有感情,它们只需要在重复性劳动中比人类快 15%,且不需要交社保。现在的落地,本质上是“把昂贵的人力,置换成可折旧的资产”。
核心驱动力:劳动力短缺 > 技术情怀
落地门槛分级
硬件产业链:
会像智能手机一样模块化吗?
这是一个非常有争议的话题。有人觉得机器人会重走智能手机的路——也就是所谓的“联发科模式”。你买个现成的关节,他买个现成的传感器,大家拼一拼就能出货。
但我持有保留意见。 机器人和手机最大的区别在于:手机是一个信息交互终端,而机器人是一个物理交互终端。在手机上,你的屏幕大一点、电池厚一点,不影响算法运行;但在机器人身上,减速器的微小公差、关节的重量分布,直接决定了你的模型能不能跑通。
“现在的情况更像是 70 年代的计算机。每一个部件都需要极其精密的耦合,而不是简单的积木拼接。软硬一体化在未来 3-5 年内,依然是头部的绝对护城河。”
“人形机器人成本构成预测
Editor's Note:
目前的“昂贵”主要源于关节执行器。一旦谐波减速器和行星滚柱丝杠能够实现大规模国产替代,BOM 成本有望在 5 年内下降 60% 以上。
大胆预测:未来 5 年的机器人世界
“进厂拧螺丝”的元年
头部车企开始小规模部署机器人,解决特定工位(如车门安装、质检)的自动化。这不是为了省钱,是为了积累真实场景数据。
通用模型(Generalist)爆发
机器人不再需要针对每个动作写代码。只需演示几遍,它就能学会处理未见过的物体。人形机器人的灵巧性开始超越专用机械臂。
“iPhone 时刻”还是“大型玩具”?
第一批真正能处理家务的消费级机器人进入富裕家庭。它们可能还做不到像管家一样完美,但能帮你收纳玩具、清理地板上的死角已经足够让市场疯狂。
“不要高估未来一年的变革,
但绝对不要低估未来五年的物种大爆发。”
— 结束语前的最后思考
