【AI 创业洞察】从 1 亿美金种子轮乱象到 2026 个性化浪潮:Amplify 合伙人 Sarah Catanzaro 深度对谈
共生
“我一直游走于数据与人工智能之间……几乎很难将两者剥离。”
从符号系统到 SQL 查询
Sarah Catanzaro 并非 AI 炒作周期的局外人。她的旅程始于符号系统——即在神经网络复兴之前,我们所称之为“AI”的领域。对于 Sarah 而言,转向数据领域并非职业转轨,而是一场对可见性的追求。
她步入数据基础设施领域,仅仅是因为她想透彻地了解 SQL 查询底层究竟发生了什么。这种好奇心促使她投资并支持了现代数据栈中一些最具影响力的公司,其中包括 DBT。
6 亿美元的门槛
“现代数据栈”并未消亡——它只是正在走向成熟。
当 DBT 与 Fivetran 合并的消息传出时,业内的秃鹫们开始伺机而动,宣称“现代数据栈的终结”。Sarah 的看法则是: 根本性的谬误。
这并非一场贱卖,而是在 IPO 环境变化的压力下进行的战略整合。在过去的时代,1 亿美元的营收是上市的金标准。而今天?这一门槛已跃升至令人咋舌的 6 亿美元。
营收目标:退出路径的演变
AI 实验室的技术栈
“令我感到惊喜的事情之一是……许多顶尖的前沿实验室实际上都在同时使用 DBT 和 Fivetran。我曾与 Thinking Machines 的成员交流过……DBT 已经是他们技术栈中重要的一环。”
工作负载的本质
从传统商业智能 (BI) 向 AI 训练数据的转变,改变了数据工程的底层逻辑。在旧世界中,工作负载是 可预测的。它们由确定性系统驱动——例如每天早晨准时请求数据库的仪表盘。
“在 [为 AI] 分析、策划和准备数据集时,过程会更加随机。它的可预测性更低,这改变了我们对学习型优化器和数据库基础设施等事物的思考方式。”
Sarah 认为,尽管 需求 虽然分析工程师的人数也许尚未激增,但工具的 效能 却从未如此之高。我们正通过减少管理数据所需的大规模人力,实现数据的民主化。
沉重一击
一个失败的品类?
坦诚告白
“那是我的一个误判。我曾深信数据目录将成为现代数据栈的重要组成部分。”
为何它对人类而言失败了
Snowflake 和 DBT 构建了‘足够好’的功能。对于人类分析师而言,仓库内置的目录已然足够。
错失的良机
我们在该为机器(元数据服务)和治理构建目录时,却为人类构建了它们。
“我们为错误的人群构建了数据目录,也可能针对了错误的用例。”
从可发现性向治理的转变,标志着元数据的下一个前沿。
AI 实验室技术栈
跨越现代数据栈,我们一窥那些 GPU 称王、‘闲置时间’被视为最高之恶的实验室内部。
GPU 瓶颈
“如果你无法高效地将数据加载到 GPU,那么 GPU 就会处于闲置状态……而那将是巨大的成本开销。”
扩展的优雅
意外发现:现有的基础设施亦可扩展。OpenAI 并未构建新的事务引擎;他们只是使用了 Rockset。
基础设施效率对比
“一笔 1 亿美元 的种子轮融资。”
没有路线图。只有长远愿景和为期 7 天的决策窗口。
这确实让我感到焦虑。当创始人询问该融资多少时,我会询问里程碑。但现在?我与那些构建‘某领域前沿实验室’的公司交谈,他们可能会开发一款消费级应用……也可能不会。他们自己也不清楚。
他们将其视为一种纯粹的交易。他们不在乎合作伙伴;他们只在乎以最高估值获得最多资金。这只是一个招聘信号,仅此而已。
确然如此。你只有七天时间去了解一个正在募集十亿美金的人。如何建立笃定感?你做不到。你是在将赌注押在近乎陌生的人身上,因为市场运转得太快,快到不容眨眼。
估值只是一个虚构的数字
在公司退出之前,估值不过是个幻影。它是双方达成的一项协议,共同假装某个事物价值数十亿。我可以声称这个播客价值 50 亿美元,如果我们双方达成一致,在账面上它确实如此。但它没有产生规模化的交易。它并非真实的。
危险藏在清算优先权之中。如果这些团队筹集了 1 亿美元,却以 9000 万美元被收购,那些为了名望和“保障”股权价值而加入的员工,最终得到的却是零。
“仅仅因为一家公司拥有十亿美元的估值就选择加入,这并非职业选择的正确方式。你是否深切认同其愿景?这才是唯一重要的问题。”
精彩预告
世界模型:炒作、困惑与市场潜力 →世界模型幻象
尽管 2024 年的融资狂潮昭示着绝对的信心,研究界却正经历着怀疑的“宿醉”。我们是在构建真正的理解力,还是仅仅在创造更出色的视频编辑器?
“每年的 NeurIPS,我都会去找那群研究员进行投票。每个人对世界模型都持极其怀疑的态度。这是一种滞后指标——大语言模型如此成功,以至于人们认为:‘我们不再需要其他任何东西了。’”
“我的看法?我们甚至还没定义什么是‘世界模型’。目前存在三种相互竞争的定义。我们看到了视频编辑或自动驾驶领域的市场潜力,但针对视频游戏的模型并不能直接推广到工厂车间。至少现在还不行。”
泛化差距
这种怀疑并非针对实用性——而是关乎可迁移性. 在像素级完美环境(如游戏)中训练出的世界模型,目前尚缺乏高风险机器人或工业场景所需的“物理直觉”。我们正处于利基世界模型的时代,正等待着物理现实领域的“GPT-3时刻”。
“游戏领域的世界模型未必能泛化到工厂环境。这是2025年一个极其棘手的科研难题。”
“Cursor Rules”难题:为何AI需要长期记忆
AI的“魔力”正在消退。我们已步入一个基础补全不足以留住用户的阶段。讲者1指出了AI初创公司所面临的残酷现实:留存率低迷,流失率高企。
留存危机
用户成群结队地涌向Cursor等新工具,但只要Windsurf或Cloud Code发布了更吸睛的功能,他们便会迅速倒戈。若无个性化,你的产品终究只是一个平庸的商品套壳。
静态局限
当前的AI是静态的。而人类智能在不断更新。如果你的模型不能“更新其权重”或学习你特定的编程怪癖,它只不过是一个速度极快的复读机。
“Cursor rules 远远不够,”讲者0辩称,“这是最拙劣的记忆形式。”
我们正步入AI消费化时代——这映照了十年前企业级SaaS的趋势。现在的关键不在于模型是否奏效,而在于模型是否“懂你”。这引出了一个“有状态”的问题。如今的推理是无状态的。为了实现AI个性化,我们必须解决为数百万独立用户加载、卸载和缓存有状态权重的这一“棘手”基础设施难题。
人类智能是动态的。
AI是静态的。
K因子
创始人终于开始觉醒并关注传统的SaaS指标。增长不再仅仅因为你的模型聪明而“如约而至”。你需要一个建立在习惯之上的K因子,而习惯离不开记忆。
有状态性问题
如果模型可以代你更新权重,权重便具有了状态。在实时推理中加载/卸载这些权重,将成为下一个重大的基础设施淘金热。
接下来
“还有一件事。我想我们还有时间对强化学习环境再做一次探讨……”
— 从记忆到上下文的演进
如果说记忆管理是下一代 AI 智能体的“大脑”,那么环境就是它所栖息的世界。但那个世界是真实的,还是仅仅价值数百万美元的海市蜃楼?
环境幻象
各大实验室正将八位数的资金投入合成强化学习(RL)环境。他们是在构建未来,还是仅仅在制造价格不菲的 DoorDash 仿制品?
它只是一个加载了自定义软件的 Docker 容器吗?究竟什么才算是一个好的环境?
“我其实并不介意自己是错的,但我认为强化学习环境只是一时的热潮。”
等等,它们都是假的?实验室为此支付了七到八位数的费用!他们本可以内部构建,但却没有。为什么?
“他们以前也曾为那些烂透了的数据标注支付八位数的报酬。实验室很有钱。既然可以直接使用 DoorDash 真实的运行日志,为什么还要去买一个它的仿制品呢?”
“最好的强化学习环境
就是现实世界。”
— Cursor 的路径
完美的 AI 创业公司:研究与应用的交汇
最令人兴奋的创业公司不仅仅是在做“套壳”;而是那些将攻克艰深的研究课题作为开启大规模应用之匙的公司。Sarah 指出了一种特定的典型:这类公司聘请研究员并非为了装点门面,而是为了解决阻碍产品达到“惊艳”水平的技术瓶颈。
以 Harvey 为例,这是法律领域的翘楚。其成功并非源于营销,而是植根于法律工作所需的顶尖 RAG 实现。或者是 Sierra,在那个案例中,解决“规则遵循”研究难题是构建不会行为出格的客服智能体的唯一途径。
研究-价值飞轮
具象化呈现如何通过攻坚“硬核研究”(如记忆能力、指令遵循)来解锁“市场应用”(如法律、客服)的潜力。
寻找 Sarah
投资者、研究者的知音、技术现实主义者。你可以在南公园寻找那只独眼犬,或是前往那个曾被称为 Twitter 的平台寻觅她的踪迹。
— 本章完 —
