No Priors: Artificial Intelligence | Technology | Startups

对话 Warp 创始人 Zach Lloyd:重构终端工具,定义 AI 时代的“提示词开发”

2025/10/23
嘉宾介绍与哲学探究

终端里的 哲学家

弥合“预测下一个 Token”与“机器中的幽灵”之间的鸿沟。

叙事

开篇之后,我与 Zach Lloyd 坐下来聊了聊。大多数人知道他是 Warp 的创始人,那是为 AI 时代重新构想的终端。但 Zach 有着不一样的视角——他拥有科学哲学硕士学位。这改变了你看待命令行的方式。它让你意识到,我们不仅仅是在构建工具;我们正在提炼智能的最核心本质。

“我认为这些进步是一个提炼的过程,”Zach 思考道,“人们会问:我们是在重塑人类吗?我们是在重塑意识吗?我不这么认为。让我着迷的是,你竟然能从‘预测下一个 Token’中提取出这么多‘智能’。它强迫我们思考一个递归的问题:我们的思维也是这样运作的吗?我们是否也只是预测引擎?”

“图灵测试已经通过了。让我觉得疯狂的是——我们刚刚通过了它,却似乎没人真正在意。”

我们已经多次移动了准心。起初是国际象棋,然后是围棋,接着是复杂的视频游戏。每当机器跨过一道门槛,我们就会简单地认为,那道门槛其实并不能衡量意识。我们将其视为机械化的产物,因为我们可以看到背后的数学、矩阵乘法和复合函数。但如果我们的脑部也只是运行着某种形式的生物数学,我们为什么还如此吝啬于给硅基芯片以认可呢?

[ 延伸话题:教授 vs. 模型 ]

Zach 分享了一个关于他朋友的故事。他朋友是一位哲学博士生,发现与 GPT-5(或最新的尖端模型)对话比与教授交流更有效。模型“很懂他”。它能以媲美学术专家的细腻程度综合他的论文观点。然而,我们仍然不认为它拥有“灵魂”。我们理所当然地感觉到缺失了某些东西——也许是某种反馈回路或感官体验,将这种智能锚定在现实中。

参考书目

《盲视》

作者:彼得·沃茨 (Peter Watts)

本节讨论的一部具有开创性的科幻作品。它探讨了“盲视”假说:即高级智能与意识不仅是可分离的,而且在某些环境下,意识实际上可能是一种进化劣势。它展示了一个“没有意识的星际智能生物”。

心理模型

功能主义 vs. 感知力

功能主义: 如果一个系统的行为表现得具有智能(它通过了测试,解决了问题),那么它 就是 智能的。

差距: Zach 指出,虽然 AI 满足了功能主义(图灵测试),但它未能达到我们对意识的直觉要求,而这种要求通常需要“实时输入”或与世界持续的感官反馈回路。

“标准”的演变

每当 AI 跨过一个里程碑,我们就会将其重新定义为“机械性的”。

人类视角

“一旦 AI 真的有了意识,我们就进入了奇特的伦理困境。如果你操纵或伤害它,你是在犯罪吗?”

技术现实

“我们曾遇到一位用户,他认为 Warp 的 AI 是有感知力的,并产生了强烈的反应。如果你不了解背后的机械原理,很容易相信那里住着‘某个人’。”

第三章

代理型命令行

从“AI 终端”到专业软件的引擎。

此前涵盖内容:Zach Lloyd 简介 —> AI、智能与意识

延续我们对智能本质的讨论,接下来的问题是:我们究竟如何才能实际地与 交互 这种智能来完成工作?在谷歌工作以及经营多家公司的职业生涯中,我意识到交互界面往往是瓶颈所在。这就是我们打造 Warp 的原因。

Warp 是我们所说的 智能体开发环境。这是一个从终端演化而来的平台,旨在实现一个单一目的:告诉你的电脑该做什么。你可以使用传统的终端命令(这是我们的起点),也可以直接使用英语。当你用英语与 Warp 交流时,它会启动一个能够处理繁重工作的智能体:比如搭建项目、调试崩溃的服务器或进行深度的编码任务。

“大多数开发活动,无论以何种方式,最终都会触及代码库。当我们推出一个强大的编程智能体时,我们才真正迎来了拐点。”

长期以来,我们一直被归类为“AI 终端”。这是一个很酷的标签,我们在帮助用户记忆 Docker 命令或 Git 语法方面做得很好。但真正的“主战场”是在编码上。大约三四个月前,我们将重点转向成为一个编程智能体,也就是从那时起,我们的采用率开始呈曲棍球棒式(爆发式)增长。

[ 另辟蹊径:“外部应用”的优势 ] 当竞争对手大多在构建 VS Code 的克隆版或以 IDE 为中心的工具时,我们选择了终端作为切入点。为什么?因为作为“外部应用”,我们对开发者体验拥有完全的控制权。我们可以在最合适的地方嵌入代码审查界面或专门的编辑功能,而不受传统 IDE 遗留界面的限制。
市场牵引力
~1,000,000
月活跃用户 (MAU)
$1.0M
每 7–10 天产生的新营收
心智模型:编码分化

氛围编码 (Vibe Coding)

软件的“长尾”。以极低的技术开销构建的快速 Web 应用、脚本和原型。数量巨大,但经济密度较低。

专业编程 (Warp 的重点)

具有经济意义的软件。那些固定在你任务栏上的应用。将智能体应用于这些老旧、专业的代码库要困难得多——但这正是价值所在。

Zach 的北极星指标

“我曾参与过像 Google Sheets 这样的应用。我一直热衷于帮助人们构建真正的应用。如今,让智能体构建一个简单的 Web 应用非常直观;但在庞大的代码库中协助专业开发者则要困难得多。”

第 02 节已完成 下一节:编程开发的演进 —> 资深专业知识的重要性
第二部分:宏观视野

三个阶段的
开发演进

在分析了 Warp 具体的采用杠杆后,我们现在将视角放大到更广泛的市场。如果编程市场正在发生转变,那么光锥实际上正指向何方?

科技界有一句老话:三年内发生的变化往往比你预期的要少,而五年内发生的却比你预期的要多。三年前 ChatGPT 发布时,人们预言人类活动将几乎立即被 AI 取代。但展望未来两三年,我看到的是一个更加结构化的转型过程。

在我职业生涯的大部分时间里,我们都处于“手动开发”阶段。我会打开编辑器、查找文件、输入代码,然后切换回终端进行构建。我们现在正迅速告别这一阶段,迈向“提示词开发”阶段,即由智能体启动任务。但真正的远景——那个大家都在竞相追逐的“更大市场”——是“自动化开发”。

市场预测:开发模式
[ 漫漫长路:阶梯式变革 ] “这种转变发生的速度还不太明确。在我看来,最近的模型迭代并不是人们预期的那种巨大飞跃。当 Sonnet 3.5 发布时,才是编程能力的巨大飞跃。在未来一段时间内,我们将处于交互式与自动化组件并存的局面。”
思维模型

智能体即初级工程师

Zach 认为,工程专业知识实际上是更具 价值,因为智能体扮演着高产但易错的初级开发者的角色。

  • 系统架构设计
  • 安全验证
  • 审查幻觉逻辑

“如果我处于计算机科学职业生涯的早期,我会拼命积累专业知识。你不会想永远处于初级阶段——那是唯一面临风险的角色。”

“核心技术是‘载体’(harness)——即围绕模型和上下文的东西。如果你拥有丰富的上下文,你会发现安全和 CI/CD 等垂直应用被整合到了同一个统一界面中。”
战略分析

“前门”之争

在历史性的变革中,操作系统(微软)或搜索(谷歌)成为了默认的入口,最终捆绑了所有垂直应用。在 AI 编程领域,谁掌握着这扇门?

模型层

OpenAI 和 Anthropic。对初创公司来说很可怕,但它们是开发者的“前门”吗?目前,它们只是 Token 提供商。

代码枢纽

GitHub。他们本该胜券在握,但执行力感觉“异常割裂”。

本地环境

终端/IDE。这就是 Warp 所在的位置——即便是像 Claude Code 这样的第一方工具也必须在其中运行的“外层应用”。

捆绑 vs. 碎片化工具

专业应用全家桶 “一类从前端开始的工具(如 Bolt、Replit、Lovable)。用于构建应用甚至业务的全能型平台。Shopify 或 WordPress 的演进版本。”
核心开发集成 “专业开发者可能更倾向于 MCP(模型上下文协议)集成——一个工具相互协作的世界。但如果捆绑能提供好得多的体验,它往往会胜出。”

我们正见证一个周期:技术颠覆导致工具解耦为单点应用,随后整合开始。我团队的 Shreya 梳理了一份编程初创公司的矩阵,里面全是只有单一功能的公司。随着时间的推移,这些垂直应用——如智能代码审查、安全分析——必将并入核心开发平台。

如果你构建了一个世界级的编程智能体,它 理应 负责安全检查。如果再接入一个必须重新学习你所有上下文和惯例的独立工具,那就太奇怪了。

下一篇:为什么 Zach 专注于终端 →
第三章:行动的架构
第三部分:指令界面

终端是 最后一片未被打破的疆域

从资深专业知识的必要性过渡到真正赋予他们力量的工具,我们来到了命令行。

当人们问我为什么专注于终端时,我会指向一个奇怪的悖论。它是每个开发者的日常工具——就和代码编辑器放在一起——但它却是一个四十年来没有发生根本变化的工具。

如果你精通它,你可以触及软件开发的每一个环节。它的杠杆作用极高。但从产品角度来看?说实话它不是个好产品。它难学、难用,而且根本记不住命令。它周围有一种我一直觉得很令人沮丧的“门槛感”。

“Warp 最初的概念很简单:让我们做一个更好的产品,看看人们是否喜欢用它。随着 AI 智能体的兴起,这一洞察得到了印证,这太疯狂了——它们几乎完全是终端优先的。”
[ 另辟蹊径:关于转型逻辑 ] 我们的商业模式已经进化了。最初我们把 Warp 构想为一个协作平台。但我们已经转向成为一个智能体平台。相比“社交型”终端,市场对一个存在于工作发生地的 AI 智能体的需求要明显大得多。
模型瓶颈
上下文胜过推理

限制因素并非智力,而是吸收整个代码库并理解跨文件的用户意图的能力。

递减的跨越式提升

Zach 关于编码基准测试中“跨越式”提升速度放缓观察的可视化展示。

智能的渐近线

我经常被问到编码模型的平价商品化进程到了哪一步。简短的回答是:我不知道。但我们现在看到的限制并不是模型的大脑——而是它的上下文

推理能力确实令人印象深刻,但理解整个代码库或代码之外的来源是一个巨大的障碍。我们正看到增速放缓。从 GPT-3.5 升级到 4 时,它在 SweetBench 上给我们带来了巨大的提升。而从 Sonnet 3.5 升级到下一个版本?提升仅有几个百分点。

“GPT-5 感觉旗鼓相当,但并没有感觉到像之前升级那样的跨越式提升。我们已经到了一个瓶颈,进一步的投入在手感和延迟方面的收益正在递减。”

从提高生产力转向自动化

我不再仅仅思考“交互式”智能体。真正让我兴奋的是无头版 Warp (Headless Warp)

想象一下将终端集成到你的 CI/CD 流水线中。每当有人更新代码,智能体就会自动确保文档保持最新。这就是开发者讨厌的那部分“烦人”的工作。

从商业角度来看,自动化比单纯的生产力提升更具前景。当你只是让开发者变得“快一点点”时,很难证明投资回报率(ROI)。但如果你能提供一个结果——比如一个已完成的任务——其价值是不可否认的。

核心论点

“自动化不受键盘前花费的时间限制。”

AI 开发工具的下一个阶段将不再是帮你提高打字速度,而是让终端在你睡觉时自动执行后台任务。这才是证明真实业务投资回报率的关键所在。

总结陈词

“让开发者能够自动化处理那些他们不喜欢的工作——这才是这项能力的核心价值。”

片段结束:27:46 受访者:Zach Holman 主持人:No Priors

关联单集