新年直播1:AI的2025与2026,技术领域的共识与非共识
Chapter 01 // 年度复盘
2025 AI 回顾:
哪些趋势超出预期?
“我们曾以为 2025 是算力的终局,结果发现这只是‘系统玩家’入场的门票。”
硅谷最抓马的瞬间
回看 2024 年底,谁能想到 Meta 的路径会如此跌宕起伏?从大规模裁员到 Llama 4 的战略调整,杨立昆的坚持与外界的质疑交织成了一场大戏。
“Meta 落后新闻事件太抓马了。经历了裁员、Llama 4 后、甚至燕乐存(Yann LeCun)的‘战略争议’,这一点我完全没预料到。”
“其实 Meta 的优势在于小扎的控制力和现金流。虽然 Llama 4 发布时不如人意,但他在应用端的推进非常激进。不要让 Google 一家独大,这是业界的共识。”
企业 AI 的“去虚向实”
2025 年最大的转向是:大家不再盲目追求“最贵、最强”的模型。在隐私监管较多的行业(医疗、金融、国防),垂直部署的小模型反而成了香饽饽。预算不再是试水,而是系统性的投入。
核心洞察:
- “并不是模型越大越好,而是越安全、越懂行越好。”
- “AI 赋能产业,已经从单一叙事变成了全产业的血脉觉醒。”
User Milestone
10 亿
OpenAI 用户规模接近 10 亿,但其利润空间和算力成本的博弈已达临界点。
Scaling Law:还没有到天花板
关于 Scaling Law 是否失效的讨论在 2025 年达到了顶峰。虽然 Google 的某些尝试让人怀疑方向是否错误,但主流共识依然倾向于“10 倍空间”的想象。
这里有一个关键的认知转变: 过去我们认为数据是“拔光网上的信息”就够了,现在发现,数据的清洗、比重、以及如何让模型理解 Domain Knowledge(领域知识)才是真正的护城河。
“不是把一百万张卡串起来就完事了,从训练到崩掉的原因分析,这里面有太多精细的活儿要做。”
The 2026 Outlook
2026 将是一场
属于系统级玩家的硬仗
当惊艳的门槛被无限拉高,单纯的 API 调用已无法满足市场,AI 的商业逻辑正在从“玩具”向“生产力工具”完成最后的惊险一跃。
Editor's Note
本节提到的 DeepSeek 冲击不仅是技术的胜利,更是“成本优化”与“开源精神”在 2025 年交汇的火花。当企业的共识成形,模型背后的架构之争才真正进入白热化——接下来,我们要聊聊那个让全世界措手不及的 DeepSeek 启示。
CHAPTER 02
AI 发展主线与范式转移:
企业 AI 共识成形
“如果说 2025 年是 AI 的‘幻灭谷’底部,那么现在的共识就是:别再谈论虚无的 AGI,我们要的是能跑通业务的系统。”
刚才我们回顾了 2025 年那些“被打脸”的预测,大家普遍感觉到一种“算力焦虑”的缓解。但紧接着,话题就转向了那个让所有大厂都睡不着觉的变量——DeepSeek。这不仅是一个模型的胜利,它标志着整个 AI 产业的范式正在发生剧烈的位移。
DeepSeek 启示录:效率才是硬道理
说实话,DeepSeek R1 的出现像是在硅谷沉闷的空气里扔了一个“震撼弹”。以前我们觉得 Scaling Law 就是暴力美学,砸钱、砸卡、砸数据。但 DeepSeek 告诉我们:聪明的架构和极致的工程优化,能让 1/10 的成本达到同样的智力水平。
这直接冲击了开源生态。现在的逻辑变了,不是谁的模型参数大谁就牛,而是谁能在有限的 Inference Budget(推理预算)下,提供最稳健的 System 2 思维(慢思考)。
开源冲击波
DeepSeek 证明了中国团队在模型蒸馏与强化学习(RL)上的极致效率,迫使 Llama 等老牌开源不得不加速迭代。
相同性能下的成本缩减
范式转移
从“大参数”转向“长思考”(Reasoning models)。
“Scaling Law 没死,它只是从‘算力换规模’,
变成了‘时间换智力’。”
数据估算:模型智力增长正从预训练阶段向推理阶段偏移
Neolab 与 2026 前瞻
我们在 Neolab 内部讨论时发现,下一代模型的争夺战已经不在于“喂多少书”,而是在于“怎么做数学题”。
关键词:System 2 Thinking
即模型在输出前进行自我验证、反思和多路径搜索的能力。这才是企业级 AI 真正需要的稳定性。
企业开始达成共识:AI 不再是那个写诗的诗人,而是一个能 7x24 小时处理 SOP、逻辑严密的审计员。
HOST A
“所以你觉得 Meta 现在的压力来自于哪里?是 DeepSeek 的效率还是 OpenAI 的领先?”
GUEST B
“Meta 的压力在于它被‘两头堵’了。高端被 OpenAI 的闭源逻辑压着,底层效率又被 DeepSeek 这种开源卷王偷袭。它的 Manus 收购传闻,其实就是想在‘智能体’(Agent)这个赛道买张门票。”
术语笔记:Test-time Compute
指模型在推理阶段(即回答问题时)花费的计算量。通过思维链(CoT)和搜索算法,模型可以在回答前“思考”更久,从而显著提升复杂问题的准确率,而无需无限增大模型本身的参数。
总结这一阶段:2025 年完成了从“大力出奇迹”到“架构出奇迹”的思维转轨。接下来,我们会看到这些共识如何拆解 Meta 的战略,以及 OpenAI 是如何被迫走上那条危机重重的上市之路的。
NEXT CHAPTER
Meta 困境与 OpenAI 的上市豪赌 →
Meta的豪赌与
OpenAI的窄门
“刚才聊完 Scaling Law 的物理极限,我们得看看这帮硅谷巨头是怎么在‘增长焦虑’里互相捅刀子的。”
Meta 收购 Manus:是神来之笔还是战略打脸?
小扎最近的这手操作真的把我看傻了。Meta 一直在推 Llama,把自己塑造成“AI 界的安卓”,但转头就把 Manus 那个团队给收了。这传达了一个极度危险(但也真实)的信号:**光有底座模型(Model)已经护不住基本盘了,必须亲自下场做 Agent。**
“战略回旋”
Meta 正在经历从“算力霸权”到“应用闭环”的痛苦转身。开源是为了拖住对手,收购是为了武装自己。
Speaker A
OpenAI 现在估值 1500 亿美金,这价格谁接得动?他们现在就像一只庞大且优雅的独角兽,但这只兽每天要吃掉几千万美金的算力,还没法立刻变现。
Speaker B
所以 Sam Altman 才急着转型。他们现在不仅要跟 Google 抢搜索,还要跟 Apple 抢端侧,甚至要搞自研芯片。OpenAI 的上市之路,其实是一场与“烧钱速度”赛跑的求生戏。
AI 三巨头势力象限图
“Anthropic 正在上演 AI 界的 ‘农村包围城市’:不求在流量上赢 OpenAI,但在 Coding 和 ToB 深度上,他们稳得可怕。”
! 为什么 2026 才是真正的 AI 应用元年?
大家都在吐槽现在 AI 应用除了对话还是对话。但我认为这只是“基建期”的阵痛。按照现在的硬件更迭和模型进化速度,2025 年是 Agent 的实验室阶段。
等到 2026 年,当模型推理成本下降两个数量级,且“计算机使用能力(Computer Use)”被调优到 99% 的准确率时,你会发现,你不再需要“打开”一个 App。
深度洞察:
2026 年的爆发不是因为模型变得更聪明,而是因为模型变得更“廉价”且更“听话”。Scaling Law 遭遇质疑,模型层开始疯狂卷长文本与多模态。
巨头开始大规模并购,类似于 Meta 收购 Manus 的动作将成为常态。
垂直 Agent 在法律、医疗、工程领域替代 40% 的初级重复工作。
垂直 Agent
与行业的“最后一公里”
从 Anthropic 的 ToB 战略聊到 2026 年的爆发增长,大家最关心的还是:在这个宏大的叙事里,普通开发者和初创公司的“入场券”到底在哪?
“既然通用大模型(Foundation Models)已经这么强了,垂直领域的 Agent 还有护城河吗?会不会被 OpenAI 或 Anthropic 一个更新就‘降维打击’了?”
这是一个非常经典的“恐慌”。但我的观点很明确:通用模型提供的是智力,而垂直 Agent 提供的是劳动力。
护城河不在于你调用的那个 API,而在于你对行业 Workflow(工作流)的病态级理解。大模型知道怎么写代码,但它不知道你们公司复杂的合规流程;它知道法律条文,但它不知道法官的判案偏好。这些“脏活累活”,才是垂直机会的护城河。
精准医疗/生物制药
不是简单的文献搜索,而是能理解实验协议(Protocol)并自动对接实验室自动化设备的 Agent。这种深度集成,模型厂商根本看不上,也做不了。
法律与合规审核
“我们要的不是一个会背法典的聊天机器人,而是一个能在成千上万份合同里,一眼揪出那个违反了 2024 年新规条款的‘数字律师’。”
工业供应链调度
这里的 Agent 需要实时对接 ERP 系统。它的价值在于决策后的“执行”——自动下单、调整库存、重新规划物流路径。
未来三年,垂直行业定制化 Agent 将占据市场绝大部分价值份额。
“不要在 AI 的智力 上拼命,
要在 物理世界的摩擦力 里深挖。”
Agentic Workflow(智能体工作流): 吴恩达近期反复强调的概念。指的是与其追求一次性生成完美结果,不如让 AI 像人类一样,通过“反思、寻找工具、规划、执行、纠错”的循环来完成复杂任务。这是垂直行业 Agent 能胜任专业工作的核心秘诀。
聊完了垂直赛道的生存法则,我们今天的讨论也接近了尾声。
在最后,让我们回归本原:这场 AI 竞赛的终点,究竟是工具的进化,还是生产关系的重构?
Next: Conclusion & Final Thoughts →
