第四次革命：人工智能的现状与展望

---人工智能革命四人谈综述

Feb 17, 2026

马四维

【编者按：2026年1月9日，迈克尔·伯里（Michael Burry）、德瓦凯什·帕特尔（Dwarkesh Patel）、帕特里克·麦肯齐（Patrick McKenzie）和杰克·克拉克（Jack Clark）四个人在 Google 文档里以《人工智能革命已经来了，经济扛得住这场转型吗？》为题，展开辩论，讨论人工智能与人类的未来，——迈克尔·伯里是预言过 2008 崩盘的人、Anthropic 联合创始人。当年人人都在疯狂买入次级房贷资产时，迈克尔·伯里已经预见了那场即将到来的崩盘。现在，他看着数万亿美元正涌向 AI 基础设施，对此保持怀疑。杰克·克拉克是 Anthropic 的联合创始人，这是一家正在竞速“打造未来”的头部 AI 实验室。德瓦凯什·帕特尔在自己的节目里，采访过从马克·扎克伯格到泰勒·科文等一众重量级人物，话题都指向同一个问题：这一切最终会走向哪里？他们和帕特里克·麦肯齐一起，被“拉进”同一份 Google 文档，由麦肯齐主持讨论，只问一个核心问题：人工智能到底是真正的时代机遇，还是一场正在实时上演的、史无前例的资本错配？】

人工智能这几年闯进公共视野的方式，很不“科幻”。不是钢铁人、也不是天网，而是一个会聊天、会写代码、会画图的“智能输入法”。可资本市场和国家机器的反应，却一点也不含糊：几万亿美元砸向芯片、机房、电力和人才，几家巨头像上了发条一样往前冲。
如果把这个场景放进更长的历史坐标，就会发现：人类可能正站在“第四次革命”的门口。
农业革命驯服土地，工业革命驯服机械，信息革命驯服比特，而这一次，人工智能革命试图驯服的，是“认知本身”。

从《注意力就是你所需要的一切》到“这是最差的一天”

如果让历史学家给近几年人工智能画一条时间轴，2017 年那篇《注意力就是你所需要的一切》（Attention Is All You Need）很难绕开。当时主流路径还停留在“从零开始训练智能体”：丢进复杂环境，打游戏、下围棋、玩星际争霸，希望靠强化学习煲出一个“通用智能”。那是一种“白板式”的赌法。结果是游戏里出现了超人，现实世界里却没有出现“通用人”。

阿希什·瓦斯瓦尼等人（Vaswani, Ashish, et al.）在《注意力就是你所需要的一切》中提出了模型（Transformer）架构。他们用自注意力（self-attention）机制取代以往序列模型里的大部分结构，后来几乎所有大模型（包括现在的各种 GPT、Claude、Gemini）都建立在这套架构上。这一条路线当时显得没那么拉风：用海量数据做预训练，让模型预测、生成语言和其他符号；再把算力、数据和模型规模堆上去，用所谓“Scaling Laws”去估算能力和资源之间的关系。杰克·克拉克（Jack Clark）所在的一批研究者，赌的就是这条路：把模型和“规模律”绑在一起，把参数从十亿推到万亿，把语料从 TB 推到 PB。

到了 2025 年，回头看，真正改变局面的是这条“土法炼钢”：语言模型被训练成通用接口，编程、写作、翻译、检索全被塞进同一张“电路”，再叠加语音、图像、视频，多模态能力一层层往上加。这才有了今天的大模型，有了“Claude Code”“Gemini 3.5 Pro”这种名字。

对外界而言，一个常被忽视的事实是：当前看到的一切，其实只是“地板，而不是天花板”。研究者在与政策制定者沟通时，经常要重复一句话：今天的模型，是它们一生里最笨的一天。每过几个月，边界就会被推一次。

迈克尔·伯里（Michael Burry）的意外在别处。他出身金融，对人工智能的传统形象还停留在“通用智能”“自我意识”这一套。按这一代人的科幻想象，AI 应该是 HAL9000、是天网、是会思考的机器人，很少有人会把“搜索很猛的聊天机器人”当作真正的 AI。
在他的视角里，更意外的有三点：不是谷歌领跑，而是被初创公司推着走；触发万亿资本支出的，不是“通用智能”，而是一个聊天工具；芯片之王竟然一直是英伟达，而不是更早被想象出来的 ASIC 和小模型阵营。

这样一来，人工智能革命一开始就带着明显的时代烙印：高度依赖资本市场，高度依赖少数巨头的决策，高度依赖软件工程文化下的“快速迭代”。这和蒸汽机时代的散乱工坊、信息革命初期的车库黑客，都有很大不同。

第四次革命：从土地、机器、比特到“认知基建”

按照常见的划分，农业革命解决的是“谁来种地、怎么种”的问题，工业革命解决的是“谁来出力、怎么出力”的问题，信息革命解决的是“谁来算账、怎么算”的问题。

人工智能革命看上去也在重复这个公式，但目标对象悄悄变了：不再只是让机器替人出力、替人记账，而是让机器替人理解、替人生成、替人“思考”。这导致人工智能革命在几个层面都有别于前三次：第一，它一开始就是全球性的。农业革命与地理、气候紧密相连，区域差异巨大。工业革命虽然后来扩散开来，但最初还是集中在少数国家的煤矿、港口、纺织城。信息革命的传播速度已经很快，但实体设备部署仍需要时间。而这一次，只要有网络、有云、有算力，一个国家、甚至一个个人，就可以站在同一代模型上做应用。扩散速度远超前三次革命。

第二，它的基础设施高度集中。农业革命的底层资源是土地，工业革命的底层资源是煤和铁，信息革命的底层资源是光纤和晶体管，分散在无数企业和国家手中。人工智能革命的底层资源，是训练集群、顶级 GPU、电力和冷却系统。目前集中在几家“超级平台”手里。就像有人说的：所有大软件公司都成了硬件公司。资本开支从轻到重，回报率（ROIC）在高位往下走，巨头手里的“机器房”正在变成真正的国力组成部分。

第三，它触碰的是人的“内层秩序”。农业革命重塑了定居与游牧的边界，工业革命重塑了工厂与家庭的边界，信息革命重塑了办公室与网络的边界。人工智能革命开始重塑的是“脑力劳动”的边界。开发者用大模型写代码、改代码、查 bug；学者用大模型找文献、做图表、起草报告；医生、律师、教师也开始尝试把部分认知工作交给模型。

帕特里克·麦肯齐（Patrick McKenzie）提醒过一点：过去几十年，有多少高学历、高薪人力被用在做 PPT 和 Excel 演示；而现在，至少在制图和排版这一块，大模型已经显著替代了一部分人力。这种变化看上去琐碎，但积少成多。认知劳动不像体力劳动那么直观，边界模糊，迁移速度却可能更快。

生产力悖论：“感觉变快了”，宏观数据却没跟上

每一次技术革命，都绕不过一个问题：生产力到底变快了多少？现在的局面有点诡异。一方面，大公司内部开发者自报的效率提升很惊人；有调查显示，使用大模型的工程师自认为效率提高了 50%。另一方面，像 METR 这种严谨实验给出的结论却冷静得多，有的任务上甚至测出效率下降。

杰克·克拉克也承认，主观感受和真实生产率之间有差距，需要更好的“仪表盘”来量化。代码生成属于典型的“闭环任务”：模型写出来的东西可以立刻跑、立刻测，有一套完整的反馈机制。但一旦脱离这种闭环场景，比如写一份战略报告，做一段政策分析，标准就变得模糊：可读性谁说了算？可维护性怎么算？“品味”和“判断”这种软指标又怎么度量？正因为如此，大模型在程序员群体里先走出一条路，其他知识工作者的采用速度就慢得多。

还有一个更直白的问题：谁掏钱？伯里的质疑在这儿特别尖锐。他一再强调，最终要为 AI 买单的，还是企业和消费者。全球 GDP 的蛋糕就这么大，软件这一块不到一万亿美元。如果英伟达能卖出 4000 亿美元的芯片，而应用层的年收入还不到 1000 亿，这种“基建与应用倒挂”的结构就很难长期维持。

在他的笔记里，有一个经典的比喻：上世纪百货商场装自动扶梯，马路对面不得不跟着装。结果两边都花了大钱，顾客体验略有提升，但彼此之间没有形成新的优势。

人工智能基础设施很可能重演这个故事。如果所有竞争对手都买了同样的模型，同样的芯片、同样的云服务，那么每家公司都不得不花钱，消费者享受了更低价格和更好服务，但少有企业能从中建立长期“护城河”。这种情况下，收益更多地流向消费者，流向整个社会，而不是集中在某家“AI 巨头”身上。

这很可能就是人工智能革命的“生产力悖论”：微观层面，个人和企业都感觉“快了很多”；宏观层面，工资、就业、总需求的变化却不那么显眼，甚至可能因为软件价格下降，而呈现出一定的“通缩感”。

秩序的压力测试：从就业，到资本，再到国家

人工智能革命对旧有政治经济秩序的冲击，目前还在积累期。几条压力线已经隐约可见。第一条是劳动市场。很多早期预测认为，只要有一个能通过图灵测试、能解决复杂数学和编程问题的模型，就会立刻扫掉半壁白领工种。现实并没有这么快。模型在封闭题上的表现极佳，但一遇到开放情境、长期责任、复杂协调，就显得“锋利但不可靠”。

这导致当前的用法更多是“人机协作”：模型写初稿，人类改；模型给方案，人类选；模型做体力，人类负责任。真正意义上的“岗位消失”并不显著，但岗位内部的任务结构正在改变。

第二条是资本结构。大型科技公司原本是轻资产、高回报率的典型。云计算出来后，资本开支有所增加，但总体仍称得上“高 ROIC（投入资本回报率）”企业。现在，为了追逐人工智能红利，这些公司开始像重工业企业那样疯狂砸钱：一代又一代的 GPU 和专用芯片，折旧周期不断缩短；数据中心为适配新一代芯片，需要重投配电、散热、光纤；大量支出通过建设中项目（CIP）挂账，推迟在财报中体现。

伯里提醒，ROIC 的趋势，比绝对利润更能预示一家公司的长期命运。如果回报率一路往下走，而资本开支一轮轮加码，最后很可能走向“规模更大、价值更低”的局面。这意味着人工智能革命，可能在很长时间里，都是一场对资本耐力的考验。

第三条是国家层面的能源与安全。在杰克·克拉克眼里，未来几年最关键的政策问题之一，是“AI 基建如何与能源革命绑定”。模型继续扩展，就必须有廉价、稳定的大规模电力；而高密度的大型数据中心，又天然适合成为新型能源技术的首批用户，比如小堆核电、核聚变示范装置。

伯里的建议更激进：如果要在人工智能时代保持优势，一个国家需要主动拿出巨额预算，在全国范围布置安全可靠的小型核电站，升级电网，形成新一轮“电力大基建”。在这种设想里，“算力主权”和“能源主权”开始绑在一起。谁能提供最便宜、最稳定的电力，谁就有可能支撑起最大规模的模型训练和推理。

全球秩序：谁掌握“认知基础设施”，谁就重写游戏规则

人工智能革命对全球秩序的冲击，还远未定型。但几个趋势已经显出端倪。一是技术扩散与集中并存。从扩散角度看：开源模型、跨国云服务正在加速“智能下沉”，很多中小国家可以直接使用最新一代模型，绕过本地训练的高昂门槛。

从集中角度看：真正能在模型最前沿发力的，仍然是少数具备全球数据、顶级算力和顶尖人才的国家和公司。如果未来出现“可以自我改进的模型”，这种集中趋势还会进一步加剧。克拉克特别担心“AI 造 AI”的闭环。一旦某家实验室真的把“递归自我改进”做出来，研发速度可能陡然加快，外界很难跟上，更难监管。

二是军事与安全逻辑的渗透。对很多国家来说，人工智能不是“一个行业”，而是“所有行业的决策层”。从无人装备到情报分析，从网络攻防到后勤调度，谁在算法上领先，谁在整体战备和威慑上就有优势。这就带来一个矛盾：一方面，各国都担心对手率先把人工智能武器化；另一方面，又不得不在国内大力推广人工智能，以免在经济和民生领域被落下。这和核武时代的“核力量—民用核电”二元结构有点相似，但反馈速度更快，扩散路径更多。

三是“认知殖民”的隐忧。信息革命时代，全球网络基础设施和主流平台绝大部分掌握在少数国家手里。人工智能时代，这种不平衡可能表现为：某些语言、某些文化、某些价值体系，在训练数据中占据绝对优势；模型在细节处更熟悉这些话语方式，更自然地复制它们的偏好和盲点。这会不会让很多国家在不知不觉中，接受一套“预设好的思维模式”？这也是人工智能革命在文化层面最微妙、也最难量化的一部分冲击。

美国的应对：在狂热与冷静之间找平衡

在这场“第四次革命”里，美国既是实验场，也是赌桌中央。一方面，美国拥有：最成熟的资本市场，最领先的几家 AI 实验室，最广泛的高端用户群体。这一点，从 OpenAI、Anthropic 等公司的崛起就能看得很清楚。大量民间资本、风险投资、私募基金，快速响应大模型浪潮，把一波又一波的钱推向 GPU 和数据中心。

另一方面，美国也面临几重夹击：第一重是财政和债务压力。大规模 AI 基建需要长期资金，而公共财政已经背负沉重负担。如果把这轮资本开支完全交给企业，用股权、债务和私募信用去支撑，一旦模型能力没有如预期那样持续提升，或者应用层收入迟迟不上来，资产负债表的结构就会变得很脆弱。伯里特别忧虑一点：大量 AI 基建通过“私募信用 + 长久期折旧”这种方式进入系统，看上去安全，其实存在严重的久期错配和资产搁浅风险。

第二重是产业结构调整。传统互联网公司的增长逻辑，依赖的是轻资产、高毛利的软件业务。如果未来十年被迫变成“重资本硬件+软件”的混合体，股东对高 ROIC 的预期就很难满足，市场对这些公司的估值体系也会被迫重写。这不是简单的技术问题，而是整个华尔街评估体系的迁移问题。

第三重是政治和社会撕裂。人工智能革命来得很巧妙，恰好叠加在美国内部既有的各种裂缝上。一边是对“技术乐观主义”的期待，指望 AI 成为应对老龄化、提升医疗教育效率的工具；一边是对“技术失控”的担忧，害怕 AI 在失业、信息操控、军事风险上制造新麻烦。

在这种环境下，政策制定者很容易在两个极端之间摇摆：要么一味鼓励，把 AI 当作新一轮增长神话；要么急于设限，希望用监管把所有风险提前锁死。更现实的任务，可能是走一条中间路：在能源、算力、人才这些基础层面，采取类似“国家项目”的长期规划；在应用和商业模式层面，尽量放手，让市场去探索真正可行的用法；在安全和伦理层面，针对递归自我改进、军事应用、关键基础设施控制权这些高风险环节，提前建立红线和透明机制。

文化与人：语言被改变，人也会被改变

人工智能革命还有一个常被忽略的侧面：它首先是一场语言革命。大型语言模型的一个“无心之举”，就是掌握了人类前所未有的多语种能力。有模型在主要语言上的翻译水平，已经接近甚至超过专业译者；有模型在大量小语种上的掌握，远超绝大多数人类。帕特里克·麦肯齐曾感叹，这种“随手就能翻译 CNN 新闻到日语”的能力，是旧时代难以想象的。

在日常生活层面，模型已经悄悄进入很多人手边：有人用它查阅资料、做表做图；有人用它当一对一家教；甚至有人用它远程指导维修电路、水管，试图省下一笔昂贵的上门费。这种“认知外包”，一旦成为习惯，就会改变人的知识结构。医生如果长期依赖模型给出诊断建议，久而久之可能真的会忘记很多基础知识；学生如果早早习惯用模型写作业，原创表达能力也可能萎缩。伯里并不特别担心“人工智能毁灭人类”这种终极场景，他更担心人类主动放弃自己的能力，变得懒惰、迟钝。这一点从小处看是“工具依赖”，从大处看，则是文明本身的塑形问题。

如果把农业革命算作第一次“生产方式革命”，工业革命算作第二次，信息革命算作第三次，那么人工智能革命确实有资格被称为“第四次”。它的独特之处在于：前三次革命主要改造人和物之间的关系，这一回，则开始改造人和语言、人与知识、人与自我之间的关系。

从伯里、克拉克、帕特尔、麦肯齐几人的讨论里，可以看见几层现实：技术端的进步快得惊人，但距离真正“通用智能”仍有不小差距；资本端的投入已经到了历史罕见的规模，但应用端的商业回报还没有完全跟上；政治和制度层面的准备远远落后于技术和资本，许多关键问题尚未进入公共辩论的核心。

因此，这场“第四次革命”真正考验的，并不只是一两个国家的算力储备，也不只是几家公司的财报，而是整个人类文明的几项基本能力：面对新工具，能否保持理性，不神化、不妖魔化；面对新秩序，能否有足够的制度想象力，为权力和责任重新划线；面对新依赖，能否保留一部分“不可外包”的人性和判断。

农业革命之后，人类学会了如何和土地相处。工业革命之后，人类学会了如何和机器相处。信息革命之后，人类学会了如何和网络相处。人工智能革命之后，人类最终要学会的，是如何和“另一个会思考的系统”相处。这一课，恐怕比前几次都更难。

中国思想快递 (China Thought Express）

Discussion about this post

Ready for more?