第四次革命:人工智能的现状与展望
---人工智能革命四人谈综述
马四维
【编者按:2026年1月9日,迈克尔·伯里(Michael Burry)、德瓦凯什·帕特尔(Dwarkesh Patel)、帕特里克·麦肯齐(Patrick McKenzie)和杰克·克拉克(Jack Clark)四个人在 Google 文档里以《人工智能革命已经来了,经济扛得住这场转型吗?》为题,展开辩论,讨论人工智能与人类的未来,——迈克尔·伯里是预言过 2008 崩盘的人、Anthropic 联合创始人。当年人人都在疯狂买入次级房贷资产时,迈克尔·伯里已经预见了那场即将到来的崩盘。现在,他看着数万亿美元正涌向 AI 基础设施,对此保持怀疑。杰克·克拉克是 Anthropic 的联合创始人,这是一家正在竞速“打造未来”的头部 AI 实验室。德瓦凯什·帕特尔在自己的节目里,采访过从马克·扎克伯格到泰勒·科文等一众重量级人物,话题都指向同一个问题:这一切最终会走向哪里?他们和帕特里克·麦肯齐一起,被“拉进”同一份 Google 文档,由麦肯齐主持讨论,只问一个核心问题:人工智能到底是真正的时代机遇,还是一场正在实时上演的、史无前例的资本错配?】
人工智能这几年闯进公共视野的方式,很不“科幻”。不是钢铁人、也不是天网,而是一个会聊天、会写代码、会画图的“智能输入法”。可资本市场和国家机器的反应,却一点也不含糊:几万亿美元砸向芯片、机房、电力和人才,几家巨头像上了发条一样往前冲。
如果把这个场景放进更长的历史坐标,就会发现:人类可能正站在“第四次革命”的门口。
农业革命驯服土地,工业革命驯服机械,信息革命驯服比特,而这一次,人工智能革命试图驯服的,是“认知本身”。
从《注意力就是你所需要的一切》到“这是最差的一天”
如果让历史学家给近几年人工智能画一条时间轴,2017 年那篇《注意力就是你所需要的一切》(Attention Is All You Need)很难绕开。当时主流路径还停留在“从零开始训练智能体”:丢进复杂环境,打游戏、下围棋、玩星际争霸,希望靠强化学习煲出一个“通用智能”。那是一种“白板式”的赌法。结果是游戏里出现了超人,现实世界里却没有出现“通用人”。
阿希什·瓦斯瓦尼等人(Vaswani, Ashish, et al.)在《注意力就是你所需要的一切》中提出了模型(Transformer) 架构。他们用自注意力(self-attention)机制取代以往序列模型里的大部分结构,后来几乎所有大模型(包括现在的各种 GPT、Claude、Gemini)都建立在这套架构上。这一条路线当时显得没那么拉风:用海量数据做预训练,让模型预测、生成语言和其他符号;再把算力、数据和模型规模堆上去,用所谓“Scaling Laws”去估算能力和资源之间的关系。杰克·克拉克(Jack Clark)所在的一批研究者,赌的就是这条路:把模型和“规模律”绑在一起,把参数从十亿推到万亿,把语料从 TB 推到 PB。
到了 2025 年,回头看,真正改变局面的是这条“土法炼钢”:语言模型被训练成通用接口,编程、写作、翻译、检索全被塞进同一张“电路”,再叠加语音、图像、视频,多模态能力一层层往上加。这才有了今天的大模型,有了“Claude Code”“Gemini 3.5 Pro”这种名字。
对外界而言,一个常被忽视的事实是:当前看到的一切,其实只是“地板,而不是天花板”。研究者在与政策制定者沟通时,经常要重复一句话:今天的模型,是它们一生里最笨的一天。每过几个月,边界就会被推一次。
迈克尔·伯里(Michael Burry)的意外在别处。他出身金融,对人工智能的传统形象还停留在“通用智能”“自我意识”这一套。按这一代人的科幻想象,AI 应该是 HAL9000、是天网、是会思考的机器人,很少有人会把“搜索很猛的聊天机器人”当作真正的 AI。
在他的视角里,更意外的有三点:不是谷歌领跑,而是被初创公司推着走;触发万亿资本支出的,不是“通用智能”,而是一个聊天工具;芯片之王竟然一直是英伟达,而不是更早被想象出来的 ASIC 和小模型阵营。
这样一来,人工智能革命一开始就带着明显的时代烙印:高度依赖资本市场,高度依赖少数巨头的决策,高度依赖软件工程文化下的“快速迭代”。这和蒸汽机时代的散乱工坊、信息革命初期的车库黑客,都有很大不同。
第四次革命:从土地、机器、比特到“认知基建”
按照常见的划分,农业革命解决的是“谁来种地、怎么种”的问题,工业革命解决的是“谁来出力、怎么出力”的问题,信息革命解决的是“谁来算账、怎么算”的问题。
人工智能革命看上去也在重复这个公式,但目标对象悄悄变了:不再只是让机器替人出力、替人记账,而是让机器替人理解、替人生成、替人“思考”。这导致人工智能革命在几个层面都有别于前三次:第一,它一开始就是全球性的。农业革命与地理、气候紧密相连,区域差异巨大。工业革命虽然后来扩散开来,但最初还是集中在少数国家的煤矿、港口、纺织城。信息革命的传播速度已经很快,但实体设备部署仍需要时间。而这一次,只要有网络、有云、有算力,一个国家、甚至一个个人,就可以站在同一代模型上做应用。扩散速度远超前三次革命。
第二,它的基础设施高度集中。农业革命的底层资源是土地,工业革命的底层资源是煤和铁,信息革命的底层资源是光纤和晶体管,分散在无数企业和国家手中。人工智能革命的底层资源,是训练集群、顶级 GPU、电力和冷却系统。目前集中在几家“超级平台”手里。就像有人说的:所有大软件公司都成了硬件公司。资本开支从轻到重,回报率(ROIC)在高位往下走,巨头手里的“机器房”正在变成真正的国力组成部分。
第三,它触碰的是人的“内层秩序”。农业革命重塑了定居与游牧的边界,工业革命重塑了工厂与家庭的边界,信息革命重塑了办公室与网络的边界。人工智能革命开始重塑的是“脑力劳动”的边界。开发者用大模型写代码、改代码、查 bug;学者用大模型找文献、做图表、起草报告;医生、律师、教师也开始尝试把部分认知工作交给模型。
帕特里克·麦肯齐(Patrick McKenzie)提醒过一点:过去几十年,有多少高学历、高薪人力被用在做 PPT 和 Excel 演示;而现在,至少在制图和排版这一块,大模型已经显著替代了一部分人力。这种变化看上去琐碎,但积少成多。认知劳动不像体力劳动那么直观,边界模糊,迁移速度却可能更快。
生产力悖论:“感觉变快了”,宏观数据却没跟上
每一次技术革命,都绕不过一个问题:生产力到底变快了多少?现在的局面有点诡异。一方面,大公司内部开发者自报的效率提升很惊人;有调查显示,使用大模型的工程师自认为效率提高了 50%。另一方面,像 METR 这种严谨实验给出的结论却冷静得多,有的任务上甚至测出效率下降。
杰克·克拉克也承认,主观感受和真实生产率之间有差距,需要更好的“仪表盘”来量化。代码生成属于典型的“闭环任务”:模型写出来的东西可以立刻跑、立刻测,有一套完整的反馈机制。但一旦脱离这种闭环场景,比如写一份战略报告,做一段政策分析,标准就变得模糊:可读性谁说了算?可维护性怎么算?“品味”和“判断”这种软指标又怎么度量?正因为如此,大模型在程序员群体里先走出一条路,其他知识工作者的采用速度就慢得多。
还有一个更直白的问题:谁掏钱?伯里的质疑在这儿特别尖锐。他一再强调,最终要为 AI 买单的,还是企业和消费者。全球 GDP 的蛋糕就这么大,软件这一块不到一万亿美元。如果英伟达能卖出 4000 亿美元的芯片,而应用层的年收入还不到 1000 亿,这种“基建与应用倒挂”的结构就很难长期维持。
在他的笔记里,有一个经典的比喻:上世纪百货商场装自动扶梯,马路对面不得不跟着装。结果两边都花了大钱,顾客体验略有提升,但彼此之间没有形成新的优势。
人工智能基础设施很可能重演这个故事。如果所有竞争对手都买了同样的模型,同样的芯片、同样的云服务,那么每家公司都不得不花钱,消费者享受了更低价格和更好服务,但少有企业能从中建立长期“护城河”。这种情况下,收益更多地流向消费者,流向整个社会,而不是集中在某家“AI 巨头”身上。
这很可能就是人工智能革命的“生产力悖论”:微观层面,个人和企业都感觉“快了很多”;宏观层面,工资、就业、总需求的变化却不那么显眼,甚至可能因为软件价格下降,而呈现出一定的“通缩感”。
秩序的压力测试:从就业,到资本,再到国家
人工智能革命对旧有政治经济秩序的冲击,目前还在积累期。几条压力线已经隐约可见。第一条是劳动市场。很多早期预测认为,只要有一个能通过图灵测试、能解决复杂数学和编程问题的模型,就会立刻扫掉半壁白领工种。现实并没有这么快。模型在封闭题上的表现极佳,但一遇到开放情境、长期责任、复杂协调,就显得“锋利但不可靠”。
这导致当前的用法更多是“人机协作”:模型写初稿,人类改;模型给方案,人类选;模型做体力,人类负责任。真正意义上的“岗位消失”并不显著,但岗位内部的任务结构正在改变。
第二条是资本结构。大型科技公司原本是轻资产、高回报率的典型。云计算出来后,资本开支有所增加,但总体仍称得上“高 ROIC(投入资本回报率)”企业。现在,为了追逐人工智能红利,这些公司开始像重工业企业那样疯狂砸钱:一代又一代的 GPU 和专用芯片,折旧周期不断缩短;数据中心为适配新一代芯片,需要重投配电、散热、光纤;大量支出通过建设中项目(CIP)挂账,推迟在财报中体现。
伯里提醒,ROIC 的趋势,比绝对利润更能预示一家公司的长期命运。如果回报率一路往下走,而资本开支一轮轮加码,最后很可能走向“规模更大、价值更低”的局面。这意味着人工智能革命,可能在很长时间里,都是一场对资本耐力的考验。
第三条是国家层面的能源与安全。在杰克·克拉克眼里,未来几年最关键的政策问题之一,是“AI 基建如何与能源革命绑定”。模型继续扩展,就必须有廉价、稳定的大规模电力;而高密度的大型数据中心,又天然适合成为新型能源技术的首批用户,比如小堆核电、核聚变示范装置。
伯里的建议更激进:如果要在人工智能时代保持优势,一个国家需要主动拿出巨额预算,在全国范围布置安全可靠的小型核电站,升级电网,形成新一轮“电力大基建”。在这种设想里,“算力主权”和“能源主权”开始绑在一起。谁能提供最便宜、最稳定的电力,谁就有可能支撑起最大规模的模型训练和推理。
全球秩序:谁掌握“认知基础设施”,谁就重写游戏规则
人工智能革命对全球秩序的冲击,还远未定型。但几个趋势已经显出端倪。一是技术扩散与集中并存。从扩散角度看:开源模型、跨国云服务正在加速“智能下沉”,很多中小国家可以直接使用最新一代模型,绕过本地训练的高昂门槛。
从集中角度看:真正能在模型最前沿发力的,仍然是少数具备全球数据、顶级算力和顶尖人才的国家和公司。如果未来出现“可以自我改进的模型”,这种集中趋势还会进一步加剧。克拉克特别担心“AI 造 AI”的闭环。一旦某家实验室真的把“递归自我改进”做出来,研发速度可能陡然加快,外界很难跟上,更难监管。
二是军事与安全逻辑的渗透。对很多国家来说,人工智能不是“一个行业”,而是“所有行业的决策层”。从无人装备到情报分析,从网络攻防到后勤调度,谁在算法上领先,谁在整体战备和威慑上就有优势。这就带来一个矛盾:一方面,各国都担心对手率先把人工智能武器化;另一方面,又不得不在国内大力推广人工智能,以免在经济和民生领域被落下。这和核武时代的“核力量—民用核电”二元结构有点相似,但反馈速度更快,扩散路径更多。
三是“认知殖民”的隐忧。信息革命时代,全球网络基础设施和主流平台绝大部分掌握在少数国家手里。人工智能时代,这种不平衡可能表现为:某些语言、某些文化、某些价值体系,在训练数据中占据绝对优势;模型在细节处更熟悉这些话语方式,更自然地复制它们的偏好和盲点。这会不会让很多国家在不知不觉中,接受一套“预设好的思维模式”?这也是人工智能革命在文化层面最微妙、也最难量化的一部分冲击。
美国的应对:在狂热与冷静之间找平衡
在这场“第四次革命”里,美国既是实验场,也是赌桌中央。一方面,美国拥有:最成熟的资本市场,最领先的几家 AI 实验室,最广泛的高端用户群体。这一点,从 OpenAI、Anthropic 等公司的崛起就能看得很清楚。大量民间资本、风险投资、私募基金,快速响应大模型浪潮,把一波又一波的钱推向 GPU 和数据中心。
另一方面,美国也面临几重夹击:第一重是财政和债务压力。大规模 AI 基建需要长期资金,而公共财政已经背负沉重负担。如果把这轮资本开支完全交给企业,用股权、债务和私募信用去支撑,一旦模型能力没有如预期那样持续提升,或者应用层收入迟迟不上来,资产负债表的结构就会变得很脆弱。伯里特别忧虑一点:大量 AI 基建通过“私募信用 + 长久期折旧”这种方式进入系统,看上去安全,其实存在严重的久期错配和资产搁浅风险。
第二重是产业结构调整。传统互联网公司的增长逻辑,依赖的是轻资产、高毛利的软件业务。如果未来十年被迫变成“重资本硬件+软件”的混合体,股东对高 ROIC 的预期就很难满足,市场对这些公司的估值体系也会被迫重写。这不是简单的技术问题,而是整个华尔街评估体系的迁移问题。
第三重是政治和社会撕裂。人工智能革命来得很巧妙,恰好叠加在美国内部既有的各种裂缝上。一边是对“技术乐观主义”的期待,指望 AI 成为应对老龄化、提升医疗教育效率的工具;一边是对“技术失控”的担忧,害怕 AI 在失业、信息操控、军事风险上制造新麻烦。
在这种环境下,政策制定者很容易在两个极端之间摇摆:要么一味鼓励,把 AI 当作新一轮增长神话;要么急于设限,希望用监管把所有风险提前锁死。更现实的任务,可能是走一条中间路:在能源、算力、人才这些基础层面,采取类似“国家项目”的长期规划;在应用和商业模式层面,尽量放手,让市场去探索真正可行的用法;在安全和伦理层面,针对递归自我改进、军事应用、关键基础设施控制权这些高风险环节,提前建立红线和透明机制。
文化与人:语言被改变,人也会被改变
人工智能革命还有一个常被忽略的侧面:它首先是一场语言革命。大型语言模型的一个“无心之举”,就是掌握了人类前所未有的多语种能力。有模型在主要语言上的翻译水平,已经接近甚至超过专业译者;有模型在大量小语种上的掌握,远超绝大多数人类。帕特里克·麦肯齐曾感叹,这种“随手就能翻译 CNN 新闻到日语”的能力,是旧时代难以想象的。
在日常生活层面,模型已经悄悄进入很多人手边:有人用它查阅资料、做表做图;有人用它当一对一家教;甚至有人用它远程指导维修电路、水管,试图省下一笔昂贵的上门费。这种“认知外包”,一旦成为习惯,就会改变人的知识结构。医生如果长期依赖模型给出诊断建议,久而久之可能真的会忘记很多基础知识;学生如果早早习惯用模型写作业,原创表达能力也可能萎缩。伯里并不特别担心“人工智能毁灭人类”这种终极场景,他更担心人类主动放弃自己的能力,变得懒惰、迟钝。这一点从小处看是“工具依赖”,从大处看,则是文明本身的塑形问题。
如果把农业革命算作第一次“生产方式革命”,工业革命算作第二次,信息革命算作第三次,那么人工智能革命确实有资格被称为“第四次”。它的独特之处在于:前三次革命主要改造人和物之间的关系,这一回,则开始改造人和语言、人与知识、人与自我之间的关系。
从伯里、克拉克、帕特尔、麦肯齐几人的讨论里,可以看见几层现实:技术端的进步快得惊人,但距离真正“通用智能”仍有不小差距;资本端的投入已经到了历史罕见的规模,但应用端的商业回报还没有完全跟上;政治和制度层面的准备远远落后于技术和资本,许多关键问题尚未进入公共辩论的核心。
因此,这场“第四次革命”真正考验的,并不只是一两个国家的算力储备,也不只是几家公司的财报,而是整个人类文明的几项基本能力:面对新工具,能否保持理性,不神化、不妖魔化;面对新秩序,能否有足够的制度想象力,为权力和责任重新划线;面对新依赖,能否保留一部分“不可外包”的人性和判断。
农业革命之后,人类学会了如何和土地相处。工业革命之后,人类学会了如何和机器相处。信息革命之后,人类学会了如何和网络相处。人工智能革命之后,人类最终要学会的,是如何和“另一个会思考的系统”相处。这一课,恐怕比前几次都更难。


