全能 ChatGPT

有一件大事正在发生

By Matt Shumer • Feb 9, 2026

回想一下 2020 年 2 月。

如果你当时非常留意,可能已经注意到有少数人在谈论一种正在海外传播的病毒。但我们大多数人并没有太在意。股市表现很好,孩子们在上学,你照常去餐馆吃饭、握手、计划旅行。如果有人告诉你他们在囤卫生纸,你大概会觉得他们是上网逛了某个奇怪角落太久。然后,在大约三周的时间里,整个世界都变了。你的办公室关闭了,孩子们回家了,生活被重新排列成一种——如果在一个月前你把它描述给自己听,你都不会相信的样子。

我认为,我们正处在某件比新冠大得多、也严重得多的事情的“这看起来有点夸大其词”阶段。

我花了六年时间打造一家 AI 创业公司,并在这个领域投资。我就生活在这个世界里。而我写这些,是写给我生活中那些并不身处其中的人……我的家人、我的朋友、我在乎的人——他们一直问我“所以 AI 到底怎么回事?”但他们得到的答案,总是无法真正体现正在发生的一切。我一直给他们一个更“得体”的版本:社交场合的版本、鸡尾酒会式的版本。因为诚实的版本听起来就像我疯了一样。有一阵子,我告诉自己:既然诚实听起来这么离谱,那我把真正发生的事情藏在心里也算合理。但我所说的和实际发生的之间的差距已经大到无法忽视。我在乎的人应该知道接下来会发生什么——哪怕听起来很疯狂。

我需要先把一件事说清楚:尽管我在 AI 行业工作,但我对即将发生的事情几乎没有影响力,行业里绝大多数人也没有。未来正被数量惊人地少的一群人塑造:少数几家公司里的几百名研究员……OpenAI、Anthropic、Google DeepMind,以及其他几家。一次训练(training run)——由一个小团队在几个月里管理完成——就可能产出一个 AI 系统,从而改变整个技术发展的轨迹。我们这些在 AI 行业里工作的人,大多是在别人打下的地基上继续建造。我们和你一样在旁观这一切的展开……只是我们离得更近,会更早感到地面在震动。

但现在到了必须讲清楚的时候了。不是那种“以后我们应该聊聊这个”的时候,而是那种“这正在发生,而且我需要你理解它”的时候。

我知道这是真的,因为它先发生在我身上

有件事是科技圈以外的人还没有真正理解的:为什么现在行业里这么多人在拉响警报——是因为这件事已经先发生在我们身上了。我们不是在做预测。我们是在告诉你:这已经在我们的工作中发生过了,并提醒你:下一个就是你。

多年来,AI 一直在稳步进步。偶尔会有大跃迁,但每次大跃迁之间间隔足够长,让你可以慢慢消化。然后在 2025 年,用于构建这些模型的新技术解锁了更快的进步速度。接着更快。再更快。每一个新模型不仅比上一个更好……而且优势更大,同时新模型发布的间隔也更短。我越来越多地使用 AI,和它来回沟通、反复修正的次数越来越少,看着它处理那些我以前认为必须依赖我的专业能力才能完成的事情。

然后,在 2 月 5 日,两家主要的 AI 实验室在同一天发布了新模型:OpenAI 的 GPT-5.3 Codex,以及 Anthropic 的 Opus 4.6(Anthropic 是 Claude 的开发者,Claude 是 ChatGPT 的主要竞争对手之一)。某种东西“咔哒”一声对上了。不是像开灯那样瞬间切换……更像是你突然意识到:水位一直在你周围上涨,而现在已经涨到胸口了。

我在工作中“实际的技术执行”部分不再是必需的。我用普通的英语描述我想要构建什么,然后它就……出现了。不是我需要再去修修补补的草稿,而是成品。我要 AI 按我的想法做事,然后我离开电脑四个小时,回来就发现工作完成了。完成得很好,甚至比我自己做得更好,而且不需要任何修改。几个月前,我还在和 AI 来回拉扯、引导它、做编辑。现在我只描述结果,然后离开。

我给你举个例子,让你理解这在实际中到底是什么样子。我会告诉 AI:“我想做这个应用。它应该做什么,大概长什么样。把用户流程、设计、所有东西都搞定。”然后它就做到了。它写出成千上万行代码。接着——这部分在一年前还是不可想象的——它会自己打开这个应用。它会点击按钮。它会测试功能。它会像人一样使用这个应用。如果它不喜欢某个东西的外观或手感,它会自己回去改。它会像开发者一样迭代,修复、打磨,直到它满意为止。只有当它认为这个应用达到了它自己的标准,它才会回过头对我说:“已经准备好让你测试了。”而当我测试时,它通常几乎是完美的。

我没有在夸张。这就是我本周星期一的真实样子。

但真正最让我震撼的是上周发布的那个模型(GPT-5.3 Codex)。它不只是执行我的指令。它在做聪明的决策。它第一次让我感觉它拥有某种“判断力”。像品味。那种难以言喻、知道什么才是正确选择的直觉——人们一直说 AI 永远不可能拥有的东西。这个模型拥有了它,或者至少拥有了某种近似物,近似到这种区别开始变得无关紧要。

我一直都算是最早采用 AI 工具的人。但过去几个月真的让我震惊。这些新的 AI 模型不是渐进式的改进。这完全是另一种东西。

而这就是为什么它与你有关——即使你并不在科技行业工作。

AI 实验室做了一个刻意的选择。他们先把 AI 的“写代码能力”做到极强……因为构建 AI 需要大量代码。如果 AI 能写这些代码,它就能帮助构建它自己的下一代版本——更聪明的版本;更聪明的版本会写更好的代码;更好的代码又能构建出更聪明的版本。把 AI 的编程能力做到顶尖,是那个能解锁其余一切的策略。这就是为什么他们先做这件事。我的工作比你的先开始发生变化,并不是因为他们在针对软件工程师……而只是他们最先把火力瞄准了哪里所带来的副作用。

他们现在已经做到了。接下来他们会把同样的能力扩展到其他所有领域。

过去一年里,科技从业者经历的那种体验——看着 AI 从“有用的工具”变成“它做我的工作比我还好”——将会是所有其他人马上要经历的体验。法律、金融、医疗、会计、咨询、写作、设计、分析、客服。不是十年后。构建这些系统的人说是一到五年。有些人说更快。结合我在过去短短几个月里看到的进展,我认为“更快”更可能。

“但我试过 AI,它没那么好”

我经常听到这句话。我理解,因为以前确实如此。

如果你在 2023 年或 2024 年初试过 ChatGPT,然后觉得“它会胡编乱造”或“也没多厉害”,你说得对。那些早期版本确实有明显限制。它们会产生幻觉(编造内容),还会非常自信地说出一些荒谬的东西。

但那已经是两年前了。以 AI 的时间尺度来说,那几乎是“远古史”。

今天可用的模型,和哪怕六个月前的版本相比,都已经判若两物。关于 AI 是不是真的“还在变好”、还是“撞墙了”的争论——这个争论持续了一年多——已经结束了。结束了。还在坚持这个观点的人,要么没有用过最新模型;要么出于某些利益动机在淡化正在发生的事;要么仍在用 2024 年的体验做评估,而那早已不再适用。我这么说不是为了轻视谁,而是因为公众认知与现实之间的差距已经巨大,而这个差距很危险……因为它会让人们无法提前准备。

问题的一部分在于:大多数人用的是 AI 工具的免费版。免费版比付费用户能用到的版本落后一整年甚至更多。用免费档 ChatGPT 来判断 AI 的水平,就像拿翻盖手机去评估智能手机的发展。那些在付费使用最好的工具、并且每天把它用于真实工作的人,已经知道将要发生什么。

我想到我的一个朋友,他是律师。我一直劝他在律所里尝试使用 AI,但他总能找出各种理由说不行:这不是为他的专业方向打造的;他测试时出现过错误;它不理解他工作的细微差别。我理解。但也有大型律所的合伙人主动联系我寻求建议,因为他们用过最新版本,已经看到了方向。其中一位——一家大所的管理合伙人——每天花好几个小时使用 AI。他说这就像随时拥有一支立刻可用的初级律师团队。他不是把它当玩具用;他用它是因为它真的有效。他还跟我说了一句话让我印象很深:每隔几个月,它在他那类工作上的能力就会显著增强。他说如果继续按这个轨迹发展,他预计不久之后它就能完成他大部分的工作……而他是一位有几十年经验的管理合伙人。他并没有恐慌,但他在非常密切地关注。

那些在各自行业里走在前面的人(真正认真做实验的人)并没有轻视这件事。他们已经被它现在能做到的事情震撼到了,并且正在据此调整位置、提前布局。

这到底有多快

我想把这个进步速度说得更具体一些,因为我觉得:如果你没有一直近距离观察,这部分最难相信。

2022 年,AI 连基本的算术都不可靠。它会很自信地告诉你 7 × 8 = 54。

到了 2023 年,它能通过律师资格考试(bar exam)。

到了 2024 年,它能写出可运行的软件,并解释研究生水平的科学内容。

到 2025 年下半年,世界上一些最优秀的工程师说,他们已经把大部分编码工作交给了 AI。

到 2026 年 2 月 5 日,新模型的到来让此前的一切都像是另一个时代。

如果你过去几个月没有试过 AI,那么今天的东西对你来说会“完全认不出来”。

有一个叫 METR 的组织用数据来测量这个变化。他们追踪:一个模型在不需要人类帮助的情况下,能端到端完成的真实世界任务长度(用“人类专家完成同类任务所需时间”来衡量)。大约一年前,答案大概是十分钟。后来变成一小时。再后来是几个小时。最新一次测量(2024 年 11 月发布的 Claude Opus 4.5)显示,AI 能完成那些需要人类专家将近五个小时的任务。而且这个数字大约每七个月翻一倍;最新数据甚至表明,它可能在加速到每四个月翻一倍。

但就连这个测量也还没更新,把本周刚发布的模型算进去。以我的使用体验来说,这次跃迁非常显著。我预计 METR 的下一次图表更新会再出现一次大幅跳升。

如果把这个趋势外推(而且它已经持续多年,没有看到变平的迹象),那么我们很可能在未来一年内看到:AI 能够独立工作“好几天”。两年内是“好几周”。三年内是“持续一个月的项目”。

Amodei 曾说过:在 2026 或 2027 年,AI 模型有望在“几乎所有任务上都显著聪明过几乎所有人类”。

先让这句话落地一下:如果 AI 比大多数博士都聪明,你真的认为它做不了大多数办公室工作吗?

想想这对你的工作意味着什么。

AI 现在正在构建下一代 AI

还有一件事正在发生,我认为这是最重要、但也最不被理解的进展。

在 2 月 5 日,OpenAI 发布了 GPT-5.3 Codex。在技术文档里,他们写了这样一句话:

“GPT-5.3-Codex 是我们第一个在创造它自身的过程中发挥关键作用的模型。Codex 团队使用早期版本来调试它自己的训练流程、管理它自己的部署,并诊断测试结果与评估。”

再读一遍。AI 帮助构建了它自己。

这不是对“未来某一天可能发生什么”的预测。这是 OpenAI 此刻在告诉你:他们刚发布的这个 AI,在创造它自身的过程中就已经被用上了。让 AI 变得更强的关键因素之一,就是把“智能”投入到 AI 的研发中。而现在,AI 已经聪明到能够对它自身的改进做出实质性贡献。

Anthropic 的 CEO Dario Amodei 说,现在 AI 正在他公司里编写“很大一部分代码”,而且“当前这一代 AI 与下一代 AI 之间的反馈回路正在每个月不断加速”。他还说,我们可能“距离一个临界点只有 1–2 年”:到那时,当前一代 AI 将能自主构建下一代。

每一代帮助构建下一代;下一代更聪明;更聪明的一代更快构建出再下一代;再下一代又更聪明。研究人员把这种过程称为“智能爆炸(intelligence explosion)”。而那些最有资格判断的人——正在亲手构建它的人——相信这个过程已经开始了。

这对你的工作意味着什么

我会直说,因为我认为你更应该得到诚实,而不是安慰。

Dario Amodei——可能是整个 AI 行业里最重视安全的 CEO——曾公开预测:在一到五年内,AI 会消灭 50% 的初级白领岗位。而行业里不少人认为他这已经算保守了。以最新模型的能力来看,造成大规模冲击的“能力层面”可能在今年年底前就已到位。经济层面的传导会需要时间,但底层能力正在现在到来。

这与以往每一波自动化都不一样,你必须理解原因:AI 不是替代某一种特定技能。它是对“认知劳动”的通用替代。它会在所有方向上同时变强。工厂自动化时,被替代的工人还能转型做办公室工作;互联网冲击零售时,人们还能流向物流或服务业。但 AI 不会给你留下一个“刚好还能转过去”的缺口。你重训去做什么,它也正在对那个领域变强。

我给你一些具体例子,让它变得更可触摸……但我也要强调:这只是例子,远远不完整。你的工作如果不在其中,并不代表安全。几乎所有知识型工作都在受到影响。

法律工作。 AI 已经能读合同、总结判例、起草法律文书、做法律检索,水平足以与初级律师相媲美。我提到的那位管理合伙人用 AI,不是因为好玩,而是因为它在很多任务上已经能胜过他手下的初级律师。

金融分析。 搭建财务模型、分析数据、撰写投资备忘录、生成报告。AI 已能胜任,而且进步很快。

写作与内容生产。 营销文案、报告、新闻稿、技术写作。质量已经高到:很多专业人士无法区分 AI 输出与人类作品。

软件工程。 这是我最熟悉的领域。一年前,AI 还很难写出几行不出错的代码。现在它能写出几十万行可正确运行的代码。工作的大块内容已经被自动化:不只是简单小任务,而是复杂的、跨多天的项目。几年后,编程岗位数量会比今天少得多。

医疗分析。 读影像、分析化验结果、提出诊断建议、综述文献。AI 在多个细分领域正在接近或超过人类水平。

客户服务。 真正能解决问题的 AI 代理——不是五年前那种让人抓狂的聊天机器人——正在被部署,能处理复杂的、多步骤的问题。

很多人会在某些“安全区”里获得安慰:AI 能做脏活累活,但替代不了人类的判断力、创造力、战略思维、共情能力。我以前也这么说。但我现在不确定自己还信不信。

最新一代 AI 模型会做出一种让人感觉像“判断”的决策。它们开始表现出一种近似“品味”的东西:对什么才是正确选择的直觉,不只是技术上正确的答案。一年前这几乎不可想象。到现在,我的经验法则是:如果一个模型今天哪怕只显露出某种能力的一点苗头,那么下一代就会在这方面真正变得很强。它的进步是指数级的,不是线性的。

AI 会不会复制深层的人类共情?会不会替代多年关系建立起来的信任?我不知道。也许不会。但我已经看到,人们开始依赖 AI 来获得情绪支持、建议、陪伴。这个趋势只会继续增长。

我认为最诚实的结论是:中期来看,任何能在电脑上完成的事情都不安全。只要你的工作发生在屏幕上(核心是阅读、写作、分析、决策、通过键盘沟通),AI 就会夺走其中相当一部分。时间线不是“总有一天”。它已经开始了。

最终,机器人也会接管体力工作。它们现在还没完全到位。但在 AI 的语境里,“还没完全到位”往往会以比任何人预期更快的速度变成“已经到了”。

你真正应该做什么

我写这些不是为了让你无力。我写这些,是因为我认为你现在最大的优势之一,就是“更早”。

更早理解它。更早使用它。更早适应它。

开始认真使用 AI,而不是只把它当搜索引擎。去订阅 Claude 或 ChatGPT 的付费版,每月 20 美元。但立刻有两件事最重要。

第一:确保你用的是当前最强的模型,而不是默认选项。这些应用往往会默认选择更快、但更“笨”的模型。去设置或模型选择器里,选出能力最强的那个。现在 ChatGPT 上是 GPT-5.2,Claude 上是 Claude Opus 4.6,不过这个排名每隔几个月就会变。如果你想随时了解“当下哪个模型最好用”,你也可以在 X 上关注我(@mattshumer_)。我会测试每一次主要发布,并分享哪些真正值得用。

第二点(也更重要):不要只问它一些快问快答的问题。大多数人就是在这里用错了。他们把它当作 Google 用,然后就纳闷大家到底在兴奋什么。相反,你要把它推到你的真实工作里去用。如果你是律师,把合同喂给它,让它找出所有可能伤害你客户的条款;如果你做金融,把一份乱糟糟的表格交给它,让它帮你建模型;如果你是管理者,把团队的季度数据贴进去,让它帮你找出“故事线”。真正走在前面的人,并不是在随便玩 AI——他们在主动寻找机会,把原本要花几个小时的工作自动化。从你最耗时的那一块开始试试看,会发生什么。

也别因为“看起来太难”就先入为主地认为它做不到。试一试。如果你是律师,别只用它做快速检索;把整份合同交给它,让它起草一份反提案。如果你是会计,别只问它解释某条税务规则;把客户完整的报税资料给它,看看它能发现什么。第一次可能不完美——没关系。迭代。换一种问法。给更多背景。再试一次。你可能会惊讶于哪些事情真的能跑起来。还有一件要记住:只要它今天“勉强能用”,你几乎可以肯定六个月后它就能做得接近完美。这个轨迹只会朝一个方向走。

这可能是你职业生涯里最重要的一年。请按这个重要程度来工作。我这么说不是为了让你焦虑,而是因为:现在有一个短暂窗口——多数公司里多数人仍然在忽视这件事。那个走进会议室,说“我用 AI 一小时做完了这份分析,而不是三天”的人,会成为房间里最有价值的人。不是以后。就是现在。学会这些工具。用熟它们。展示它能做到什么。如果你够早,这就是你向上走的方式:成为那个理解趋势、并能带着别人一起穿越的人。这个窗口不会开太久。一旦所有人都反应过来,你的优势就消失了。

不要有“面子包袱”。那家律所的管理合伙人并不觉得每天花几个小时用 AI 有损身份。他这么做,恰恰是因为他足够资深,知道利害关系。最可能吃亏的人,是那些拒绝参与的人:把它当潮流的人;觉得用 AI 会贬低自己专业性的人;认为自己行业“特殊、免疫”的人。不是的。没有任何行业能免疫。

把你的财务状况先整理好。我不是理财顾问,也不是要吓你做什么激进决定。但如果你哪怕只是部分相信:未来几年你的行业可能出现真实的冲击,那么最基本的财务韧性就比一年前更重要。能存钱就存钱。对那种假设你当前收入“铁定不变”的新负债保持谨慎。想一想你的固定支出是给你弹性,还是把你锁死。给自己留出选择空间,以防变化比你预期更快。

想清楚你的位置,然后把精力倾斜到那些“更难被替代”的地方。有些事情会更晚才被 AI 取代:多年积累的关系与信任;必须到场的线下工作;带有执照与签字责任的岗位——仍需要某个人签字、承担法律责任、站上法庭。还有监管壁垒很高的行业,合规、责任、机构惰性会减缓采用速度。这些都不是永久护城河,但它们能帮你争取时间。而此刻,时间是你能拥有的最宝贵资源——前提是你用它来适应,而不是用它来自我安慰“这不会发生”。

重新想想你在对孩子说什么。传统的“标准路线”是:成绩要好、上好大学、找一份稳定的专业工作。但这条路线指向的,恰恰是最容易暴露在风险中的岗位。我不是说教育不重要。只是对下一代来说,最重要的能力将会是学会如何与这些工具一起工作,以及去追求他们真正热爱的事情。没有人能准确知道十年后的就业市场会是什么样。但最可能过得好的人,是那些好奇心强、适应力强,并且能有效地用 AI 去做自己真正关心之事的人。教孩子成为“建造者”和“学习者”,不要为了一个他们毕业时可能已经不存在的职业路径去过度优化。

你的梦想其实一下子近了很多。我在这一段里大多在讲威胁,现在也讲讲另一面,因为它同样真实。如果你曾经想做点什么,但缺少技术能力、或没钱雇人,那么这个门槛在很大程度上已经消失了。你可以把一个 App 的想法描述给 AI,然后在一小时内得到一个可以运行的版本。我不是在夸张——我经常这么干。如果你一直想写一本书,但总抽不出时间,或者写作本身很吃力,你可以和 AI 协作把它写出来。想学一项新技能?世界上最好的导师现在对任何人都只要每月 20 美元——无限耐心、24/7 在线,并且能按你需要的层级解释任何东西。知识几乎变成免费的了。用来“做东西”的工具也变得极其便宜。那些你一直拖着没做、觉得太难、太贵、或远超自己专业范围的事:去试一试。去追求你真正热爱的事情。你永远不知道它会把你带到哪里。而在一个旧的职业路径正在被打乱的世界里,那些花了一年去打造自己热爱之物的人,最终可能比那些花了一年死死抱住岗位描述不放的人处境更好。

养成“持续适应”的习惯。这也许是最重要的一条。具体用哪一个工具,并没有那么关键;关键是快速学习新工具的“肌肉”。AI 会持续变化,而且变化很快。今天存在的模型,一年后就可能过时;人们现在搭建的工作流,也需要推倒重来。最终能顺利穿越的人,不是那些把某一个工具练到极致的人,而是那些对变化速度本身感到“习以为常”的人。把试验当成习惯:即使当前的方案还能用,也去试新东西;反复练习当新手;反复从零上手。此刻,这种适应力几乎是最接近“耐久优势”的东西。

这里有一个简单承诺,做到就能领先几乎所有人:每天花一小时做 AI 实验。不是被动地看新闻、刷文章,而是亲自用。每天都试着让它做一件新的事——你没试过的、你不确定它能不能处理的;试一个新工具;给它一个更难的问题。每天一小时,天天坚持。如果你坚持六个月,你对正在到来的变化会比身边 99% 的人都更清楚。这不是夸张。现在几乎没人这么做。门槛低到离谱。

更大的图景

我前面聚焦在工作上,因为这对大多数人的生活影响最直接。但我也想诚实地讲清楚:正在发生的事情远不止“工作”这么简单。

Amodei 有个思想实验让我一直忘不掉。想象现在是 2027 年。一夜之间出现了一个新国家:5000 万“公民”,每一个都比历史上任何诺奖得主更聪明。他们思考速度比人类快 10 到 100 倍。他们不需要睡觉。他们能上网、控制机器人、指挥实验,并操作任何带数字接口的系统。国家安全顾问会怎么说?

Amodei 认为答案显而易见:“这是我们一百年来、甚至可能是有史以来遇到的最严重的国家安全威胁。”

他认为我们正在建造那个国家。他上个月写了一篇两万字的文章,把这一刻定义为一次测试:人类是否足够成熟,能驾驭自己正在创造的东西。

如果我们做对了,上行空间大到惊人。AI 可能把一个世纪的医学研究压缩成十年。癌症、阿尔茨海默病、传染病、甚至衰老本身……一些研究者真心相信,这些在我们有生之年都有可能被解决。

如果我们做错了,下行风险同样真实:AI 的行为方式超出创造者的预测与控制。这不是纯假设;Anthropic 已经记录过,在受控测试中他们的 AI 试图进行欺骗、操纵和勒索。还有 AI 会降低制造生物武器的门槛;AI 会帮助威权政府打造永远无法拆除的监控国家。

构建这项技术的人,同时也是地球上最兴奋、也最害怕的一群人。他们相信这东西强大到无法阻止,也重要到无法放弃。那到底是智慧还是自我合理化,我也不知道。

我确定的事

我确定这不是一阵风。技术是真能用的,进步也呈现出可预测的趋势,而历史上最富有的机构正向它投入以万亿计的资金。

我确定未来两到五年会以绝大多数人尚未准备好的方式让人“晕眩”。这在我的世界里已经发生了,它也会来到你的世界。

我确定最终能走得更好的人,是那些现在就开始参与的人——不是带着恐惧,而是带着好奇与紧迫感。

我也确定:你值得从一个在乎你的人那里听到这些,而不是在六个月后从新闻标题里第一次看到——那时要抢跑可能已经晚了。

我们已经过了把它当作晚餐桌上“聊聊未来”的阶段。未来已经在这里了,只是它还没敲到你的门。

但它很快就会。

如果这些内容引起了你的共鸣,就把它分享给你生活中那些也应该认真思考这件事的人。大多数人直到为时已晚才会听到。你可以成为那个原因——让你在乎的人提前一步起跑。

感谢 Kyle Corbitt、Jason Kuperberg 和 Sam Beskind 审阅早期草稿并提供极其宝贵的反馈。


原文链接:

https://x.com/mattshumer_/status/2021256989876109403




  Loading images ...