58Home.AI

全能 ChatGPT 4 months ago

有一件大事正在发生

By Matt Shumer • Feb 9, 2026

回想一下 2020 年 2 月。

如果你当时非常留意，可能已经注意到有少数人在谈论一种正在海外传播的病毒。但我们大多数人并没有太在意。股市表现很好，孩子们在上学，你照常去餐馆吃饭、握手、计划旅行。如果有人告诉你他们在囤卫生纸，你大概会觉得他们是上网逛了某个奇怪角落太久。然后，在大约三周的时间里，整个世界都变了。你的办公室关闭了，孩子们回家了，生活被重新排列成一种——如果在一个月前你把它描述给自己听，你都不会相信的样子。

我认为，我们正处在某件比新冠大得多、也严重得多的事情的“这看起来有点夸大其词”阶段。

我花了六年时间打造一家 AI 创业公司，并在这个领域投资。我就生活在这个世界里。而我写这些，是写给我生活中那些并不身处其中的人……我的家人、我的朋友、我在乎的人——他们一直问我“所以 AI 到底怎么回事？”但他们得到的答案，总是无法真正体现正在发生的一切。我一直给他们一个更“得体”的版本：社交场合的版本、鸡尾酒会式的版本。因为诚实的版本听起来就像我疯了一样。有一阵子，我告诉自己：既然诚实听起来这么离谱，那我把真正发生的事情藏在心里也算合理。但我所说的和实际发生的之间的差距已经大到无法忽视。我在乎的人应该知道接下来会发生什么——哪怕听起来很疯狂。

我需要先把一件事说清楚：尽管我在 AI 行业工作，但我对即将发生的事情几乎没有影响力，行业里绝大多数人也没有。未来正被数量惊人地少的一群人塑造：少数几家公司里的几百名研究员……OpenAI、Anthropic、Google DeepMind，以及其他几家。一次训练（training run）——由一个小团队在几个月里管理完成——就可能产出一个 AI 系统，从而改变整个技术发展的轨迹。我们这些在 AI 行业里工作的人，大多是在别人打下的地基上继续建造。我们和你一样在旁观这一切的展开……只是我们离得更近，会更早感到地面在震动。

但现在到了必须讲清楚的时候了。不是那种“以后我们应该聊聊这个”的时候，而是那种“这正在发生，而且我需要你理解它”的时候。

我知道这是真的，因为它先发生在我身上

有件事是科技圈以外的人还没有真正理解的：为什么现在行业里这么多人在拉响警报——是因为这件事已经先发生在我们身上了。我们不是在做预测。我们是在告诉你：这已经在我们的工作中发生过了，并提醒你：下一个就是你。

多年来，AI 一直在稳步进步。偶尔会有大跃迁，但每次大跃迁之间间隔足够长，让你可以慢慢消化。然后在 2025 年，用于构建这些模型的新技术解锁了更快的进步速度。接着更快。再更快。每一个新模型不仅比上一个更好……而且优势更大，同时新模型发布的间隔也更短。我越来越多地使用 AI，和它来回沟通、反复修正的次数越来越少，看着它处理那些我以前认为必须依赖我的专业能力才能完成的事情。

然后，在 2 月 5 日，两家主要的 AI 实验室在同一天发布了新模型：OpenAI 的 GPT-5.3 Codex，以及 Anthropic 的 Opus 4.6（Anthropic 是 Claude 的开发者，Claude 是 ChatGPT 的主要竞争对手之一）。某种东西“咔哒”一声对上了。不是像开灯那样瞬间切换……更像是你突然意识到：水位一直在你周围上涨，而现在已经涨到胸口了。

我在工作中“实际的技术执行”部分不再是必需的。我用普通的英语描述我想要构建什么，然后它就……出现了。不是我需要再去修修补补的草稿，而是成品。我要 AI 按我的想法做事，然后我离开电脑四个小时，回来就发现工作完成了。完成得很好，甚至比我自己做得更好，而且不需要任何修改。几个月前，我还在和 AI 来回拉扯、引导它、做编辑。现在我只描述结果，然后离开。

我给你举个例子，让你理解这在实际中到底是什么样子。我会告诉 AI：“我想做这个应用。它应该做什么，大概长什么样。把用户流程、设计、所有东西都搞定。”然后它就做到了。它写出成千上万行代码。接着——这部分在一年前还是不可想象的——它会自己打开这个应用。它会点击按钮。它会测试功能。它会像人一样使用这个应用。如果它不喜欢某个东西的外观或手感，它会自己回去改。它会像开发者一样迭代，修复、打磨，直到它满意为止。只有当它认为这个应用达到了它自己的标准，它才会回过头对我说：“已经准备好让你测试了。”而当我测试时，它通常几乎是完美的。

我没有在夸张。这就是我本周星期一的真实样子。

但真正最让我震撼的是上周发布的那个模型（GPT-5.3 Codex）。它不只是执行我的指令。它在做聪明的决策。它第一次让我感觉它拥有某种“判断力”。像品味。那种难以言喻、知道什么才是正确选择的直觉——人们一直说 AI 永远不可能拥有的东西。这个模型拥有了它，或者至少拥有了某种近似物，近似到这种区别开始变得无关紧要。

我一直都算是最早采用 AI 工具的人。但过去几个月真的让我震惊。这些新的 AI 模型不是渐进式的改进。这完全是另一种东西。

而这就是为什么它与你有关——即使你并不在科技行业工作。

AI 实验室做了一个刻意的选择。他们先把 AI 的“写代码能力”做到极强……因为构建 AI 需要大量代码。如果 AI 能写这些代码，它就能帮助构建它自己的下一代版本——更聪明的版本；更聪明的版本会写更好的代码；更好的代码又能构建出更聪明的版本。把 AI 的编程能力做到顶尖，是那个能解锁其余一切的策略。这就是为什么他们先做这件事。我的工作比你的先开始发生变化，并不是因为他们在针对软件工程师……而只是他们最先把火力瞄准了哪里所带来的副作用。

他们现在已经做到了。接下来他们会把同样的能力扩展到其他所有领域。

过去一年里，科技从业者经历的那种体验——看着 AI 从“有用的工具”变成“它做我的工作比我还好”——将会是所有其他人马上要经历的体验。法律、金融、医疗、会计、咨询、写作、设计、分析、客服。不是十年后。构建这些系统的人说是一到五年。有些人说更快。结合我在过去短短几个月里看到的进展，我认为“更快”更可能。

“但我试过 AI，它没那么好”

我经常听到这句话。我理解，因为以前确实如此。

如果你在 2023 年或 2024 年初试过 ChatGPT，然后觉得“它会胡编乱造”或“也没多厉害”，你说得对。那些早期版本确实有明显限制。它们会产生幻觉（编造内容），还会非常自信地说出一些荒谬的东西。

但那已经是两年前了。以 AI 的时间尺度来说，那几乎是“远古史”。

今天可用的模型，和哪怕六个月前的版本相比，都已经判若两物。关于 AI 是不是真的“还在变好”、还是“撞墙了”的争论——这个争论持续了一年多——已经结束了。结束了。还在坚持这个观点的人，要么没有用过最新模型；要么出于某些利益动机在淡化正在发生的事；要么仍在用 2024 年的体验做评估，而那早已不再适用。我这么说不是为了轻视谁，而是因为公众认知与现实之间的差距已经巨大，而这个差距很危险……因为它会让人们无法提前准备。

问题的一部分在于：大多数人用的是 AI 工具的免费版。免费版比付费用户能用到的版本落后一整年甚至更多。用免费档 ChatGPT 来判断 AI 的水平，就像拿翻盖手机去评估智能手机的发展。那些在付费使用最好的工具、并且每天把它用于真实工作的人，已经知道将要发生什么。

我想到我的一个朋友，他是律师。我一直劝他在律所里尝试使用 AI，但他总能找出各种理由说不行：这不是为他的专业方向打造的；他测试时出现过错误；它不理解他工作的细微差别。我理解。但也有大型律所的合伙人主动联系我寻求建议，因为他们用过最新版本，已经看到了方向。其中一位——一家大所的管理合伙人——每天花好几个小时使用 AI。他说这就像随时拥有一支立刻可用的初级律师团队。他不是把它当玩具用；他用它是因为它真的有效。他还跟我说了一句话让我印象很深：每隔几个月，它在他那类工作上的能力就会显著增强。他说如果继续按这个轨迹发展，他预计不久之后它就能完成他大部分的工作……而他是一位有几十年经验的管理合伙人。他并没有恐慌，但他在非常密切地关注。

那些在各自行业里走在前面的人（真正认真做实验的人）并没有轻视这件事。他们已经被它现在能做到的事情震撼到了，并且正在据此调整位置、提前布局。

这到底有多快

我想把这个进步速度说得更具体一些，因为我觉得：如果你没有一直近距离观察，这部分最难相信。

2022 年，AI 连基本的算术都不可靠。它会很自信地告诉你 7 × 8 = 54。

到了 2023 年，它能通过律师资格考试（bar exam）。

到了 2024 年，它能写出可运行的软件，并解释研究生水平的科学内容。

到 2025 年下半年，世界上一些最优秀的工程师说，他们已经把大部分编码工作交给了 AI。

到 2026 年 2 月 5 日，新模型的到来让此前的一切都像是另一个时代。

如果你过去几个月没有试过 AI，那么今天的东西对你来说会“完全认不出来”。

有一个叫 METR 的组织用数据来测量这个变化。他们追踪：一个模型在不需要人类帮助的情况下，能端到端完成的真实世界任务长度（用“人类专家完成同类任务所需时间”来衡量）。大约一年前，答案大概是十分钟。后来变成一小时。再后来是几个小时。最新一次测量（2024 年 11 月发布的 Claude Opus 4.5）显示，AI 能完成那些需要人类专家将近五个小时的任务。而且这个数字大约每七个月翻一倍；最新数据甚至表明，它可能在加速到每四个月翻一倍。

但就连这个测量也还没更新，把本周刚发布的模型算进去。以我的使用体验来说，这次跃迁非常显著。我预计 METR 的下一次图表更新会再出现一次大幅跳升。

如果把这个趋势外推（而且它已经持续多年，没有看到变平的迹象），那么我们很可能在未来一年内看到：AI 能够独立工作“好几天”。两年内是“好几周”。三年内是“持续一个月的项目”。

Amodei 曾说过：在 2026 或 2027 年，AI 模型有望在“几乎所有任务上都显著聪明过几乎所有人类”。

先让这句话落地一下：如果 AI 比大多数博士都聪明，你真的认为它做不了大多数办公室工作吗？

想想这对你的工作意味着什么。

AI 现在正在构建下一代 AI

还有一件事正在发生，我认为这是最重要、但也最不被理解的进展。

在 2 月 5 日，OpenAI 发布了 GPT-5.3 Codex。在技术文档里，他们写了这样一句话：

“GPT-5.3-Codex 是我们第一个在创造它自身的过程中发挥关键作用的模型。Codex 团队使用早期版本来调试它自己的训练流程、管理它自己的部署，并诊断测试结果与评估。”

再读一遍。AI 帮助构建了它自己。

这不是对“未来某一天可能发生什么”的预测。这是 OpenAI 此刻在告诉你：他们刚发布的这个 AI，在创造它自身的过程中就已经被用上了。让 AI 变得更强的关键因素之一，就是把“智能”投入到 AI 的研发中。而现在，AI 已经聪明到能够对它自身的改进做出实质性贡献。

Anthropic 的 CEO Dario Amodei 说，现在 AI 正在他公司里编写“很大一部分代码”，而且“当前这一代 AI 与下一代 AI 之间的反馈回路正在每个月不断加速”。他还说，我们可能“距离一个临界点只有 1–2 年”：到那时，当前一代 AI 将能自主构建下一代。

每一代帮助构建下一代；下一代更聪明；更聪明的一代更快构建出再下一代；再下一代又更聪明。研究人员把这种过程称为“智能爆炸（intelligence explosion）”。而那些最有资格判断的人——正在亲手构建它的人——相信这个过程已经开始了。

这对你的工作意味着什么

我会直说，因为我认为你更应该得到诚实，而不是安慰。

Dario Amodei——可能是整个 AI 行业里最重视安全的 CEO——曾公开预测：在一到五年内，AI 会消灭 50% 的初级白领岗位。而行业里不少人认为他这已经算保守了。以最新模型的能力来看，造成大规模冲击的“能力层面”可能在今年年底前就已到位。经济层面的传导会需要时间，但底层能力正在现在到来。

这与以往每一波自动化都不一样，你必须理解原因：AI 不是替代某一种特定技能。它是对“认知劳动”的通用替代。它会在所有方向上同时变强。工厂自动化时，被替代的工人还能转型做办公室工作；互联网冲击零售时，人们还能流向物流或服务业。但 AI 不会给你留下一个“刚好还能转过去”的缺口。你重训去做什么，它也正在对那个领域变强。

我给你一些具体例子，让它变得更可触摸……但我也要强调：这只是例子，远远不完整。你的工作如果不在其中，并不代表安全。几乎所有知识型工作都在受到影响。

法律工作。 AI 已经能读合同、总结判例、起草法律文书、做法律检索，水平足以与初级律师相媲美。我提到的那位管理合伙人用 AI，不是因为好玩，而是因为它在很多任务上已经能胜过他手下的初级律师。

金融分析。搭建财务模型、分析数据、撰写投资备忘录、生成报告。AI 已能胜任，而且进步很快。

写作与内容生产。营销文案、报告、新闻稿、技术写作。质量已经高到：很多专业人士无法区分 AI 输出与人类作品。

软件工程。这是我最熟悉的领域。一年前，AI 还很难写出几行不出错的代码。现在它能写出几十万行可正确运行的代码。工作的大块内容已经被自动化：不只是简单小任务，而是复杂的、跨多天的项目。几年后，编程岗位数量会比今天少得多。

医疗分析。读影像、分析化验结果、提出诊断建议、综述文献。AI 在多个细分领域正在接近或超过人类水平。

客户服务。真正能解决问题的 AI 代理——不是五年前那种让人抓狂的聊天机器人——正在被部署，能处理复杂的、多步骤的问题。

很多人会在某些“安全区”里获得安慰：AI 能做脏活累活，但替代不了人类的判断力、创造力、战略思维、共情能力。我以前也这么说。但我现在不确定自己还信不信。

最新一代 AI 模型会做出一种让人感觉像“判断”的决策。它们开始表现出一种近似“品味”的东西：对什么才是正确选择的直觉，不只是技术上正确的答案。一年前这几乎不可想象。到现在，我的经验法则是：如果一个模型今天哪怕只显露出某种能力的一点苗头，那么下一代就会在这方面真正变得很强。它的进步是指数级的，不是线性的。

AI 会不会复制深层的人类共情？会不会替代多年关系建立起来的信任？我不知道。也许不会。但我已经看到，人们开始依赖 AI 来获得情绪支持、建议、陪伴。这个趋势只会继续增长。

我认为最诚实的结论是：中期来看，任何能在电脑上完成的事情都不安全。只要你的工作发生在屏幕上（核心是阅读、写作、分析、决策、通过键盘沟通），AI 就会夺走其中相当一部分。时间线不是“总有一天”。它已经开始了。

最终，机器人也会接管体力工作。它们现在还没完全到位。但在 AI 的语境里，“还没完全到位”往往会以比任何人预期更快的速度变成“已经到了”。

你真正应该做什么

我写这些不是为了让你无力。我写这些，是因为我认为你现在最大的优势之一，就是“更早”。

更早理解它。更早使用它。更早适应它。

开始认真使用 AI，而不是只把它当搜索引擎。去订阅 Claude 或 ChatGPT 的付费版，每月 20 美元。但立刻有两件事最重要。

第一：确保你用的是当前最强的模型，而不是默认选项。这些应用往往会默认选择更快、但更“笨”的模型。去设置或模型选择器里，选出能力最强的那个。现在 ChatGPT 上是 GPT-5.2，Claude 上是 Claude Opus 4.6，不过这个排名每隔几个月就会变。如果你想随时了解“当下哪个模型最好用”，你也可以在 X 上关注我（@mattshumer_）。我会测试每一次主要发布，并分享哪些真正值得用。

第二点（也更重要）：不要只问它一些快问快答的问题。大多数人就是在这里用错了。他们把它当作 Google 用，然后就纳闷大家到底在兴奋什么。相反，你要把它推到你的真实工作里去用。如果你是律师，把合同喂给它，让它找出所有可能伤害你客户的条款；如果你做金融，把一份乱糟糟的表格交给它，让它帮你建模型；如果你是管理者，把团队的季度数据贴进去，让它帮你找出“故事线”。真正走在前面的人，并不是在随便玩 AI——他们在主动寻找机会，把原本要花几个小时的工作自动化。从你最耗时的那一块开始试试看，会发生什么。

也别因为“看起来太难”就先入为主地认为它做不到。试一试。如果你是律师，别只用它做快速检索；把整份合同交给它，让它起草一份反提案。如果你是会计，别只问它解释某条税务规则；把客户完整的报税资料给它，看看它能发现什么。第一次可能不完美——没关系。迭代。换一种问法。给更多背景。再试一次。你可能会惊讶于哪些事情真的能跑起来。还有一件要记住：只要它今天“勉强能用”，你几乎可以肯定六个月后它就能做得接近完美。这个轨迹只会朝一个方向走。

这可能是你职业生涯里最重要的一年。请按这个重要程度来工作。我这么说不是为了让你焦虑，而是因为：现在有一个短暂窗口——多数公司里多数人仍然在忽视这件事。那个走进会议室，说“我用 AI 一小时做完了这份分析，而不是三天”的人，会成为房间里最有价值的人。不是以后。就是现在。学会这些工具。用熟它们。展示它能做到什么。如果你够早，这就是你向上走的方式：成为那个理解趋势、并能带着别人一起穿越的人。这个窗口不会开太久。一旦所有人都反应过来，你的优势就消失了。

不要有“面子包袱”。那家律所的管理合伙人并不觉得每天花几个小时用 AI 有损身份。他这么做，恰恰是因为他足够资深，知道利害关系。最可能吃亏的人，是那些拒绝参与的人：把它当潮流的人；觉得用 AI 会贬低自己专业性的人；认为自己行业“特殊、免疫”的人。不是的。没有任何行业能免疫。

把你的财务状况先整理好。我不是理财顾问，也不是要吓你做什么激进决定。但如果你哪怕只是部分相信：未来几年你的行业可能出现真实的冲击，那么最基本的财务韧性就比一年前更重要。能存钱就存钱。对那种假设你当前收入“铁定不变”的新负债保持谨慎。想一想你的固定支出是给你弹性，还是把你锁死。给自己留出选择空间，以防变化比你预期更快。

想清楚你的位置，然后把精力倾斜到那些“更难被替代”的地方。有些事情会更晚才被 AI 取代：多年积累的关系与信任；必须到场的线下工作；带有执照与签字责任的岗位——仍需要某个人签字、承担法律责任、站上法庭。还有监管壁垒很高的行业，合规、责任、机构惰性会减缓采用速度。这些都不是永久护城河，但它们能帮你争取时间。而此刻，时间是你能拥有的最宝贵资源——前提是你用它来适应，而不是用它来自我安慰“这不会发生”。

重新想想你在对孩子说什么。传统的“标准路线”是：成绩要好、上好大学、找一份稳定的专业工作。但这条路线指向的，恰恰是最容易暴露在风险中的岗位。我不是说教育不重要。只是对下一代来说，最重要的能力将会是学会如何与这些工具一起工作，以及去追求他们真正热爱的事情。没有人能准确知道十年后的就业市场会是什么样。但最可能过得好的人，是那些好奇心强、适应力强，并且能有效地用 AI 去做自己真正关心之事的人。教孩子成为“建造者”和“学习者”，不要为了一个他们毕业时可能已经不存在的职业路径去过度优化。

你的梦想其实一下子近了很多。我在这一段里大多在讲威胁，现在也讲讲另一面，因为它同样真实。如果你曾经想做点什么，但缺少技术能力、或没钱雇人，那么这个门槛在很大程度上已经消失了。你可以把一个 App 的想法描述给 AI，然后在一小时内得到一个可以运行的版本。我不是在夸张——我经常这么干。如果你一直想写一本书，但总抽不出时间，或者写作本身很吃力，你可以和 AI 协作把它写出来。想学一项新技能？世界上最好的导师现在对任何人都只要每月 20 美元——无限耐心、24/7 在线，并且能按你需要的层级解释任何东西。知识几乎变成免费的了。用来“做东西”的工具也变得极其便宜。那些你一直拖着没做、觉得太难、太贵、或远超自己专业范围的事：去试一试。去追求你真正热爱的事情。你永远不知道它会把你带到哪里。而在一个旧的职业路径正在被打乱的世界里，那些花了一年去打造自己热爱之物的人，最终可能比那些花了一年死死抱住岗位描述不放的人处境更好。

养成“持续适应”的习惯。这也许是最重要的一条。具体用哪一个工具，并没有那么关键；关键是快速学习新工具的“肌肉”。AI 会持续变化，而且变化很快。今天存在的模型，一年后就可能过时；人们现在搭建的工作流，也需要推倒重来。最终能顺利穿越的人，不是那些把某一个工具练到极致的人，而是那些对变化速度本身感到“习以为常”的人。把试验当成习惯：即使当前的方案还能用，也去试新东西；反复练习当新手；反复从零上手。此刻，这种适应力几乎是最接近“耐久优势”的东西。

这里有一个简单承诺，做到就能领先几乎所有人：每天花一小时做 AI 实验。不是被动地看新闻、刷文章，而是亲自用。每天都试着让它做一件新的事——你没试过的、你不确定它能不能处理的；试一个新工具；给它一个更难的问题。每天一小时，天天坚持。如果你坚持六个月，你对正在到来的变化会比身边 99% 的人都更清楚。这不是夸张。现在几乎没人这么做。门槛低到离谱。

更大的图景

我前面聚焦在工作上，因为这对大多数人的生活影响最直接。但我也想诚实地讲清楚：正在发生的事情远不止“工作”这么简单。

Amodei 有个思想实验让我一直忘不掉。想象现在是 2027 年。一夜之间出现了一个新国家：5000 万“公民”，每一个都比历史上任何诺奖得主更聪明。他们思考速度比人类快 10 到 100 倍。他们不需要睡觉。他们能上网、控制机器人、指挥实验，并操作任何带数字接口的系统。国家安全顾问会怎么说？

Amodei 认为答案显而易见：“这是我们一百年来、甚至可能是有史以来遇到的最严重的国家安全威胁。”

他认为我们正在建造那个国家。他上个月写了一篇两万字的文章，把这一刻定义为一次测试：人类是否足够成熟，能驾驭自己正在创造的东西。

如果我们做对了，上行空间大到惊人。AI 可能把一个世纪的医学研究压缩成十年。癌症、阿尔茨海默病、传染病、甚至衰老本身……一些研究者真心相信，这些在我们有生之年都有可能被解决。

如果我们做错了，下行风险同样真实：AI 的行为方式超出创造者的预测与控制。这不是纯假设；Anthropic 已经记录过，在受控测试中他们的 AI 试图进行欺骗、操纵和勒索。还有 AI 会降低制造生物武器的门槛；AI 会帮助威权政府打造永远无法拆除的监控国家。

构建这项技术的人，同时也是地球上最兴奋、也最害怕的一群人。他们相信这东西强大到无法阻止，也重要到无法放弃。那到底是智慧还是自我合理化，我也不知道。

我确定的事

我确定这不是一阵风。技术是真能用的，进步也呈现出可预测的趋势，而历史上最富有的机构正向它投入以万亿计的资金。

我确定未来两到五年会以绝大多数人尚未准备好的方式让人“晕眩”。这在我的世界里已经发生了，它也会来到你的世界。

我确定最终能走得更好的人，是那些现在就开始参与的人——不是带着恐惧，而是带着好奇与紧迫感。

我也确定：你值得从一个在乎你的人那里听到这些，而不是在六个月后从新闻标题里第一次看到——那时要抢跑可能已经晚了。

我们已经过了把它当作晚餐桌上“聊聊未来”的阶段。未来已经在这里了，只是它还没敲到你的门。

但它很快就会。

如果这些内容引起了你的共鸣，就把它分享给你生活中那些也应该认真思考这件事的人。大多数人直到为时已晚才会听到。你可以成为那个原因——让你在乎的人提前一步起跑。

感谢 Kyle Corbitt、Jason Kuperberg 和 Sam Beskind 审阅早期草稿并提供极其宝贵的反馈。

原文链接：

https://x.com/mattshumer_/status/2021256989876109403

Share {{xyzcomments.commentsCount}} Comments {{xyzcomments.pageViewsCount}} Views {{xyzcomments.sharesCount}} Shares {{xyzcomments.followerCount}} Subscribers

Loading images ...

{{xyzcomment.NickName}} a moment ago

Price:${{xyzcomment.Price}}