AI不会在一夜之间取代你——但它每个季度都在变得更强
MIT研究人员让17,000多名工人评估了3,000多项任务。结果?没有突然的AI替代,但每年稳步提升15个百分点的AI能力可能在2029年达到80-95%的成功率。
65%。 这是AI现在完成一项需要你三到四小时的文本工作任务的成功率——仅仅一年前还只有大约50%。事实 — [MIT/arXiv,2026年4月]
如果这个趋势保持下去,大多数以文本为主的工作不会面临一个戏剧性的“AI时刻”。它们会经历缓慢、持续的季度性提升。而这种区别比任何关于机器人抢走你工作的头条都重要得多。
MIT的一项新研究——由Neil Thompson和八位合作研究者领导——考察了美国劳工部O*NET数据库中的3,000多项文本任务,收集了17,000多份来自实际执行这些任务的工人的评估。事实 — [arXiv:2604.01363] 论文的比喻很生动:我们看到的是突然摧毁某些工作的“冲击波”,还是逐渐提升AI能力的“涨潮”?
根据数据,答案压倒性地指向后者。
涨潮,不是海啮
研究人员发现“几乎没有冲击波的证据”——那种突然消灭特定任务的狭窄能力爆发。相反,他们记录了“大量涨潮证据”:几乎所有文本工作中持续、广泛的改进。事实 — [arXiv:2604.01363]
具体数据:2024年第二季度,大语言模型能够处理大约50%的需要熟练人工三到四小时的文本任务。到2025年第三季度,这个成功率已经攀升到约65%。事实 — [arXiv:2604.01363] 一年多一点就跳升15个百分点——不是某一项狭窄技能,而是分布在数千种不同任务中。
研究人员的预测:到2029年,AI可能在大多数文本相关任务上达到80%到95%的最低质量标准成功率。估计 — [arXiv:2604.01363] 达到近乎完美或超越人类的质量还需要几年时间。
这对文本密集型职业意味着什么
如果你的工作涉及写作、分析、摘要、翻译、编程或处理文本信息,这项研究直接关系到你。涨潮不太区分职业——它广泛上升。
想想数据录入员。他们的大部分工作涉及结构化文本处理——正是AI成功率上升最快的任务类型。
客服代表也在类似的轨道上。处理咨询、起草回复、分流问题——这些都是LLM每个季度都在改进的文本任务。
对编辑和技术作者来说,情况更加复杂。AI现在可以胜任地起草和修改文本,但专业编辑和技术文档的质量标准仍然很高。MIT研究指出,近乎完美的质量——这些岗位所要求的标准——将需要超过2029年预测“几年的额外时间”。主张 — [arXiv:2604.01363]
翻译、软件开发者、律师助理、会计和市场研究分析师都在文本丰富的环境中工作。但研究人员强调的关键是——“能够完成任务”和“取代完成任务的人”是完全不同的两件事。
采用差距:能力与现实
对于担心自己工作的人来说,最重要的发现是:采用时间表可能大大超过能力开发时间表。主张 — [arXiv:2604.01363] AI能做某项任务不意味着组织会实施它。
想想看:电子表格几十年前就能自动化许多会计任务,但会计师并没有消失——他们的工作方式转变了。同样的模式很可能在这里重演。MIT团队明确指出,组织实施需要流程重新设计、信任建立、合规框架和劳动力适应。
你应该怎么做
第一,先预期增强,再考虑替代。 65%的成功率意味着AI已经是有用的协作者,但它仍然经常失败,人类监督仍然必不可少。现在就学会与AI工具合作。
第二,投资于判断力和质量。 “最低质量”(2029年前达到80-95%)和“卓越质量”(还需数年)之间的差距,正是人类专业知识保持溢价的地方。
第三,关注趋势而非快照。 每年15个百分点的提升是显著的。养成每六个月重新评估工作流程中哪些部分可以受益于AI辅助的习惯。
MIT研究人员给了我们宝贵的东西:用数据取代恐慌。潮水在涨,但不是海啮。你有时间——明智地使用它。
来源
- Mertens, M., Kuzee, A., Harris, B.S., et al. (2026). "Crashing Waves vs. Rising Tides." arXiv:2604.01363. https://arxiv.org/abs/2604.01363
更新历史
- 2026-04-04:基于arXiv:2604.01363(2026年4月)的首次发布。
本分析由AI(Claude claude-opus-4-6)辅助制作。所有主张均附有证据强度指标和来源链接。