computer-and-mathematical

AI会取代机器学习工程师吗?AI构建AI的讽刺

ML工程师面临67%的AI暴露度但自动化风险仅40/100。AI推动构建AI的职业的悖论。

作者:编辑兼作者
发布日期: 最后更新:
AI-辅助分析由作者审核与编辑

人工智能会取代机器学习工程师吗?

67%。 这是AI对劳动力市场影响中最核心的讽刺:机器学习(ML)工程师——那些构建AI系统的人——在所有职业中面临着最高的AI暴露风险之一。我们的数据显示,2025年AI暴露率达到67%,高于2023年的50%。然而,他们的自动化风险仅为40%,反映出AI辅助工作与AI替代工作之间的巨大差距。[估计]

当你真正了解ML工程师实际上在做什么,以及AI在哪里提供帮助、在哪里力不从心时,这一悖论就说得通了。官方劳动力数据支持这种乐观态度。美国劳工统计局将大多数ML工程工作归类为数据科学家,并预计该职业从2024年到2034年将增长34%——是其追踪的所有职业中增速最快的之一——中位年薪为112,590美元,每年约有23,400个职位空缺BLS职业展望手册:数据科学家,2024年)。[事实] 换句话说,理论上最受AI威胁的领域,也是BLS预期在实践中增长最快的领域——这是AI在此处是补充而非替代的最清晰信号。

AI如何改变ML工程

自动化机器学习(AutoML)和神经架构搜索已经自动化了模型开发的重要部分。AI系统现在可以搜索庞大的模型架构空间、调整超参数、选择特征,甚至选择合适的算法——这些任务曾经需要ML工程师花费数周时间。对于数据干净的标准问题,AutoML可以生成与技术娴熟的工程师手动构建的模型相媲美甚至超越的模型。[主张] 谷歌Vertex AI、AWS SageMaker Autopilot和Azure Automated ML等云平台可以在不到一天的时间内将标记数据集转化为性能合理的可部署模型,让工程师专注于更难的问题。

代码生成极大地加速了开发速度。AI编码助手可以根据自然语言描述编写训练管道、数据预处理代码、评估框架和部署脚本。曾经花费数小时编写样板代码的ML工程师,现在专注于架构决策和问题表述。GitHub Copilot、Cursor以及专门的ML编码助手现在可以生成PyTorch和TensorFlow代码、编写数据验证逻辑、脚手架模型评估脚本,甚至生成文档——所有这些都来自简短的提示。2026年高级ML工程师的生产输出明显高于2022年,大部分提升来自AI辅助编码。

实验管理和分析通过AI得到了增强,AI可以跟踪数千次实验运行,识别最有前途的配置,并根据迄今为止的结果建议下一步实验。Weights & Biases、MLflow、Neptune和Comet等平台在实验跟踪之上增加了AI驱动的洞察,自动比较变体并起草分析摘要供工程师改进。[事实]

生产中的模型监控和再训练越来越自动化。AI系统可以检测数据漂移、性能下降和分布变化,然后触发再训练管道或在需要干预时提醒工程师。[估计] 成熟的MLOps平台现在可以自动处理60-80%的常规生产模型维护任务,工程师只在系统检测到超过预定阈值的异常或业务背景表明模型需要人工评估时才介入。

大型语言模型(LLM)工作在过去两年内彻底重塑了这个领域。检索增强生成(RAG)、代理框架、提示工程、模型微调、评估工具以及LLM推理优化,现在都是ML工程中的一级学科。LLaMA、Mistral、Qwen和DeepSeek等开源模型为工程师提供了强大的基础模型,而LangChain、LlamaIndex、Haystack以及各大云提供商的代理SDK则加速了应用开发。ML工程师的工具箱在过去24个月内的扩展速度,比该领域历史上任何可比时期都要快。

微调工作流程也得到了简化。LoRA、QLoRA和基于适配器的方法等参数高效微调(PEFT)方法,让工程师可以用较少的计算预算定制基础模型,通常只需一块GPU。这些工作流程在2022年还是研究项目,到2026年已成为常规生产模式。[事实]

为什么ML工程师比以往任何时候都更有价值

问题表述是ML工程中最关键、最难自动化的部分。将业务需求转化为定义明确的ML问题——选择正确的目标函数、定义成功指标、识别适当的数据源、判断ML是否是正确的方法——需要AI无法提供的技术专业知识和业务理解。[主张] 企业ML中最常见的失败模式是用技术上优秀的模型解决了错误的问题,而能够对框架不当的项目提出质疑的高级ML工程师,往往比那些构建任何被要求的东西的工程师更有价值。

数据战略和工程通常比算法选择更能决定模型的成功。理解数据质量问题、设计确保数据新鲜度和准确性的数据管道、处理边缘案例和分布挑战、构建随时间改进数据的反馈循环——这是需要深厚领域理解的工程工作。"更多数据胜过更好算法"的经典洞察在2026年仍然成立,而其推论——更好的数据胜过更多的数据——则更为重要。[主张]

规模系统设计涉及远超模型准确性的权衡。延迟要求、成本约束、可解释性需求、公平性要求以及与现有系统的集成,创造了一个有经验的工程师做出AutoML无法做到的判断决策的多维设计空间。以每秒查询数百万次的推荐模型为例,在严格的成本预算和个性化质量目标下保持50毫秒的响应时间,是一个超越模型选择的系统设计问题。能够驾驭这种复杂性的工程师,薪资相应更高。[估计]

AI安全、公平性和可解释性已成为一流的工程关切。欧盟AI法案、美国关于AI的行政命令、医疗保健和金融服务领域的行业特定法规,以及不断提升的利益相关者期望,都要求生产ML系统可审计、公平且可解释。能够实施差分隐私、公平性约束、模型卡和可解释性工具——并能向内部审查委员会和外部监管机构为这些选择辩护的ML工程师——正变得越来越不可或缺。"负责任AI工程师"和"AI政策工程师"等角色在过去三年内涌现,并正在快速增长。[事实]

ML工程师的需求在行业调查中持续以25-30%的年速率增长,远超AI辅助带来的任何生产力提升。[估计] 这与上面提到的BLS数据科学家2024年至2034年34%增长的官方预测相符,并由一波毫无放缓迹象的投资浪潮推动。斯坦福大学HAI《2025年AI指数报告》报告称,2024年美国私人AI投资达到1,091亿美元——约为中国总额的12倍——而仅生成式AI的私人投资就高达339亿美元,同比增长18.7%斯坦福HAI,AI指数报告2025,经济章节)。[事实] 这种规模的资本必须由某人将其转化为可运行的系统,而那个人就是ML工程师。

2028年展望

到2028年,AI暴露率预计将达到约82%,自动化风险为53%。ML工程的每个阶段都将越来越多地得到AI辅助,但对能够表述问题、设计系统并突破可能性边界的工程师的需求将继续增长。入门级的"运行这个训练管道"工作可能会缩减,但高级ML工程角色将扩大。[主张] 到2028年,预计技术、金融服务、医疗保健和其他数据密集型行业的每个有意义的产品团队中都将包含至少一名ML工程师,最大的组织将运营数百人规模的ML平台团队。

三种结构性转变可能发生。第一,随着AutoML和预训练基础模型处理更大份额的常规模型开发,入门级"模型构建者"角色将收窄。第二,随着组织投资于支持众多ML用例的基础设施,"ML平台工程师"和"MLOps工程师"角色的需求将继续增长。第三,混合角色——应用科学家、研究工程师、ML解决方案架构师、负责任AI工程师、AI政策专家——将成倍增加,拓宽具有强大ML基础的人才的职业版图。[估计]

对ML工程师的职业建议

专注于AI增强而非取代的技能:问题表述、系统设计和领域专业知识。练习用业务成果来阐述ML问题,设计平衡多个约束的系统,以及培养从端到端运行真实ML项目中积累的判断力。能够主导早期范围界定对话——定义成功的样子、需要什么数据、必须管理什么风险——的ML工程师,比只是实施规范的工程师站在更高的位置运作。

在某个垂直领域培养深厚专业知识——医疗保健AI、金融ML、自主系统、语言技术、推荐系统、计算机视觉应用或机器人技术。垂直专业化随时间复利增值。理解临床工作流程、监管要求(FDA软件即医疗设备指南、HIPAA、欧盟医疗器械法规)以及处理电子健康记录现实的医疗保健ML工程师,其价值以指数级超过能够构建相同模型但不了解背景的通才。[主张]

建立MLOps技能,使你能够将模型从原型推向生产。学习Kubernetes用于编排、Kubeflow或KServe用于服务、Ray用于分布式训练、Feast或Tecton等特征存储,以及MLflow Model Registry或Vertex Model Registry等模型注册表。理解ML系统的可观察性——漂移检测、性能监控、公平性监控和成本跟踪。"我在笔记本中训练了一个模型"和"我在生产中规模化运行这个模型"之间的差距仍然巨大,而能够弥合这一差距的工程师,薪资相应更高。[事实]

学会向业务利益相关者沟通ML概念和结果。练习用业务术语呈现模型评估结果,在不诉诸行话的情况下解释失败模式,以及设计产生可信证据供业务决策的实验。能够在财务、产品和高管受众面前为自己的工作辩护的ML工程师,将领导更大的项目。

最后,保持对研究文献和开源社区的参与。该领域的发展速度超过任何单个角色所能完全追踪的范围,但那些阅读论文、贡献开源项目并参与技术社区的工程师,继续是将新技术引入组织的人。[主张] 将技术深度与业务影响和系统思维相结合的ML工程师,是2026年技术领域最受追捧的专业人士之一——没有近期迹象表明这种需求会减弱。

薪资结构与职业轨迹详析

要全面了解ML工程师的经济学,需要超越简单的中位数数字。根据BLS 2024年5月数据,数据科学家的中位年薪为112,590美元,但ML工程师的实际薪资分布远比这更宽泛。[事实]

按经验层级的薪资分布:

入门级ML工程师(0至2年,专注于实施和维护)在主要科技中心通常年薪为95,000至130,000美元。中级ML工程师(3至5年,能够独立设计和交付ML系统)通常年薪为140,000至190,000美元,外加绩效奖金和股权。高级ML工程师(6至10年,领导设计决策并指导初级工程师)的总薪酬通常在200,000至320,000美元之间,其中股权占很大比例。[估计]

在谷歌、Meta、亚马逊、苹果和微软等顶级科技公司,具有专业ML专业知识的首席工程师和区分工程师,总薪酬可能超过500,000至700,000美元,其中大部分是股权。这些角色需要在实践上贡献的同时,具有强大的研究影响力或系统影响力。

地理溢价: 旧金山湾区和纽约仍然是ML薪资最高的市场,溢价约为25至40%,但这些市场的生活成本相应更高。西雅图(微软、亚马逊)和奥斯汀已成为强劲的替代中心,薪资与主要科技中心相差无几,但生活成本更低。远程工作已使ML工程薪资在地理上更加均等,但顶级角色仍然倾向于集中在主要科技生态系统中。

认证和专业化溢价: 持有谷歌专业机器学习工程师、AWS机器学习专业或微软认证Azure数据科学家等云认证的工程师,薪资通常比无证同行高出10至20%。更重要的是,在特定领域(LLM、计算机视觉、强化学习、MLOps)的深度专业知识,在中高级水平上的薪资溢价可达30至50%。[估计]

ML工程的全球需求格局

ML工程不是美国独有的现象,也不是主要集中在硅谷的现象。理解全球需求格局有助于了解这一职业的真实轨迹。[事实]

根据斯坦福大学HAI《2025年AI指数报告》,美国在2024年拥有最高的AI私人投资,但欧洲、印度和东亚的投资正在迅速追赶。这种投资分散意味着ML工程需求越来越全球化,而不是集中在少数几个中心。[事实]

在欧洲,EU AI Act为需要合规和可解释AI系统的高风险应用创造了对专业ML工程专业知识的需求,尤其是在医疗保健、金融和基础设施领域。在印度,蓬勃发展的科技外包产业和本地AI初创公司生态系统正在创造大量ML工程角色,薪资虽然低于美国,但以当地生活水平衡量具有竞争力。在中国,尽管国际合作受到限制,但国内AI投资和使用量的增长正在创造大量国内ML工程需求。

这种全球化意味着即使美国ML市场因某种原因放缓,ML工程师也拥有全球范围的职业流动性,这在劳动力市场历史上是相对罕见的保护因素。[主张]

查看机器学习工程师的详细自动化数据


_AI辅助分析,基于美国劳工统计局(2024年)、斯坦福大学HAI《AI指数报告2025》、Anthropic 2026年劳动力市场报告及相关研究。_

更新历史

  • 2026-03-25:初始发布,包含2025年基准数据。
  • 2026-05-13:扩展,增加LLM时代工具(RAG、微调、代理框架)、AI安全/公平性工程、对抗性鲁棒性、垂直专业化指导和MLOps职业详细内容。
  • 2026-05-23:增加来自美国劳工统计局(数据科学家34%预测,112,590美元中位数,2024年5月)和斯坦福大学HAI《AI指数报告2025》(2024年美国私人AI投资1,091亿美元)的一手资料引用。

相关职业:其他岗位如何?

AI正在重塑许多职业:

_在我们的博客上探索所有1,016个职业分析。_

ML工程的实际工作日:2026年版

了解ML工程师实际上如何度过一天,有助于理解为什么这个职业对AI替代有如此强的韧性。典型的高级ML工程师的一天并不像大众想象的那样是不停地写代码——它更接近于一系列需要判断力、创造力和人际沟通的高阶决策活动。[主张]

早上:范围界定和战略 许多高级ML工程师会用早上时间进行项目范围界定,与产品经理讨论业务需求,或审查团队成员提出的技术方案。这些对话需要快速评估技术可行性、成本含义、数据可用性和时间线现实——这是AutoML工具无法做到的综合判断。

白天:技术审查和实验迭代 工作日的中间时段通常包括审查实验结果、对失败的模型进行调试(这需要直觉和对数据的深入理解)、评估新方法的代码审查,以及指导初级工程师。[事实] 2026年的高级ML工程师使用AI编码助手来加速代码编写,但仍然需要进行关键的架构审查——确保设计决策会在生产中保持,而不仅仅在实验室基准测试中表现良好。

下午:系统和生产问题 生产ML系统会出现意外问题:模型在特定人口群体上性能下降,推荐系统开始推荐不合时宜的内容,或者数据管道出现导致模型输入悄悄质量下降的回归。诊断这些问题需要系统推理能力——逐步排除可能原因,直到找到真正的根本原因——这是AI工具可以辅助但无法替代的活动。[主张]

跨职能协作 对于高级ML工程师来说,一天中很大一部分时间用于与非ML同行的协作:向安全团队解释模型漏洞,与法律/合规团队协作以满足监管要求,向商业分析师证明模型性能权衡的合理性,并与高管利益相关者沟通ML系统能够和不能够做什么。这种跨职能影响力是将入门级ML工程师与领导力轨道上的高级工程师区分开来的主要因素。[主张]

ML工程的三大误解

关于ML工程师和AI替代,存在几个常见的误解,值得直接澄清。[主张]

误解一:"AutoML将使ML工程师失业" 这个预测已经流传了超过五年,但该职业仍在快速增长。AutoML确实消除了某些类型的工作——特别是为标准问题进行初始模型选择和基本超参数调整。但这只占ML工程实际工作的一小部分,而且该职业已经通过专注于AutoML无法处理的更高价值问题来适应。AutoML是一个放大器,而不是替代品——它让ML工程师处理更难的问题,而不是让ML工程师失业。[事实]

误解二:"ML工程只是对已经学会使用GPT的数据分析师的改良" 这种误解低估了将LLM应用从演示推向规模化生产所需的工程复杂性。管理幻觉、评估可靠性、处理数据隐私要求(PII不能进入第三方API调用)、优化推理成本和延迟、在分布转移中保持性能——这些都是真正的工程问题,需要比数据分析技能更深层次的专业知识。[主张] 能够将LLM应用原型推向可在规模上可靠运行的生产系统,需要与构建任何其他大规模ML系统相同的工程严谨性。

误解三:"ML工程是泡沫——AI炒作破裂后需求会崩溃" 这忽视了ML正在日益嵌入非科技行业基础运营的事实。制造商依靠ML进行预测性维护,医院使用ML协助诊断分流,银行使用ML进行欺诈检测,零售商使用ML优化库存。这些不是实验性的AI项目——它们是关键业务系统,即使在AI投资整体降温的情况下也需要维护和改进。[事实] 实际上,对ML的炒作越少,行业就越有可能投资于实际产生业务成果的经过验证的ML应用,这对工程质量而非AI流行语营销是有利的。

与其他技术职业的比较视角

将ML工程放在更广泛的技术职业背景下,有助于评估其相对吸引力和风险状况。[主张]

与软件工程(更广泛的类别,BLS预测2024-2034年增长17%,中位年薪124,200美元)相比,ML工程提供了更高的增长率和更高的高级别薪资上限,但作为专业职业的历史更短,因此对泡沫估值的风险略高,以及基础概念更难(需要强大的数学基础:线性代数、统计学、概率论、微积分和数值方法)。[事实]

与数据工程(BLS预测10%增长,中位年薪108,020美元)相比,ML工程在工作的建模和实验组件上有所重叠,薪资潜力更高,但进入门槛也更高——数据工程师通常需要更少的数学背景。最有价值的ML工程师通常在两者上都很强,理解他们的模型使用的数据管道,以及他们的模型需要哪种类型的数据才能表现良好。[主张]

从整体角度看,ML工程在2026年提供了技术职业中最高的薪资潜力、最快的需求增长率和最强的全球流动性之一。对于具备数学能力、系统思维以及将抽象技术能力与实际业务影响联系起来的意愿的人来说,这一职业路径的上行潜力仍然是劳动力市场中最强的之一。

对ML工程感兴趣的学生和职业转换者的入门指南

对于希望进入ML工程领域的人,路径比几年前更加多样化,但核心要求仍然清晰。以下是一个现实的评估。[主张]

学术背景 大多数ML工程职位需要计算机科学、统计学、数学、物理或电气工程方面的本科学位,以及对线性代数、微积分、概率论和统计学的扎实理解。实际上,部分顶级公司对有强大展示成果的自学者开放,但学位仍然是大多数职位的筛选标准,特别是在大型企业环境中。

研究生学位(硕士或博士)在进入研究职位或加入谷歌、DeepMind、Anthropic等前沿AI研究实验室时仍有显著优势,但对于应用ML工程角色而言,已变得不那么必要。大量工作的ML工程师拥有计算机科学或相关领域的本科学位,并通过实践经验和持续自学发展了ML专业知识。[估计]

实践经验的必要性 纸面资质在ML工程中的权重低于在许多其他领域。雇主真正看重的是:构建并部署过实际ML系统的证明、对数据管道和模型生命周期的实践理解、能够解释失败原因(不仅仅是报告成功结果)的能力,以及对所在领域标准工具和框架的熟悉程度。

个人项目、Kaggle竞赛成绩、开源贡献、实习经历或在ML密集型行业的相关工作经验,都可以作为替代正式工作经验的有效信号。对于职业转换者,强调可转移技能——软件工程、数据分析、统计学、领域专业知识——并将其与ML技能的学习展示相结合,是最有效的策略。

在职学习资源 由于ML发展速度极快,即使是经验丰富的工程师也需要持续学习。最有价值的学习资源包括研究论文(主要是arXiv预印本)、顶级会议(NeurIPS、ICML、ICLR、ACL、CVPR)的论文,以及开源框架的文档和示例代码。实践社区,如Hugging Face社区、PyTorch论坛、FastAI社区和各种专注于ML的Discord服务器,提供了获取最新实践知识的快速途径。

对于那些刚开始职业旅程的人,最重要的投资不是学习最新的热门模型或工具——这些变化太快,半衰期太短——而是构建能够支撑多年不同工具学习的坚实基础:深度理解反向传播和梯度下降的工作原理,理解注意力机制背后的数学,以及理解为什么不同类型的神经网络架构适合不同类型的问题。[主张]

有了这个基础,当下一波技术创新到来时——无论是量子机器学习、神经符号系统,还是当前LLM范式的继任者——你将处于能够快速评估和采用它的位置,而不是再次从零开始。这种持久的适应能力,最终是在一个移动速度如此之快的领域中长期职业成功的真正保证。

机器学习工程职业的长期展望:2026年至2035年

任何职业分析都应该诚实地面对长期不确定性。ML工程已经在过去五年内经历了几次模式转变——从统计模型和传统深度学习,到大规模预训练模型,再到LLM和基于代理的系统。很可能还会有更多这样的转变。[主张]

这种快速演变既是风险也是机遇。风险是:今天热门的专业知识在三到五年内可能变得不那么有价值。机遇是:每次范式转变都创造了新的高需求技能领域,而那些已经在该领域中的工程师通常处于最有利的位置来快速采用新方法。

合理的预测是,到2035年,ML工程将看起来与今天大不相同,但需求将仍然强劲——很可能比今天更强,因为ML系统将更加广泛地部署在更多的行业和应用中。[估计] 职业的具体技能组合将发生变化,但核心价值主张——将ML系统从概念推向可靠生产的能力,同时管理数据、计算、延迟、成本、公平性和可解释性之间的复杂权衡——将仍然是人类专业知识价值所在,即使支持这些专业知识的工具继续以非凡的速度演进。

对于今天进入或已经在ML工程领域工作的人来说,最有用的心态可能是:将职业视为持续学习的过程而不是达到固定技能端点的路径,将基础理解而不是工具熟悉度视为核心资产,将横向联系——理解ML如何融入商业目标、监管要求和人类价值观——视为越来越重要的竞争优势。

持有这种心态的ML工程师,将不仅在当前的AI繁荣中表现良好,而且在未来十年的任何技术演变中都能够适应和茁壮成长。[主张]

关键资源:ML工程师不可或缺的学习与参考材料

对于任何认真对待ML工程职业的人,以下资源提供了最高价值的参考和学习材料。[事实]

学术与研究:

  • arXiv(arxiv.org):ML/AI论文的主要预印本服务器,每周发布数百篇论文。关注cs.LG(机器学习)、cs.AI(人工智能)、cs.CL(计算语言学/NLP)和stat.ML(统计学习)类别。
  • Papers With Code(paperswithcode.com):将研究论文与实现代码链接,是了解最新最优基准的极佳资源。
  • Hugging Face(huggingface.co):开源模型、数据集和论文的中心,以及活跃的ML实践者社区。

官方数据来源:

  • BLS职业展望手册——定期更新的美国就业预测和薪资统计。
  • 斯坦福HAI AI指数报告——每年发布,是了解全球AI进展和经济影响最全面的单一来源。
  • OECD人工智能政策观察站——政策、监管和对各国AI就业影响的跨国比较视角。

技术培训:

  • Coursera上的Deep Learning专项(Andrew Ng授课)——仍然是基础深度学习直觉的最佳入门课程之一。
  • fast.ai——自上而下的实践方法,对许多实践者非常有效。
  • Hugging Face课程——LLM和扩散模型的实践动手课程。

这些资源的共同特点是强调原理性理解与实践实现的结合,这正是区分能够随时间适应的工程师与依赖特定工具或框架知识的工程师的关键因素。

Analysis based on the Anthropic Economic Index, U.S. Bureau of Labor Statistics, and O*NET occupational data. Learn about our methodology

更新记录

  • 首次发布于 2026年3月25日。
  • 最后审阅于 2026年5月23日。

Tags

#machine learning#AI automation#ML engineering#AutoML#career advice

来源

  1. aichanging.work