computer-and-mathematical

هل سيحل الذكاء الاصطناعي محل مهندسي موثوقية المواقع؟ هندسة الموثوقية في عصر الذكاء الاصطناعي

يواجه مهندسو موثوقية المواقع 57% من التعرض للذكاء الاصطناعي في 2025 مع مخاطر أتمتة 40/100. كيف يُغيّر الذكاء الاصطناعي دور SRE دون استبداله.

بقلم:محرر ومؤلف
نشر: آخر تحديث:
تحليل بمساعدة الذكاء الاصطناعيتمت مراجعته وتحريره من قبل المؤلف

نشأت هندسة موثوقية الموقع في Google من الإدراك بأن تشغيل الأنظمة الإنتاجية على نطاق واسع يستلزم انضباطاً هندسياً، لا مجرد مهارة تشغيلية. مهندسو موثوقية الموقع (SREs) يكتبون كوداً لأتمتة العمليات ويبنون الموثوقية في الأنظمة ويكفلون بقاء الخدمات تعمل في الأوقات الأهم. تُظهر بياناتنا أن تعرض مهندسي موثوقية المواقع للذكاء الاصطناعي بلغ 57% في عام 2025، مع خطر أتمتة عند 40%.

يضع ذلك SRE في موقع مثير للاهتمام: مُعزَّز بشكل ثقيل بالذكاء الاصطناعي لكنه مُقاد جوهرياً من البشر. الدور يتطور لا يختفي. [حقيقة] كل مزوّد سحابة رائد ومنصة تواصل اجتماعي وشركة مدفوعات وخدمة بث تعتمد على فرق بأسلوب SRE لإبقاء الخدمات تعمل، ومجموعات تلك الفرق تستمر في النمو حتى وإن بات كل مهندس أكثر إنتاجية بأدوات الذكاء الاصطناعي.

بيانات التوظيف الكلية تُعزّز هذا المسار. يقع SRE داخل عائلة مهنة مطوّري البرمجيات، ووفقًا لـ BLS Occupational Outlook Handbook، يُتوقع نمو توظيف مطوّري البرمجيات ومحللي ضمان الجودة والمختبرين بنسبة 15% من 2024 إلى 2034 — أسرع بكثير من متوسط جميع المهن — مع نحو 129,200 وظيفة شاغرة متوقعة سنوياً طوال العقد [حقيقة]. يُعزو BLS بشكل صريح جزءاً من ذلك النمو السريع إلى الطلب على تطوير مستمر لحلول الذكاء الاصطناعي وحجم البيانات المتزايد للإدارة — الأعباء ذاتها التي تُبقيها فرق SRE موثوقة. مجموع مهن الحاسب والرياضيات يُتوقع نموها 10.1%، أكثر من ثلاثة أضعاف المعدل المتوقع للاقتصاد الكلي [حقيقة].

كيف يُحوّل الذكاء الاصطناعي عمل SRE

حُوِّل اكتشاف الحوادث وتصنيفها بواسطة AIOps (الذكاء الاصطناعي لعمليات تقنية المعلومات). تستطيع نماذج التعلم الآلي إجراء تدقيق في الإشارات عبر آلاف المقاييس وتحديد الشذوذات وتحديد الحدة وحتى التنبؤ بالحوادث قبل وقوعها. ما كان يستلزم إنساناً يراقب لوحات المتابعة يحدث الآن تلقائياً، مع توجيه الذكاء الاصطناعي التنبيهات إلى المستجيب المناسب مرفقاً بتحليل أوّلي للسبب الجذري. [ادعاء] منصات AIOps الحديثة تستوعب السجلات والمقاييس والتتبعات وأحداث النشر وتغييرات البنية التحتية، ثم تُطبّق الاستنتاج السببي لإنتاج قائمة مرتّبة بالأسباب الجذرية المرجّحة في غضون دقائق من بدء الحادثة. يصل المهندس إلى التنبيه وهو يعرف بالفعل ما يعتقد النموذج أنه وقع — وما يجب التحقق منه أولاً.

تتعامل المعالجة التلقائية مع نسبة متزايدة من الحوادث الشائعة. تستطيع أنظمة الذكاء الاصطناعي تحديد المشكلات المتكررة ومطابقتها مع دفاتر تشغيل معروفة وتنفيذ خطوات المعالجة دون تدخل بشري. تُفيد بعض المنظمات بمعالجة تلقائية لـ 30-40% من التنبيهات، مما يُخفّف عبء الاستجابة في المناوبة. أنماط الشفاء الذاتي — إعادة تشغيل Pod تلقائياً في Kubernetes والتبديل التلقائي لقاعدة البيانات وتحويل حركة المرور بعيداً عن منطقة متراجعة واستجابات المُحجِّم التلقائي لتدفق الأحمال — تجتمع لمعالجة أحجام ضخمة من المشكلات التشغيلية التي كانت ستُيقظ مهندساً قبل خمس سنوات. يرى المهندس الحادثة في مراجعة صباحية، لا في منتصف الليل.

تخطيط الطاقة وتحسين الأداء يستفيدان من قدرة الذكاء الاصطناعي على تحليل أنماط الاستخدام ونمذجة سيناريوهات النمو والتوصية بإجراءات التحجيم. يستطيع الذكاء الاصطناعي التنبؤ بموعد وصول الأنظمة إلى حدود الطاقة واقتراح تحجيم استباقي، مما يُقلّل الانقطاعات والتحجيم الزائد معاً. المهارة الكلاسيكية في SRE لبناء نماذج الطاقة من القياسات عن بعد — ممارسة ربع سنوية مكثّفة العمل في السابق — انضغطت إلى تنبؤ مستمر مُعزَّز بالذكاء الاصطناعي يتحدث مع تطور الأعباء. [تقدير] تُفيد استطلاعات الهندسة باستمرار بأن تخطيط الطاقة المُعزَّز بالذكاء الاصطناعي يُقلّل تكاليف التحجيم الزائد بنسبة 15-30% بينما يُقلّل في الوقت ذاته حوادث الطاقة.

تخفيف العمل الجاهد — مبدأ SRE الجوهري — يُسرَّع بذكاء اصطناعي قادر على تحديد المهام التشغيلية المتكررة وتوليد كود الأتمتة واقتراح تحسينات العمليات. هدف SRE القاضي بعدم إنفاق أكثر من 50% من الوقت في العمل التشغيلي يصبح أكثر قابلية للتحقيق حين يتعامل الذكاء الاصطناعي مع المهام الأكثر روتينيةً. يستطيع مساعدو الذكاء الاصطناعي التوليدي كتابة نصوص Python وسطر Bash ووحدات Terraform وكتيّبات Ansible ومشغّلات Kubernetes من مواصفات اللغة الطبيعية، ثم التكرار استناداً إلى ملاحظات الاختبار. انخفضت تكلفة أتمتة مهمة تشغيلية صغيرة انخفاضاً حاداً، مما يعني أتمتة مهام أكثر.

قابلية الملاحظة وتوليد لوحات المتابعة تُعاد هيكلتها أيضاً. يستطيع الذكاء الاصطناعي اقتراح المقاييس الصحيحة لتتبّع خدمة جديدة وبناء تعريفات مؤشر مستوى الخدمة (SLI) وهدف مستوى الخدمة (SLO) الأولية وتوليد لوحات Grafana أو Datadog مُضبَّطة على أنماط سلوك الخدمة. انخفضت تكلفة بدء تفعيل قياسات خدمة جديدة انخفاضاً ملحوظاً، مما يُسهّل على الفرق تبنّي ممارسات SRE للخدمات التي كانت ذات قابلية ملاحظة ضئيلة سابقاً.

هندسة الفوضى — الإصابة الإرادية بالأعطال لاختبار المرونة — عُزِّزت بالذكاء الاصطناعي القادر على اقتراح سيناريوهات الفشل الأكثر إفادةً للاختبار وتوقع التجارب الأرجح لكشف نقاط الضعف وتحليل النتائج لتحديد أنجع خطوات المعالجة. أدوات مثل Chaos Mesh وGremlin وAWS Fault Injection Simulator مُعزَّزة بالذكاء الاصطناعي بصورة متزايدة، مما يُخفّض حاجز الخبرة لإجراء اختبارات مرونة منظّمة.

مساعدة ما بعد الحوادث هي أحدث مجال يُسهم فيه الذكاء الاصطناعي. بعد حادثة، يستطيع الذكاء الاصطناعي تلخيص الجدول الزمني من محادثات الدردشة والتنبيهات وسجلات النشر وتحديد العوامل المساهمة وتوليد مسودة وثيقة ما بعد الحادثة للمهندسين لتنقيتها. [ادعاء] يضغط ذلك على الوقت الفاصل بين حل الحادثة والدروس المستفادة القابلة للتنفيذ، مما يُحسّن مباشرةً الدورة التالية من عمل الموثوقية.

لماذا لن يُستبدل مهندسو SRE

تصميم الأنظمة من أجل الموثوقية هو حيث يُقدّم مهندسو SRE أعظم قيمتهم، ويستلزم حكماً هندسياً عميقاً. تصميم أنظمة تتدهور بلطف وتُنشَر بأمان وتُستعاد تلقائياً من الأعطال وتلبّي أهداف موثوقية محددة — هذا عمل هندسي يستلزم فهم الأنظمة الموزّعة وأنماط الإخفاق والمفاضلات التي لا يستطيع الذكاء الاصطناعي التنقّل فيها وحده. مهندس SRE الذي يُصمّم خدمة بقواطع دوائر مناسبة وإعادة محاولة مع تراجع أُسّي وتشويش وعزل بين التبعيات وأنماط نشر تدريجي — يبني الموثوقية في النظام من البداية. لا يمكن لأي قدر من AIOps اللاحقة التعويض عن تصميم موثوقية ضعيف في الأصل.

الاستجابة للحوادث ذات الإخفاقات الجديدة تستدعي حل المشكلات البشري. حين يُخفق نظام بطريقة لم يرها أحد من قبل — وهو ما يحدث بانتظام في الأنظمة الموزّعة المعقدة — يجب على مهندسي SRE تشخيص المشكلة وتنسيق الاستجابة عبر الفرق والتواصل مع أصحاب المصلحة واتخاذ قرارات حكمية تحت الضغط. القدرة على التفكير في الإخفاقات المتسلسلة في نظام يضم مئات المكوّنات المتفاعلة قدرة بشرية. [حقيقة] معظم الانقطاعات الكبرى في الشركات الإنترنتية الرائدة في السنوات الخمس الماضية تضمّنت أنماط إخفاق جديدة — تفاعلات بين كود مُنشَر مؤخراً وتغييرات في الضبط وخصائص ناشئة للنظام في حجم الإنتاج. أدوات الذكاء الاصطناعي تُساعد، لكن مهندس SRE في المناوبة الذي يقود قيادة الحوادث لا يزال يجب أن يتخذ القرارات.

تحليل ما بعد الحوادث بلا إلقاء اللوم والتعلم يستلزم حكماً بشرياً حول العوامل المساهمة والمشكلات المنهجية والتحسينات التنظيمية. مهندس SRE القادر على تيسير تحليل ما بعد حادثة مثمر وتحديد الظروف الكامنة التي أفضت إلى حادثة وقيادة تحسينات تمنع التكرار يُقدّم قيمة تمتد بعيداً عن أي نظام آلي. ثقافة عدم إلقاء اللوم في حد ذاتها إنجاز قيادي؛ استدامتها تستلزم اختيارات صريحة من البشر حول كيفية الحديث عن الإخفاق وما يُرفَع إلى الإدارة وكيفية الاستثمار في الموثوقية طويلة الأمد بدلاً من إخماد الحرائق قصيرة الأمد.

بناء ثقافة الموثوقية — غرس تفكير الموثوقية في فرق التطوير وتحديد أهداف مستوى الخدمة مع فرق المنتجات والتحجّج لصالح استثمارات الموثوقية — عمل قيادي يستلزم التواصل والإقناع والوعي التنظيمي. مهندس SRE القادر على التفاوض على هدف مستوى خدمة مع مدير المنتج وشرح لقيادة الهندسة لماذا استثمار الموثوقية أهم من ميزة جديدة وتدريب فريق على انضباط ميزانيات الأخطاء — يعمل عند تقاطع الهندسة والتصميم التنظيمي. لا يستطيع الذكاء الاصطناعي فعل أي من ذلك.

قيادة الحوادث — دور إدارة حادثة كبرى كمنسّق هادئ ومركّز — تبقى إنسانية بشكل عميق. قائد الحادثة يتتبع الموقف المتطور ويُعيّن أدواراً للمستجيبين ويتخذ القرارات الصعبة بشأن التواصل مع المستخدمين وقرارات التراجع ويُصعّد بالشكل المناسب ويحمي الفريق من الإرهاق المعرفي. صنع القرار الآني في ظل الغموض مع رهانات عالية ومعلومات ناقصة هو بالضبط النوع من المهام التي لا يستطيع الذكاء الاصطناعي أداءها بموثوقية — وحيث يمكن أن تكون عواقب الأخطاء كارثية. [ادعاء] تشترط كبرى منظمات SRE صراحةً الحصول على شهادة أو تدريب تلمذي قبل السماح لأي شخص بتولّي قيادة الحوادث في الخدمات الحيوية.

موثوقية أنظمة الذكاء الاصطناعي ذاتها حدود متنامية أخرى. لخدمات الذكاء الاصطناعي الإنتاجية تحدياتها الخاصة في الموثوقية: انجراف النموذج وتدهور زمن استجابة الاستدلال وتنافس موارد GPU وتراجع جودة الاسترداد وإخفاقات الحقن الإرشادي ومشكلات التحكم في التكاليف المميّزة لأعباء خدمة النماذج. تشغيل نماذج لغة كبيرة إنتاجية بموثوقية خمسة تسعات انضباط لا تزال معظم فرق SRE تتعلمه، ويضع هذا علاوة على المهندسين القادرين على ردم ممارسة SRE الكلاسيكية مع حقائق البنية التحتية للذكاء الاصطناعي الجديدة.

توقعات الموثوقية التنظيمية ترتفع أيضاً. يفرض قانون المرونة التشغيلية الرقمية للاتحاد الأوروبي (DORA) متطلبات محددة للمرونة والإفادة بالحوادث على شركات الخدمات المالية. أطر مماثلة ناشئة للرعاية الصحية والبنية التحتية الحيوية والأنظمة الحكومية. هذه اللوائح تُقنّن ممارسة SRE فعلياً — إجراءات الاستجابة للحوادث وإدارة التغييرات ورسم خرائط التبعيات واختبار التعافي من الكوارث — إلى متطلبات قانونية، مما يجعل دور SRE ضرورة أوضح لا أقل.

التوقعات لعام 2028

يُتوقع بلوغ تعرض الذكاء الاصطناعي نحو 67% بحلول 2028، مع خطر أتمتة عند 50%. سيُنفق مهندسو SRE وقتاً أقل في العمليات الروتينية وأكثر في تصميم الأنظمة واستراتيجية الموثوقية والعمل الهندسي. الدور يصبح أكثر استراتيجيةً وأثقل هندسةً مع تعامل الذكاء الاصطناعي مع حجم أكبر من العبء التشغيلي.

بيانات الاستخدام تُعزّز أن هذا تعزيز لا إزاحة. وفقًا لـ Anthropic Economic Index (March 2026)، لا يزال التعزيز — الأنماط التعاونية كالتكرار والتحقق والتعلم — يمثّل 57% من إجمالي استخدامات الذكاء الاصطناعي المقاسة، حتى وإن كانت مهام البرمجة تحديداً تُظهر أسرع انتقال نحو سير عمل أكثر أتمتةً [حقيقة]. بالنسبة لـ SRE، ذلك الانقسام مُعبِّر: البرمجة الروتينية والتشخيص الأولي ينتقلان نحو الأتمتة، بينما يبقى الحكم في تصميم الأنظمة وقيادة الحوادث بصرامة في عمود التعزيز. World Economic Forum's Future of Jobs Report 2025 يُسمّي المهارات التقنية في الذكاء الاصطناعي والبيانات الضخمة والأمن السيبراني ضمن الأسرع نمواً في الطلب — بالضبط مجموعة الكفاءات التي يُبنى عليها مهندس SRE الحديث [حقيقة]. [تقدير] تُشير استطلاعات القطاع إلى أن حصة وقت SRE المُنفَق على العمل الجاهد ستنخفض دون 30% في المنظمات الناضجة بحلول 2028، مع توجيه الوقت المحرَّر إلى هندسة الموثوقية وتطوير المنصة والمناصرة للموثوقية عبر فرق المنتجات.

ثلاثة تغييرات هيكلية مرجّحة. أولاً، ستنكمش أدوار "مهندس العمليات" في المستوى المبتدئ مع تعامل الذكاء الاصطناعي مع الاستجابة الروتينية. ثانياً، ستتسع أدوار SRE في المستوى المتوسط والكبير لتشمل هندسة المنصة وموثوقية بنية تحتية للذكاء الاصطناعي وقيادة برامج الموثوقية. ثالثاً، ستستمر الأدوار الهجينة — مهندس منصة بتركيز SRE ومهندس موثوقية الذكاء الاصطناعي/التعلم الآلي ومدير منتج للموثوقية — في التكاثر مع تخصّص المنظمات في انضباطات الموثوقية.

نصائح مهنية لمهندسي SRE

عمّق مهاراتك في تصميم الأنظمة — فهم الأنظمة الموزّعة وأنماط الإخفاق وأنماط الموثوقية على مستوى عميق هو ما يُفرّق بين كبار مهندسي SRE والمشغّلين. ادرس الأدبيات: Designing Data-Intensive Applications وكتب Google SRE والمرجع الأكاديمي للأنظمة الموزّعة. ابنِ خبرة عملية مع بروتوكولات الإجماع واستراتيجيات النسخ المتماثل والاتساق النهائي وأنماط الإخفاق الخاصة بكل منها. الموثوقية ليست قائمة مراجعة؛ إنها طريقة تفكير في الأنظمة، وهذا التفكير يستغرق سنوات لتطويره.

تعلّم بناء وتقييم أدوات القابلية للملاحظة والأتمتة المدعومة بالذكاء الاصطناعي. الجيل التالي من أدوات الموثوقية سيكون مدفوعاً بالذكاء الاصطناعي، ومهندس SRE القادر على تقييم ما إذا كانت منصة AIOps بعينها مفيدة فعلاً — مقابل توليد ضوضاء تُكلّف اهتماماً هندسياً أكثر مما توفّر — ذو قيمة متزايدة. الإلمام بمفاهيم ML الكامنة والمفاضلات بين اكتشاف الشذوذ الخاضع للإشراف وغير الخاضع له والمخاوف التشغيلية لتشغيل ML في الإنتاج باتت جزءاً من مجموعة مهارات SRE.

طوّر مهارات قيادة الحوادث والتواصل. إطار نظام قيادة الحوادث (ICS) المستعار من إدارة الطوارئ أصبح معياراً في كثير من منظمات SRE. تدرّب على كتابة تحديثات حوادث واضحة وقيادة مراجعات ما بعد التنفيذ وتقديم مقاييس الموثوقية لجمهور القيادة. مهندس SRE القادر على إدارة حادثة كبرى بسلطة هادئة — وكتابة تحليل ما بعد الحادثة يجده كل من القيادة الهندسية والمنتج مفيداً — على المسار السريع لأدوار المستوى الكبير والرئيسي.

ابنِ خبرة في أسرع مجالات البنية التحتية نمواً: موثوقية منصات الذكاء الاصطناعي/التعلم الآلي أو الحوسبة الطرفية أو تنسيق السحابة المتعددة. موثوقية منصة الذكاء الاصطناعي تخصص مفتوح على مصراعيه. المهندسون القادرون على تشغيل بنية تحتية لخدمة النماذج بزمن استجابة متوقع وإدارة كتل GPU في حجم واسع وتصميم الموثوقية لمسارات التوليد المعزَّز بالاسترداد في طلب مرتفع جداً. الحوسبة الطرفية — نقل الأعباء أقرب إلى المستخدمين عبر شبكات توصيل المحتوى (CDNs) والوظائف الطرفية والنشر الإقليمي — مجال آخر سريع النمو بأنماط موثوقية خاصة به.

أخيراً، استثمر في مهارات القيادة الهندسية الأشمل وإدارة البرامج التي تُضاعف تأثيرك ما وراء فريق واحد. يُنفق كبار مهندسي SRE في المنظمات الكبيرة وقتاً ملحوظاً في الإرشاد وتشكيل استراتيجية المنصة وقيادة مبادرات موثوقية متعددة الفرق. [ادعاء] مهندس SRE الذي يجمع العمق الهندسي مع التفكير الاستراتيجي في الموثوقية على المستوى التنظيمي ذو قيمة استثنائية، مع خيارات مهنية تمتد عبر مسارات المساهمين الأفراد الكبار وإدارة الهندسة وأدوار القيادة الموثوقية المركّزة وصولاً إلى مستوى كبير مسؤولي الموثوقية وكبير مسؤولي التقنية.

للتفاصيل البيانية، راجع صفحة مهندسي موثوقية الموقع.


_هذا التحليل بمساعدة الذكاء الاصطناعي، مستنداً إلى بيانات من تقرير سوق العمل لشركة Anthropic 2026 والأبحاث ذات الصلة._

سجل التحديثات

  • 2026-03-25: النشر الأوّلي ببيانات قاعدة 2025.
  • 2026-05-13: توسيع مع مساعدة الذكاء الاصطناعي في تحليلات ما بعد الحوادث وأتمتة هندسة الفوضى والسياق التنظيمي لـ DORA وتخصص موثوقية منصة الذكاء الاصطناعي ومسار مسيرة قيادة الحوادث.

ذات صلة: ماذا عن المهن الأخرى؟

يُعيد الذكاء الاصطناعي تشكيل كثير من المهن:

_استكشف جميع تحليلات 1,016 مهنة على مدوّنتنا._

Analysis based on the Anthropic Economic Index, U.S. Bureau of Labor Statistics, and O*NET occupational data. Learn about our methodology

سجل التحديثات

  • نُشر لأول مرة في 25 مارس 2026.
  • آخر مراجعة في 22 مايو 2026.

Tags

#SRE#AI automation#reliability engineering#DevOps#career advice

المصادر

  1. aichanging.work