computer-and-mathematical

هل سيحل الذكاء الاصطناعي محل مهندسي معالجة اللغات الطبيعية؟

مهندسو معالجة اللغة الطبيعية يواجهون نسبة تعرض 73% للذكاء الاصطناعي — الأعلى بين متخصصي الذكاء الاصطناعي — مع مخاطر أتمتة 48/100. ما تعنيه النماذج اللغوية الكبيرة للمجال.

بقلم:محرر ومؤلف
نشر: آخر تحديث:
تحليل بمساعدة الذكاء الاصطناعيتمت مراجعته وتحريره من قبل المؤلف

هل ستحل الذكاء الاصطناعي محل مهندسي معالجة اللغة الطبيعية؟ تُعيد لغة الذكاء الاصطناعي تشكيل بُناتها

إذا كنت تعمل في بناء أنظمة معالجة اللغة الطبيعية لكسب رزقك، فها هو رقم يُبقيك مستيقظاً ليلاً: 73%. هذه هي نسبة تعرُّض الذكاء الاصطناعي لمهندسي معالجة اللغة الطبيعية — وهي الأعلى بين جميع فئات متخصصي الذكاء الاصطناعي التي نرصدها. بمعنى آخر: ما يقارب ثلاثة أرباع ما يفعله مهندس معالجة اللغة الطبيعية اليوم يمكن للنماذج اللغوية الكبيرة أن تلمسه أو تُسرِّعه أو تؤديه جزئياً. التقنية ذاتها التي تبنيها تُراجع توصيف وظيفتك في الوقت الفعلي.

لكن قبل أن تُحدِّث سيرتك الذاتية، انظر إلى الرقم الثاني: 48% مخاطر الأتمتة. هذا مرتفع نسبياً لدور تقني، غير أنه يقع أدنى بكثير من نسبة التعرض. الفجوة بين الرقمين هي حيث تكمن القصة بأكملها. يستطيع الذكاء الاصطناعي إنجاز كثير من أعمال معالجة اللغة الطبيعية، لكنه لا يستطيع إنجاز كلها. الربع المتبقي هو الميدان الذي ستُصنَع فيه المسيرات المهنية أو تنكسر خلال السنوات الخمس القادمة.

تستعرض هذه المقالة ما يتغير فعلاً لمهندسي معالجة اللغة الطبيعية في عام 2025، والمهام التي تُلتهم أولاً، وتلك التي تزداد صعوبةً لا يُسراً، وكيف يتحوَّل الدور إلى شيء لم يكن موجوداً قبل ثلاث سنوات. تستند البيانات هنا إلى تحليل O*NET على مستوى المهام، والمؤشر الاقتصادي لأنثروبيك، وتقارير سوق العمل الحديثة الصادرة عن مؤسسة بروكينغز ومنظمة التعاون الاقتصادي والتنمية (OECD).

الرقمان اللذان يُحدِّدان وظيفتك

لنفكِّك الأرقام الرئيسية. تعرُّض الذكاء الاصطناعي يقيس مدى تداخل مخزون مهام الدور مع ما تستطيع أنظمة الذكاء الاصطناعي الحالية أداءه. مخاطر الأتمتة تُقدِّر مدى تحوُّل ذلك التداخل فعلياً إلى إزاحة وظيفية خلال خمس سنوات، بعد مراعاة الحكم البشري والاحتكاك التنظيمي والحوافز الاقتصادية.

نسبة التعرض لمهندسي معالجة اللغة الطبيعية 73% لأن كل ما يفعلونه تقريباً يدور حول اللغة — وهي الملعب الرئيسي للنماذج اللغوية الكبيرة. التمييز، وتوليد التضمينات، والضبط الدقيق للنماذج، وهندسة النصوص التحفيزية، والتقييم، وتحليل الأخطاء — كل واحدة من هذه العمليات لها مساعد بأسلوب GPT أو أداة متخصصة تقدر على تولّي قدر ملموس من العمل. تقيس نسبة التعرض في الأساس مدى اختراق المجال من قِبَل منتجه الخاص.

نسبة 48% لمخاطر الأتمتة أدنى لثلاثة أسباب. أولاً: أعمال معالجة اللغة الطبيعية أصبحت حرجة للسلامة بشكل متزايد: التوثيق الطبي، والعقود القانونية، وإدارة المحتوى. الأخطاء تنطوي على مسؤوليات قانونية. لن تُزيل الشركات الإنسان من الحلقة بسرعة. ثانياً: مشكلات معالجة اللغة الطبيعية نادراً ما تكون محددة بدقة. يأتي العملاء بأفكار ضبابية ("اجعل روبوت الدردشة أذكى") وعلى شخص ما أن يُترجم ذلك إلى مجموعة بيانات مُوسومة وإطار تقييم وخطة نشر. هذا العمل التحويلي بشري في عمقه. ثالثاً: يتحرك المجال بسرعة شديدة لدرجة أن المهندسين مطلوبون لتقييم أي النماذج والنصوص التحفيزية والمعماريات تنجح فعلاً في مشكلة بعينها — وهذا التقييم يتطلب حُكماً لا مجرد قدرة حوسبية.

إذاً 73% تعرضاً مع 48% مخاطر هو سمة دور يتحوَّل لا يُزال. [ادعاء]

ما يفعله الذكاء الاصطناعي بالفعل في أعمال هندسة اللغة الطبيعية

لنسمِّ الأشياء بأسمائها. إليك ما يُؤتمت فعلاً في عام 2025:

كود تدريب النماذج الاعتيادي. كان إعداد سكريبت الضبط الدقيق لمحوِّل ما يستغرق نصف يوم. الآن، يُتيح Hugging Face Transformers مع مساعد توليد الكود الحصول على حلقة تدريب تعمل في اثني عشر دقيقة. وجد المؤشر الاقتصادي لأنثروبيك أن 64% من حركة مرور واجهة برمجة التطبيقات (API) في هندسة البرمجيات تتعلق بتوليد الكود، وأعمال اللغة الطبيعية مُساهِم رئيسي في ذلك. [حقيقة]

هندسة النصوص التحفيزية للمهام البسيطة. صياغة نصوص التصنيف والاستخراج والتلخيص على مجموعات البيانات المعيارية أصبحت من اختصاص مدراء المنتج دون مساعدة هندسية. لقد ارتفع سقف ما يُعدُّ "هندسةً" بالفعل.

توليد البيانات الاصطناعية. تحتاج إلى مجموعة تدريب من 50,000 استفسار لخدمة العملاء؟ ستنتجها النماذج اللغوية الكبيرة بأسلوب موضوعي مضبوط، وأسرع من كتابة إرشادات التوسيم.

خطوط التقييم المعيارية. BLEU وROUGE وBERTScore ودقة التطابق التام — كل المقاييس الكلاسيكية متاحة باستدعاء أداة واحدة. حتى أنماط التقييم المتطورة مثل LLM-as-a-judge أصبحت نماذج جاهزة.

التوثيق والتقارير. كتابة بطاقات النماذج، وصياغة ملخصات التجارب، وإنتاج سرديات لوحات القيادة. يتولى الذكاء الاصطناعي 70% من هذا العمل في فرق اللغة الطبيعية المُنظَّمة، مع مراجعة المهندس للدقة.

ما يعنيه هذا عملياً: مهندس معالجة لغة طبيعية متدرب في 2025 يُنتج ما يُعادل إنتاجية مهندس متوسط المستوى من عام 2022. استوعبت الأدوات الجهد الإدراكي الاعتيادي.

ما لا يفعله الذكاء الاصطناعي بشكل لافت

الآن الجانب الآخر. إليك ما يقضي فيه مهندسو اللغة الطبيعية وقتاً أكثر من أي وقت مضى:

صياغة المشكلة. معظم إخفاقات اللغة الطبيعية ليست إخفاقات نمذجة — بل إخفاقات صياغة. أراد العميل ربط الكيانات لا استخراجها. دُرِّب المصنِّف على بيانات نظيفة ونُشر في مجال يحتوي على 30% من المدخلات خارج التوزيع. اكتشاف هذه التعارضات يتطلب الجلوس مع أصحاب المصلحة وتفكيك ما يريدونه فعلاً. الذكاء الاصطناعي ضعيف في هذا لأنه يستلزم قراءة الغرفة.

الطب الشرعي لجودة البيانات. حين تُخطئ نموذجاً مضبوطاً دقيقاً، يعود اكتشاف السبب في الغالب إلى فحص أمثلة التدريب. التوسيمات خاطئة. المكررات تُشوِّه التوزيع. مجموعة التحقق تتسرب إلى التدريب. هذا العمل هو رواية بوليسية مع ملفات CSV، والبشر لا يزالون أفضل منه بكثير.

تصميم التقييم للمشكلات الجديدة. حين لا تملك مهمتك معياراً مرجعياً، عليك اختراع واحد. كيف يبدو "الجيد" لمحرِّر السجلات الطبية بالذكاء الاصطناعي؟ أو لمحلل عقود قانونية؟ بناء المعايير، وتجنيد المُوسِّمين، وحساب معامل الاتفاق بين المُقيِّمين، ثم إقناع القيادة بأن أرقامك تعني ما تقوله — هذه مهارة حقيقية لم يمسَّها الذكاء الاصطناعي.

تشخيص نماذج الإنتاج. نموذج أدَّى بشكل مثالي في التقييم دون اتصال يمكن أن يُخفق إخفاقاً مروِّعاً في الإنتاج لأسباب تشمل: انجراف النصوص التحفيزية، وتحوُّل التوزيع، وتسميم الذاكرة المؤقتة، وأعطال الاسترجاع، أو مجرد حظ سيئ مع حالات الحدود. تتبُّع أي هذه الأسباب هو السبب الفعلي هو عمل هندسي ميداني.

مراجعات الأخلاقيات والسلامة. يُستدعى مهندسو اللغة الطبيعية بشكل متزايد لمراجعات يكون فيها السؤال ليس "هل ينجح هذا؟" بل "هل ينبغي أن يوجد؟" تدقيق التحيز، واختبار الاختراق الأحمر، والتوثيق التنظيمي وفق قانون الاتحاد الأوروبي للذكاء الاصطناعي. هذا العمل يتوسع لا يتقلص.

المهام الأكثر عرضة للخطر

بالنظر إلى مهام O*NET للدور، تتركز مخاطر الأتمتة الأعلى في خمسة مجالات. كتابة سكريبتات تدريب النماذج المعيارية مؤتمتة بنسبة 85% تقريباً بالفعل؛ أصبح المهندس الآن مراجعاً يُدقق في كود يولِّده الذكاء الاصطناعي. تطبيق خطوط معالجة اللغة الطبيعية الكلاسيكية مثل التمييز والتصنيف المورفولوجي والتعرف على الكيانات المسماة ممتصٌّ بالمثل — كل الأطر الكبرى توفر هذه الخيارات جاهزة. الاستكشاف الأولي لمجموعات البيانات — نوع تحميل المجموعة وإنتاج إحصاءات ملخصة — يأخذ الآن 90% وقتاً أقل بمساعدة الذكاء الاصطناعي. التحليل الأولي للأخطاء في مخرجات النماذج أصبح محادثة دردشة لا جلسة Notebook. وصياغة أقسام الأوراق البحثية بما فيها الأعمال ذات الصلة وأوصاف المنهج وحتى السرديات الأولية للنتائج يُساعَد عليها الذكاء الاصطناعي لدى 70% من باحثي معالجة اللغة الطبيعية وفق استطلاعات حديثة. [تقدير]

تمثل هذه الفئات الخمس مجتمعةً نحو 45% مما كان مخطط مهندس اللغة الطبيعية يبدو عليه في السابق. لم يختفِ ذلك العمل — بل انضغط. ما كنت تقضي فيه ثلاثة أيام، باتت ثلاث ساعات تكفي. يُعاد توزيع الوقت المتبقي على أعمال ذات تأثير أعلى أو — بشكل متزايد — على إدارة مساحة مسؤولية أوسع.

المهام التي ازدادت صعوبةً

هنا الجانب المعاكس للحدس. بعض مهام اللغة الطبيعية ازدادت صعوبةً حين أصبح الذكاء الاصطناعي أفضل. تحديداً:

التقييم في ظل عدم يقين النماذج. حين كان لديك نموذج واحد ثابت، كان تقييمه مباشراً. الآن لديك نظام يستدعي نماذج متعددة، ويتنقل بينها بناءً على التكلفة والاستجابة السريعة، وينتج مخرجات غير حتمية. تقييم هذا الوحش يستلزم تطوراً إحصائياً لم يكن المجال بحاجة إليه قبل ثلاث سنوات.

تحسين الأداء مقابل التكلفة. الاختيار بين GPT-4o وClaude Sonnet ونموذج مفتوح المصدر 70B مضبوطاً داخلياً أو نموذجاً صغيراً مع تعزيز الاسترجاع يستلزم فهماً شاملاً لميزانيات الاستجابة وحدود الدقة والقيود التنظيمية وموقف التفاوض مع البائعين. هذا اقتصاد وهندسة وسياسة تنظيمية في آن واحد.

تشخيص النصوص التحفيزية والسلاسل. نظام معالجة اللغة الطبيعية الحديث غالباً ما يكون رسماً بيانياً موجهاً من استدعاءات النماذج اللغوية، كل منها بنصه التحفيزي وخطوة الاسترجاع ومنطق التحقق الخاص. حين يُخطئ النظام، قد تكون العطل في أي عقدة أو في التنسيق بينها. تتبُّع هذه الأنظمة أصعب من تشخيص نموذج مضبوط دقيقاً لأن فضاء الحالة أكبر بكثير.

المساءلة عن الهلوسة. حين يُعطي نظام الإجابة المُعززة بالاسترجاع (RAG) إجابةً خاطئة لعميل، على شخص ما أن يُفسِّر السبب ويمنع التكرار. هذا بات جزءاً من وظيفة مهندس اللغة الطبيعية، ويستلزم فهم ليس نموذجك فحسب بل خط أنابيب الاسترجاع والترتيب وتوليد الاستجابة كاملاً.

الأثر الصافي: ارتفع الحد الأدنى لعمل مهندس اللغة الطبيعية. المهام الاعتيادية يؤديها الذكاء الاصطناعي. ما تبقى أصعب حقاً مما كان الدور يستلزمه سابقاً.

الراتب والطلب وحقيقة السوق

يُرسل سوق العمل إشارات مختلطة. تظهر بيانات الرواتب من Levels.fyi وGlassdoor أن تعويض مهندسي معالجة اللغة الطبيعية ارتفع بنسبة 14% سنةً بسنة في الشركات الكبرى، مع مهندسين كبار في المختبرات المتقدمة يحصلون على تعويضات إجمالية تراوح بين 400,000 و700,000 دولار. لكن إعلانات الوظائف للأدوار المبتدئة انخفضت بنسبة 23% مقارنةً بعام 2023 وفق بيانات الرسم البياني الاقتصادي لـ LinkedIn. [حقيقة]

النمط واضح: المهندسون ذوو الخبرة في معالجة اللغة الطبيعية مطلوبون أكثر من أي وقت مضى، بينما ضاق خط الإمداد بالمهارات المبتدئة بشكل حاد. تريد الشركات ممارسين كباراً يستطيعون تصميم أنظمة الذكاء الاصطناعي وإرشادها عبر التقييم والنشر والاستجابة للحوادث. هي أقل استعداداً لدفع أجور للمهندسين المبتدئين الذين يتولى الذكاء الاصطناعي الآن ما كانوا يفعلونه.

بالنسبة لمهندس معالجة لغة طبيعية يقرأ هذا، الاستنتاج غير مريح لكنه قابل للتطبيق. إذا كنت متقدماً، فقيمتك ترتفع. إذا كنت مبتدئاً، فعليك الانتقال بسرعة إلى مهارات المستوى المتقدم: تصميم الأنظمة، وصرامة التقييم، والتشخيص في ظل عدم اليقين، والتواصل مع أصحاب المصلحة. مهارات كانت "يُحبَّذ امتلاكها" قبل عامين أصبحت إلزامية الآن.

ما ينبغي التركيز عليه في السنوات الثلاث القادمة

خارطة طريق عملية بناءً على ما يُحقق النجاح فعلاً في فرق معالجة اللغة الطبيعية الحالية:

كن خبيراً في التقييم. معظم فرق اللغة الطبيعية لا تمتلك شخصاً يستطيع تقييم نظام الإنتاج بصرامة. إن استطعت، ستصبح لا غنى عنك. اقرأ أبحاث أنثروبيك حول تقييم النماذج وإطار HELM والعمل الصادر عن مجموعات أكاديمية حول منهجية التقييم. ابنِ نماذج أولية لأُطر التقييم للمهام الجديدة في شركتك.

أتقن مكدس الاسترجاع. تقريباً كل نظام لغة طبيعية مثير للاهتمام في الإنتاج اليوم يتضمن استرجاعاً. قواعد بيانات المتجهات، والبحث الهجين، وإعادة الترتيب، وإعادة كتابة الاستعلامات، والتقطيع الدلالي. الفرق التي تتقن الاسترجاع تشحن منتجات موثوقة؛ الفرق التي تتعامل معه بشكل ارتجالي تشحن كوارث مليئة بالهلوسة. تعلم هذه الطبقة بعمق.

اشعر بالراحة مع بنية تحتية النشر. معرفة كيفية نشر نموذج خلف موزع الحمل وتهيئة القياس التلقائي ورصد الاستجابة والتكلفة والتراجع حين يعطل شيء ما — هذا ما يفصل مهندساً يستطيع الشحن عن باحث لا يستطيع. وهو ما لا تستطيع مساعدات الذكاء الاصطناعي فعله بدلاً عنك حتى الآن.

ابنِ عمقاً في مجال بعينه. أعمال اللغة الطبيعية العامة هي الأكثر قابلية للأتمتة. المعالجة اللغوية التطبيقية على مجال محدد — الرعاية الصحية، القانون، المال، علم الأحياء — تستلزم فهم ذلك المجال. اختر واحداً وتعمَّق فيه. المهندسون الذين سينجون في السنوات الخمس القادمة هم أولئك القادرون على الترجمة بين النماذج اللغوية وصناعة بعينها.

مارس الكتابة. التوثيق الداخلي، ووثائق التصميم، ومراجعات ما بعد الحوادث، والقرارات التي لا سابقة لها. الكتابة الواضحة هي ما يُميِّز المهندسين الكبار، والذكاء الاصطناعي لا يستطيع فعلها بدلاً عنك — ليس لأنه لا يستطيع توليد النص بل لأن فعل الكتابة يُجبر على التفكير، والتفكير هو ما تدفع الشركة مقابله.

النظرة الصادقة على المدى البعيد

بعد خمس سنوات، كيف ستبدو وظيفة مهندس اللغة الطبيعية؟ على الأرجح أشبه بمدير منتج لنظام ذكاء اصطناعي منه بمهندس برمجيات بالمعنى الكلاسيكي. ستقضي وقتاً أقل في كتابة كود النماذج ووقتاً أكثر في تعريف ما يجب أن يفعله النظام، وتقييم ما إذا كان يفعله، وإرشاده عبر النشر والعمليات.

بعض مهندسي معالجة اللغة الطبيعية الحاليين سيعشقون هذا التطور. آخرون سيكرهونه. إن كان الجزء الذي أحببته في العمل هو التطبيق الأنيق للنماذج والكود النظيف، فستجد ذلك الجزء قد تآكل. إن كان ما أحببته هو حل مشكلات حقيقية لمستخدمين حقيقيين، فهذا ربما أفضل وقت في التاريخ لتكون في هذا المجال.

الدور لا يموت. هو يتحوَّل. المهندسون الذين يُدركون هذا ويتكيفون سيجدون مسيرتهم أكثر إثارة وأعلى أجراً من أي وقت مضى. أولئك الذين لا يفعلون سيجدون أنفسهم يُضغطون ببطء مع تولي الذكاء الاصطناعي المزيد مما اعتادوا القيام به.

لبيانات أعمق تشمل تفصيلات الأتمتة على مستوى المهام، واتجاهات الرواتب حسب المنطقة، والجدول الزمني للتغييرات المتوقعة، راجع ملف تعريف مهنة مهندسي معالجة اللغة الطبيعية.


التحليل مستند إلى نمذجة الأتمتة على مستوى مهام ONET، والمؤشر الاقتصادي لأنثروبيك (2025)، وتقارير سوق العمل لمؤسسة بروكينغز، وبيانات مرصد سياسات الذكاء الاصطناعي لمنظمة OECD. بحث ومسودة بمساعدة الذكاء الاصطناعي؛ مراجعة وتحرير بشريان من قِبَل فريق تحرير AIChangingWork.*

Analysis based on the Anthropic Economic Index, U.S. Bureau of Labor Statistics, and O*NET occupational data. Learn about our methodology

سجل التحديثات

  • نُشر لأول مرة في 25 مارس 2026.
  • آخر مراجعة في 14 مايو 2026.

المزيد في هذا الموضوع

Technology Computing

Tags

#NLP engineering#AI automation#large language models#natural language processing#career advice