MIT ने 17,000 श्रमिकों से पूछा: आपके काम पर AI वास्तव में क्या कर सकता है
MIT FutureTech का नया अध्ययन ऑटोमेशन पूर्वानुमान को पलट देता है: विशेषज्ञों के AI प्रभाव की भविष्यवाणी करने के बजाय, 17,000+ श्रमिकों ने अपने ही कार्यों पर वास्तविक LLM आउटपुट का मूल्यांकन किया।
MIT के शोधकर्ताओं ने अभी-अभी श्रमिकों से सीधे पूछा है कि उनके काम पर AI क्या कर सकता है और क्या नहीं — और जवाब ऑटोमेशन के बारे में बहुत सारी पारंपरिक सोच को पलट देता है। 17,000 से ज़्यादा वास्तविक मूल्यांकनों में — उन्हीं लोगों द्वारा जो वह काम करते हैं — फ्रंटियर मॉडल टेक्स्ट-आधारित कार्यों के 50% से 75% पर "न्यूनतम पर्याप्त गुणवत्ता" तक पहुँचे। यह सुनामी से ज़्यादा एक उठती हुई ज्वार जैसा है, और हैरानी की बात यह है कि सबसे ज़्यादा प्रभावित कौन है।
अगर आप एक पैरालीगल या रिसर्च साइंटिस्ट हैं और मानते हैं कि आपका काम AI के लिए बहुत बारीक है, तो नया डेटा (फिलहाल) आपके पक्ष में है। अगर आप इंस्टॉलेशन, मरम्मत, ट्रांसपोर्टेशन लॉजिस्टिक्स, या कंस्ट्रक्शन एडमिनिस्ट्रेशन में हैं, तो वही डेटा कहीं कम आरामदायक है। MIT FutureTech टीम ने — Matthias Mertens और Neil Thompson के नेतृत्व में — मार्च 2026 में प्रारंभिक निष्कर्ष "Crashing Waves vs. Rising Tides" (arXiv:2604.01363) के रूप में प्रकाशित किए हैं।
यह अध्ययन क्यों मायने रखता है: लगभग हर पिछला ऑटोमेशन पूर्वानुमान — Frey & Osborne 2013, OECD 2018, Goldman Sachs 2023, Anthropic Economic Index — टॉप-डाउन रहा है। विशेषज्ञ या मॉडल कार्य वर्गीकरण देखते हैं और अनुमान लगाते हैं। Mertens और Thompson ने दूरबीन को उल्टा घुमा दिया।
एक बॉटम-अप माप जो किसी ने ठीक से नहीं किया था
अर्थशास्त्रियों से या यहाँ तक कि AI से पूछने के बजाय, MIT टीम ने प्रासंगिक नौकरी-पर अनुभव वाले श्रमिकों को भर्ती किया और उन्हें उनके ही पेशे के कार्यों के लिए वास्तविक LLM आउटपुट दिखाया। श्रमिकों ने हर आउटपुट को 1-9 स्केल पर स्कोर किया। मुख्य मीट्रिक बाइनरी है: क्या मॉडल ने "न्यूनतम पर्याप्त" गुणवत्ता का काम किया — रेटिंग 7 या उससे ऊपर, जिसका मतलब है कि एक इंसान को कोई संपादन की ज़रूरत न पड़े?
इसका दायरा असामान्य रूप से बड़ा है:
- 17,000+ कार्य मूल्यांकन अब तक पूरे (सर्वेक्षण जारी)
- अमेरिकी श्रम विभाग के O\*NET डेटाबेस से 3,000+ व्यापक कार्य परिवार
- 10,000+ O\*NET कार्यों से उत्पन्न 20,000+ अद्वितीय कार्य इंस्टेंस
- 2025 के फ्रंटियर मॉडलों सहित 40+ अलग-अलग LLM परीक्षण
- GPT-4 द्वारा फ़िल्टर किए गए कार्य — केवल वे जिनमें कम से कम 10% समय बचत क्षमता है
[तथ्य] सर्वेक्षित सभी मॉडलों में, सफलता दर 50% से 75% के बैंड में आई। [तथ्य] Q3 2025 तक, फ्रंटियर मॉडल उन कार्यों पर 50% सफलता तक पहुँचे जिनमें इंसान को "लगभग एक दिन" काम लगता है।
वह आखिरी संख्या वह है जिसे हर व्हाइट-कॉलर श्रमिक को रुककर सोचना चाहिए। एक साल पहले, इसी तरह के अध्ययन AI को 15-मिनट के कार्यों पर माप रहे थे। क्षितिज आगे बढ़ गया है।
जिन व्यवसायों को श्रमिक खुद सबसे ज़्यादा प्रभावित मानते हैं
यहाँ बॉटम-अप पद्धति वे परिणाम देती है जो ज़्यादातर श्रम अर्थशास्त्रियों ने भविष्यवाणी नहीं की थी। सबसे ऊँची LLM सफलता दर वाले व्यावसायिक समूह लॉ फर्म या रिसर्च लैब नहीं थे। वे ये थे:
- इंस्टॉलेशन, रखरखाव और मरम्मत — 72.5% सफलता दर
- निर्माण और निष्कर्षण — 71.0%
- परिवहन और सामग्री हस्तांतरण — 70.6%
- खाद्य तैयारी और सेवा — 65.5%
पहली नज़र में यह बेतुका लगता है। AI न तो रेफ्रिजरेटर ठीक कर सकता है, न ट्रक चला सकता है। लेकिन उन क्षेत्रों के श्रमिकों ने कुछ ज़्यादा सूक्ष्म बात कही: उनकी नौकरी के टेक्स्ट-आधारित हिस्से — वर्क ऑर्डर, डिस्पैच रूटिंग, सुरक्षा लॉग, पार्ट्स ऑर्डरिंग, सप्लायर ईमेल, प्रशिक्षण सामग्री, ग्राहक संचार, नियामक चेकलिस्ट — अत्यधिक स्वचालित किए जा सकने वाले निकले। हाथों से किया जाने वाला भौतिक काम अभी भी सुरक्षित है। उसके चारों ओर का कागज़ी काम नहीं है।
यह वही पैटर्न है जिसे डिस्पैचर, फ्लीट मैनेजर और फील्ड सुपरवाइज़र दो वर्षों से चुपचाप देख रहे हैं। "ब्लू-कॉलर" व्यावसायिक परिवारों में अब काफ़ी प्रशासनिक परतें हैं — और बड़े भाषा मॉडल जो सबसे अच्छा करते हैं वह यही प्रशासनिक परत है।
अगर आपकी भूमिका मुख्य रूप से किसी भौतिक संचालन का प्रशासनिक समन्वय है, तो MIT डेटा कहता है कि अगले दो वर्षों को इनकार के समय के बजाय तैयारी के समय के रूप में देखें।
जिन व्यवसायों के बारे में श्रमिकों ने कहा कि AI अभी भी नहीं कर सकता
विपरीत पक्ष ने लेखकों को भी उतना ही चकित किया। सबसे कम सफलता दर वाले समूह वही थे जिन्हें ज़्यादातर सार्वजनिक टिप्पणी ने "पहले जाने वाले" के रूप में लेबल किया है:
- कानूनी — 46.8% (पूरे अध्ययन में सबसे कम)
- जीवन, भौतिक और सामाजिक विज्ञान — 51.8%
- वास्तुकला और इंजीनियरिंग — 52.8%
[दावा] ये ज्ञान-कार्य के क्षेत्र हैं जहाँ वास्तविक LLM आउटपुट का मूल्यांकन कर रहे डोमेन विशेषज्ञों ने बार-बार कहा, "इसे उपयोग करने से पहले काफ़ी संपादन की ज़रूरत होगी।" एक प्रभावशाली डेमो और न्यूनतम पर्याप्त पेशेवर-ग्रेड आउटपुट के बीच का अंतर बिल्कुल वहाँ सबसे चौड़ा है जहाँ जोखिम — दायित्व, पुनरुत्पादनीयता, संरचनात्मक सुरक्षा — सबसे ऊँचे हैं।
[अनुमान] एक व्याख्या यह है कि कानूनी, वैज्ञानिक और इंजीनियरिंग कार्य धाराप्रवाह अनुच्छेदों के बजाय सत्यापित तर्क की श्रृंखलाओं की माँग करते हैं। दूसरी यह है कि इन क्षेत्रों के विशेषज्ञ, मान लीजिए, खाद्य सेवा के विशेषज्ञों की तुलना में सख़्त गुणवत्ता मानक लागू करते हैं। दोनों सच हो सकते हैं। व्यावहारिक निहितार्थ वही है: पैरालीगल अलार्मवाद डेटा से आगे रहा है। बायोटेक-शोधकर्ता अलार्मवाद भी। वास्तविक आउटपुट की समीक्षा करने वाले वकील और वैज्ञानिक प्रभावित नहीं हैं।
"उठती ज्वार", न कि "टकराती लहर", पेपर का सबसे महत्वपूर्ण वाक्य क्यों है
शीर्षक का रूपक याद रखने योग्य हिस्सा है। एक टकराती लहर का मतलब होगा कि AI एक बार में एक पूरे पेशे में सक्षम हो जाता है — कहें, 18 महीनों में सभी पैरालीगल बदल दिए जाते हैं। एक उठती ज्वार का मतलब है पूरे कार्य परिदृश्य पर व्यापक, क्रमिक उठान — पाँच वर्षों में लगभग हर टेक्स्ट-आधारित श्रमिक के लिए 15% उत्पादकता वृद्धि, विस्थापन विशिष्ट लोगों पर नहीं, विशिष्ट कार्यों पर केंद्रित।
MIT डेटा टकराती लहर पैटर्न नहीं, उठती ज्वार पैटर्न दिखाता है। सफलता बनाम कार्य कठिनाई का वक्र "आश्चर्यजनक रूप से सपाट" है, लेखक लिखते हैं — प्रगति बिखरी हुई नहीं, व्यापक है। वे स्पष्ट रूप से लिखते हैं: "प्रगति आमतौर पर एक उठती ज्वार जैसी होती है, जिसमें कई कार्यों में एक साथ व्यापक लाभ मिलते हैं।"
[तथ्य] यह वही पैटर्न है जो — एक पूरी तरह से अलग दृष्टिकोण से, Claude उपयोगकर्ताओं के वास्तविक संवाद लॉग से — Anthropic Economic Index रिपोर्ट करता रहा है। दो पद्धतियाँ, दो डेटा स्रोत, एक अभिसरण निष्कर्ष: AI नौकरी श्रेणियों को वाष्पीकृत नहीं कर रहा है। यह एक साथ हर नौकरी श्रेणी को नया आकार दे रहा है।
राजनीतिक रूप से इसकी योजना बनाना बहुत कठिन है, लेकिन व्यक्तिगत रूप से आसान। अगर आपके 60% कार्य 30% तेज़ हो जाते हैं, तो आपकी नौकरी ग़ायब नहीं होती — वह बदल जाती है। आप ज़्यादा काम सोखते हैं, या जो AI नहीं कर सकता उसके लिए समय मिलता है।
लेखक सावधानी से क्या कहते हैं कि यह डेटा क्या नहीं कहता
पेपर के खंड 6 की ईमानदारी उद्धरण के योग्य है। लेखक चार सीमाओं को चिह्नित करते हैं जिन्हें हर पाठक को ध्यान में रखना चाहिए:
- निष्कर्ष केवल टेक्स्ट-आधारित या आंशिक रूप से टेक्स्ट-आधारित कार्यों को कवर करते हैं। ज़्यादातर भौतिक काम संरचना के द्वारा बाहर है।
- परिणाम "नौकरी स्वचालन के हिस्सों में सीधे अनुवादित नहीं होंगे" — "अंतिम मील" तैनाती लागत, एकीकरण घर्षण, नियामक बाधाओं, और सर्वेक्षण किए गए कार्यों में चयन प्रभावों के कारण।
- प्रक्षेपण मानते हैं कि "AI प्रगति पिछले दो वर्षों में देखी गई गति से जारी रहती है" — एक ऊपरी-सीमा परिदृश्य, पूर्वानुमान नहीं।
- सर्वेक्षण जारी है। अधिक व्यवसायों के नमूने लेने पर संख्या बदल सकती है।
[दावा] दूसरे शब्दों में: यह — जो लोग वास्तव में काम करते हैं उनके द्वारा मूल्यांकित — AI अभी क्या कर सकता है पर अब तक का सबसे अच्छा सबूत है। यह अभी नियोक्ता क्या तैनात करेंगे या श्रमिक क्या खोएँगे का सबूत नहीं है। ये दो प्रश्न हमेशा अलग रहे हैं, और उनके बीच का अंतर वही जगह है जहाँ नीति रहती है।
इस सप्ताह वास्तव में क्या करें (अगर आप दायरे में आते हैं)
इंस्टॉलेशन/मरम्मत, परिवहन लॉजिस्टिक्स, निर्माण प्रशासन, और खाद्य सेवा संचालन के लिए: आपकी भूमिका की टेक्स्ट-और-समन्वय परत दायरे में है। अपने साप्ताहिक कार्यों के किस 20% शुद्ध टेक्स्ट हैं — ईमेल, शेड्यूलिंग, रिपोर्ट, ग्राहक संचार, पार्ट्स ऑर्डरिंग — का कैटलॉग बनाएँ, और एक AI टूल सीखें जो उन्हें संभालता है। बचाए गए समय का उपयोग — जो MIT डेटा अभी भी कहता है कि AI नहीं पकड़ सकता — भौतिक या पारस्परिक शिल्प को गहरा करने में करें।
कानूनी, वैज्ञानिक और इंजीनियरिंग पेशेवरों के लिए: डेटा कहता है कि आपके पास आपकी LinkedIn फ़ीड के संकेत से ज़्यादा रनवे है। उस रनवे का उपयोग — तकनीक को खारिज करने के लिए नहीं, बल्कि — आक्रामक रूप से AI साक्षरता बनाने के लिए करें। अपनी फ़र्म या लैब में वह व्यक्ति बनें जो ठीक-ठीक जानता है कि यह क्या दे सकता है और क्या नहीं। आपके फ़ंक्शन के लिए MIT स्कोर पेपर में है। पढ़ें।
बाकी सभी के लिए — कार्यालय और प्रशासनिक काम का विशाल मध्य, स्वास्थ्य सहायता, शिक्षा, बिक्री, ग्राहक सेवा — आपके कार्य सांख्यिकीय रूप से 65% वैश्विक माध्य के पास हैं। उठती ज्वार क्षेत्र। उत्पादकता लाभ की उम्मीद करें, भूमिका पुनर्डिज़ाइन की उम्मीद करें, अगले 24 महीनों में बड़े पैमाने पर प्रतिस्थापन की उम्मीद न करें।
स्रोत
- Mertens, M., Thompson, N., et al. (2026). _Crashing Waves vs. Rising Tides: Preliminary Findings on AI Automation from Thousands of Worker Evaluations of Labor Market Tasks_. arXiv:2604.01363 (HTML)
- MIT FutureTech अनुसंधान कार्यक्रम: https://futuretech.mit.edu
- अमेरिकी श्रम विभाग O\*NET डेटाबेस (अध्ययन का अंतर्निहित कार्य वर्गीकरण)
अद्यतन इतिहास
- 2026-05-14: MIT FutureTech प्रारंभिक निष्कर्षों (मार्च 2026 प्रारूप) पर आधारित प्रारंभिक प्रकाशन।
_यह पोस्ट AI-सहायता प्राप्त विश्लेषण (Claude Opus 4.7) के साथ तैयार की गई थी। अंतर्निहित डेटा MIT FutureTech में सहकर्मी-समीक्षा योग्य प्रीप्रिंट अनुसंधान से है; व्याख्या और ज़ोर संपादकीय हैं। जैसे ही MIT सर्वेक्षण अपनी व्यावसायिक कवरेज का विस्तार करेगा, हम इस पोस्ट को अपडेट करेंगे।_
Analysis based on the Anthropic Economic Index, U.S. Bureau of Labor Statistics, and O*NET occupational data. Learn about our methodology
अपडेट इतिहास
- 13 मई 2026 को पहली बार प्रकाशित।
- 13 मई 2026 को अंतिम बार समीक्षित।