arts

AI কি Foley Artist-দের প্রতিস্থাপন করবে? 41% ঝুঁকিতে পায়ের শব্দ জটিল হয়ে উঠছে

ফোলি আর্টিস্টদের জন্য ৪১% অটোমেশন ঝুঁকি। AI কেন মর্যাদাপূর্ণ পারফরম্যান্স কাজ প্রতিস্থাপন করতে পারছে না এবং পরিবর্তনশীল মিডিয়া শিল্পে কীভাবে সমৃদ্ধ হবেন তা জানুন।

লেখক:সম্পাদক ও লেখক
প্রকাশিত: শেষ আপডেট:
AI-সহায়ক বিশ্লেষণলেখক দ্বারা পর্যালোচিত ও সম্পাদিত

৪১% অটোমেশন ঝুঁকি। আপনি যদি একজন ফোলি আর্টিস্ট হন — যারা পদক্ষেপের শব্দ, ক্যাঁচক্যাঁচে দরজা এবং সরসরানো পোশাকের শব্দ তৈরি করেন যা চলচ্চিত্রকে বাস্তব মনে করায় — তাহলে এই সংখ্যাটি আপনার মনোযোগ পাওয়া উচিত। এটি পুরো মিডিয়া প্রোডাকশন বিভাগে সর্বোচ্চ ঝুঁকির স্কোরগুলির মধ্যে একটি, এবং মাত্র পাঁচ বছর আগে ফোলি আর্টিস্টরা যে আরামদায়ক অবস্থানে ছিলেন তার থেকে এটি একটি তীক্ষ্ণ বিচ্যুতি।

কিন্তু আতঙ্কিত হওয়ার আগে, আরও ঘনিষ্ঠভাবে দেখুন। এই সংখ্যার পেছনের গল্পটি শিরোনামের চেয়ে বেশি সূক্ষ্ম, এবং এটি বোঝা আগামী দশকে আপনার ক্যারিয়ারকে সংজ্ঞায়িত করতে পারে। সবচেয়ে সংক্ষিপ্ত সংস্করণ: AI পোস্ট-প্রোডাকশন ক্লিনআপ এবং সাউন্ড-লাইব্রেরি বাজারের নিচের অংশ গ্রাস করছে। AI মর্যাদাপূর্ণ কাজ গ্রাস করছে না। আপনি সেই বর্ণালীতে কোথায় দাঁড়িয়ে আছেন তা নির্ধারণ করে আপনার ক্যারিয়ার সংকুচিত হচ্ছে নাকি প্রসারিত।

একটি কাজের মধ্যে দুই জগতের সংঘর্ষ

[তথ্য] ২০২৫ সালে ফোলি আর্টিস্টদের জন্য সামগ্রিক AI এক্সপোজার ৫৪%, তাত্ত্বিক এক্সপোজার ৭৩% এবং পর্যবেক্ষণকৃত এক্সপোজার ৩৫%। এটি ফোলি আর্টকে "উচ্চ" রূপান্তরমূলক বিভাগে "মিশ্র" অটোমেশন মোড সহ রাখে — অর্থাৎ কিছু কাজ ভারী AI চাপের মুখোমুখি হয় যখন অন্যগুলি দৃঢ়ভাবে মানবিক থেকে যায়।

বিভাজনটি নাটকীয়, এবং এটি কাজের ঠিক মাঝখানে ঘটে। ফোলি কাজ সবসময় দুটি স্বতন্ত্র পর্যায়ে বিদ্যমান: পারফরম্যান্স পর্যায় (আপনি পর্দা দেখছেন এবং রিয়েল টাইমে আপনার শরীর এবং প্রপস দিয়ে শব্দ তৈরি করছেন) এবং সম্পাদনা পর্যায় (রেকর্ডিং পরিষ্কার করা, এটি চূড়ান্ত সাউন্ডট্র্যাকে মিশিয়ে দেওয়া, এটি দৃশ্যমানতার সাথে নির্ভুলভাবে সিঙ্ক করা)। পারফরম্যান্স পর্যায়টি হলো যা দর্শকরা ফোলি আর্টিস্টদের কথা ভাবলে কল্পনা করেন — স্টুডিওতে যে ব্যক্তি পর্দার অভিনেতার সাথে সময় মিলিয়ে নুড়িপাথরে হাঁটছেন। সম্পাদনা পর্যায়টি হলো যা একটি সাধারণ প্রকল্পে বেশিরভাগ ঘণ্টা খরচ করে।

[তথ্য] ডিজিটাল অডিও ওয়ার্কস্টেশনে রেকর্ড করা ফোলি ট্র্যাক সম্পাদনা এবং মিশ্রণের অটোমেশন হার ৬৮%। এখানেই AI ব্যাপক অগ্রগতি করেছে। iZotope RX, Adobe Podcast Enhance, Krisp এবং AI-চালিত অডিও প্লাগইনের ক্রমবর্ধমান ইকোসিস্টেমের মতো সরঞ্জামগুলি রেকর্ডিং পরিষ্কার করতে পারে, অবাঞ্ছিত শব্দ সরাতে পারে, রুম টোন মেলাতে পারে, মাত্রা স্বাভাবিক করতে পারে, এবং এমনকি টেক্সট প্রম্পট থেকে মৌলিক সাউন্ড ইফেক্ট তৈরি করতে পারে। সাবধানী ম্যানুয়াল সম্পাদনায় যা ঘণ্টা লাগত তা এখন মিনিটে করা যায়। একটি AI সরঞ্জাম একটি ফোলি রেকর্ডিং বিশ্লেষণ করতে পারে, অবাঞ্ছিত অ্যাম্বিয়েন্ট নয়েজ চিহ্নিত করতে পারে (এয়ার কন্ডিশনার গুঞ্জন, চেয়ারের কিচকিচ শব্দ, শিল্পীর শ্বাস), এটি পরিষ্কারভাবে সরাতে পারে, এবং অবশিষ্ট শব্দটিকে প্রোডাকশনের অডিও প্রোফাইলের সাথে মেলাতে EQ করতে পারে — সবকিছু স্বয়ংক্রিয়ভাবে।

যা একসময় একটি কারুকাজ দক্ষতা ছিল — ধৈর্যশীল, ফ্রেম-নির্ভুল সম্পাদনা যা ভালো পোস্ট-প্রোডাকশন ইঞ্জিনিয়ারদের মাঝারি মানের থেকে আলাদা করত — এখন একটি প্লাগইন উইন্ডোতে একটি ক্লিক। এটি যে কোনো ফোলি আর্টিস্টের জন্য বিলযোগ্য ঘণ্টার প্রকৃত ক্ষতি যার ব্যবসার মডেল পারফরম্যান্স সময়ের মতো একই হারে সম্পাদনার সময়ের জন্য চার্জ করার উপর নির্ভরশীল ছিল।

[তথ্য] কিন্তু পর্দার ক্রিয়ার সাথে সমলয় করে শারীরিক সাউন্ড ইফেক্ট পারফর্ম করার অটোমেশন মাত্র ২২%। এটি ফোলির মূল কারুকাজ, এবং এটি AI-এর প্রতি উল্লেখযোগ্যভাবে প্রতিরোধী। একজন ফোলি আর্টিস্ট একটি দৃশ্য দেখেন এবং রিয়েল টাইমে শারীরিকভাবে শব্দ তৈরি করেন: একটি চরিত্রের পদক্ষেপের সাথে মেলাতে বিভিন্ন পৃষ্ঠায় হাঁটা, একটি ব্রিফকেস খোলার শব্দ তৈরি করতে বস্তু পরিচালনা করা, একটি চামড়ার জ্যাকেটের সরসরানি অনুকরণ করতে উপকরণ ভাঁজ করা। এর জন্য পর্দা দেখা, দৃশ্যের আবেগময় সুর বোঝা, সঠিক পৃষ্ঠা বা প্রপ বেছে নেওয়া, এবং মিলিসেকেন্ডের মধ্যে দৃশ্যমানতার সাথে মেলাতে শারীরিক পারফরম্যান্স সময় নির্ধারণ করা প্রয়োজন। একজন দক্ষ ফোলি আর্টিস্ট তিনটি ভিন্ন পৃষ্ঠায় একই পদক্ষেপের কিউ বিশ বার পুনরাবৃত্তি করবেন যে একটি খুঁজে পেতে যা কাটার দৃশ্যমান ছন্দের বিপরীতে সঠিক শোনায়।

[তথ্য] সাউন্ড রেকর্ডিংয়ের জন্য প্রপস এবং পৃষ্ঠ সংগ্রহ এবং প্রস্তুত করা ১৫% অটোমেশনে রয়েছে। প্রতিটি ফোলি স্টেজ মূলত শব্দ তৈরির উপকরণের একটি ওয়ার্কশপ — বিভিন্ন জুতা, মেঝের পৃষ্ঠ, কাপড়ের টেক্সচার, ধাতব বস্তু, কাচের প্যানেল, শরীরে প্রভাবের ইফেক্টের জন্য বিভিন্ন ধরনের সেলেরি এবং তরমুজ। কোন মার্বেল পৃষ্ঠায় কোন ড্রেস জুতা ১৯৪০-এর একজন গোয়েন্দার কোর্টহাউসের লবি দিয়ে হাঁটার শব্দ তৈরি করবে তা জানা হলো অভিজ্ঞতামূলক জ্ঞান যা কোনো ডেটাসেট প্রতিলিপি করতে পারে না। লস অ্যাঞ্জেলেস, নিউ ইয়র্ক এবং লন্ডনের ভালো ফোলি স্টেজগুলিতে দশকের পর দশক ধরে নির্মিত উত্তরাধিকারসূত্রে প্রাপ্ত প্রপ সংগ্রহ রয়েছে, পুরানো বাইন্ডারে নোট সহ কোন নির্দিষ্ট জোড়া বুট কোন আইকনিক চলচ্চিত্রের জন্য ব্যবহার করা হয়েছিল।

AI সাউন্ড লাইব্রেরি সমস্যা

[দাবি] AI অডিও বিপ্লব বাস্তবে কেমন দেখায় এটি: AI-উৎপন্ন সাউন্ড ইফেক্ট লাইব্রেরি আকার এবং মানে বিস্ফোরণ ঘটছে। টিনের ছাদে বৃষ্টির শব্দ দরকার? গাড়ির দরজা বন্ধ হওয়া? নুড়িপাথরে পদক্ষেপ? ElevenLabs Sound Effects, Meta-র AudioCraft এবং ডজনখানেক প্রতিযোগীর মতো সরঞ্জামগুলি এগুলি স্ক্র্যাচ থেকে তৈরি করতে পারে বা সর্বোত্তম মিল খুঁজে পেতে লক্ষ লক্ষ পূর্ব-রেকর্ড করা শব্দের মাধ্যমে অনুসন্ধান করতে পারে। ছোট বাজেট নিয়ে কাজ করা ইন্ডি ফিল্মমেকার, পডকাস্টার এবং ভিডিও গেম ডেভেলপারদের জন্য, এই সরঞ্জামগুলি সত্যিকারের ভিত্তিক সাউন্ড ডিজাইনের জন্য একজন ফোলি আর্টিস্ট নিয়োগের প্রয়োজনীয়তা প্রতিস্থাপন করছে।

এটি বাজারের নিচের অংশ যা প্রথমে ফাঁকা হয়ে গেছে। কর্পোরেট এক্সপ্লেইনার ভিডিও, কম বাজেটের ডকুমেন্টারি, গেমিং ইন্ডি টাইটেল — এই কাজগুলি ফোলি আর্টিস্টদের জন্য স্থিরশীল মধ্য-স্তরের আয় প্রদান করত, এবং এগুলি ক্রমশ মানব ফোলি ক্রেডিট ছাড়াই সম্পন্ন হচ্ছে।

কিন্তু এখানে সেই ব্যবধান রয়েছে যা সংখ্যাগুলি প্রকাশ করে। জেনেরিক AI-উৎপন্ন শব্দ জেনেরিক কন্টেন্টের জন্য ঠিকমতো কাজ করে। তারা ভেঙে পড়ে যখন একজন পরিচালক _এই চরিত্রের_ পদক্ষেপের নির্দিষ্ট শব্দ _সেই পৃষ্ঠায়_ _সেই আবেগময় মুহূর্তে_ প্রয়োজন। একটি তাড়ার দৃশ্যে শুধু "দৌড়ানোর পদক্ষেপ" দরকার নয় — এতে পদক্ষেপ দরকার যা সঠিক হারে ত্বরান্বিত হয়, সঠিক পৃষ্ঠায়, সঠিক ওজন সহ, ঠিক যখন ক্যামেরা ট্রানজিশন দেখায় তখন কংক্রিট থেকে ভেজা ঘাসে পরিবর্তন হচ্ছে। পারফরম্যান্স-নির্দিষ্ট সমলয়নের সেই স্তরটি হলো ফোলি আর্টিস্টরা যা করেন, এবং কারুকাজটি ইতিমধ্যে বোঝে এমন কারো কাছ থেকে নির্দেশনা ছাড়া AI এটি প্রতিলিপি করতে পারে না।

[দাবি] প্রধান স্টুডিওতে বেশ কয়েকজন সুপারভাইজিং সাউন্ড এডিটর শিল্প ট্রেড প্রকাশনায় একই কথা বলেছেন: তারা ক্লিনআপের জন্য আরো AI সরঞ্জাম ব্যবহার করছেন, কিন্তু প্রকৃত পারফরম্যান্স কাজের জন্য একই সংখ্যক মানব ফোলি আর্টিস্ট ব্যবহার করছেন। মর্যাদাপূর্ণ কন্টেন্টে কাজ করা শিল্পীদের জন্য ঘণ্টাগুলি স্থানান্তরিত হয়েছে, অদৃশ্য হয়নি।

চাকরির বাজার সংকুচিত হচ্ছে

[তথ্য] ব্যুরো অফ লেবার স্ট্যাটিস্টিক্স ২০৩৪ সালের মধ্যে বৃহত্তর সাউন্ড ইঞ্জিনিয়ারিং বিভাগের জন্য -৩% হ্রাস প্রজেক্ট করে। বৃহত্তর বিভাগে প্রায় ১৮,৫০০ জন কর্মরত এবং বার্ষিক মধ্যম মজুরি $৬২,৭৪০ সহ, ফোলি আর্ট মিডিয়া প্রোডাকশনের মধ্যে একটি ছোট কিন্তু ভালো-পারিশ্রমিকের বিশেষত্ব।

[অনুমান] ২০২৮ সালের মধ্যে, সামগ্রিক AI এক্সপোজার ৬৮% এবং অটোমেশন ঝুঁকি ৫৭% পর্যন্ত পৌঁছানোর প্রজেকশন রয়েছে। এই সংখ্যাগুলি উল্লেখযোগ্য। বাস্তবতা হলো ফোলি কাজের মধ্য-স্তর — স্ট্যান্ডার্ড প্রোডাকশনের জন্য মৌলিক সাউন্ড ইফেক্ট, যে ধরনের কাজ আগে মধ্য-ক্যারিয়ারের ফোলি আর্টিস্টদের নিযুক্ত করত যারা কঠিন কিন্তু শিরোনাম-কেড়ে নেওয়া প্রকল্প করছিলেন না — দ্রুত AI সরঞ্জাম এবং প্রি-বিল্ট সাউন্ড লাইব্রেরি দ্বারা শোষিত হচ্ছে। কিছু মধ্য-ক্যারিয়ার ফোলি আর্টিস্ট তত্ত্বাবধায়ক বা হাইব্রিড ভূমিকায় যাচ্ছেন। কেউ কেউ সম্পূর্ণভাবে শিল্প ছেড়ে চলে যাচ্ছেন।

টিকে থাকার কৌশল

[অনুমান] যে ফোলি আর্টিস্টরা উন্নতি লাভ করবেন তারা হলেন যারা বাজারের প্রিমিয়াম প্রান্তে নিজেদের অবস্থান করেন। উচ্চ-বাজেটের চলচ্চিত্র, মর্যাদাপূর্ণ টেলিভিশন, AAA ভিডিও গেম, অ্যানিমেটেড ফিচার — এই প্রোডাকশনগুলিতে বেসপোক, আবেগময়ভাবে নির্ভুল সাউন্ড ডিজাইনের প্রয়োজন যা শুধুমাত্র একজন মানব পারফর্মার প্রদান করতে পারেন। একটি মার্ভেল চলচ্চিত্র AI-উৎপন্ন মুষ্টির শব্দ ব্যবহার করে না। একটি ক্রিস্টোফার নোলান চলচ্চিত্র কাস্টম-পারফর্মড ফোলির জন্য জেনেরিক পদক্ষেপ লাইব্রেরি প্রতিস্থাপন করে না। পিক্সার চলচ্চিত্রগুলি তাদের চূড়ান্ত-ক্রেডিট রোলে নামযুক্ত ফোলি আর্টিস্টদের কৃতিত্ব দেয় কারণ কাজটি সম্পন্ন পণ্যের টেক্সচারের জন্য গুরুত্বপূর্ণ।

এগিয়ে যাওয়ার পথে তিনটি কংক্রিট উপাদান রয়েছে। প্রথমত, সম্পাদনা অটোমেশন গ্রহণ করুন। আপনার পোস্ট-প্রোডাকশন ওয়ার্কফ্লো ত্বরান্বিত করতে AI সরঞ্জাম ব্যবহার করুন যাতে আপনি পারফরম্যান্স কাজে আরো সময় ব্যয় করতে পারেন যা আরো ভালো পারিশ্রমিক দেয় এবং আরো প্রতিরক্ষাযোগ্য। দ্বিতীয়ত, মর্যাদাপূর্ণ প্রকল্পে কর্মী নিযুক্তকারী প্রোডাকশন হাউস এবং সুপারভাইজিং সাউন্ড এডিটরদের সাথে সম্পর্ক তৈরি করুন — এই সম্পর্কগুলি প্রতিলিপি করা কঠিন এবং AI-এর পক্ষে তৈরি করা অসম্ভব। তৃতীয়ত, একটি বিশেষত্ব তৈরি করুন: কিছু ফোলি আর্টিস্ট পিরিয়ড ড্রামার জন্য পরিচিত হন, অন্যরা অ্যাকশন সিকোয়েন্সের জন্য, অন্যরা অ্যানিমেশনের জন্য। বিশেষায়িতকরণ হলো একটি পরিখা যা AI সাউন্ড লাইব্রেরির এখনও নেই, কারণ তারা কর্তৃত্বের পরিবর্তে জেনেরিকভাবে উৎপন্ন করে।

আপনার পোস্ট-প্রোডাকশন ওয়ার্কফ্লো ত্বরান্বিত করতে AI সম্পাদনা সরঞ্জাম ব্যবহার করতে শিখুন — পারফরম্যান্সে ২২% অটোমেশনে আরো সময় ব্যয় করতে পারেন সে জন্য সম্পাদনায় ৬৮% অটোমেশন গ্রহণ করুন। ক্লিনআপ AI সামলাতে দিয়ে সৃজনশীল পারফরম্যান্সে মনোযোগ দিয়ে সম্পন্ন ফোলি দ্রুত সরবরাহ করতে আরো দক্ষ হন। যে শিল্পীরা সম্পূর্ণভাবে AI সরঞ্জাম ব্যবহার করতে অস্বীকার করেন তারা তাদের কারুকাজ সংরক্ষণ করছেন না; তারা নিজেদের আধুনিক প্রোডাকশনের পরিচালিত সময়সূচির সীমাবদ্ধতা থেকে বাইরে মূল্য নির্ধারণ করছেন।

$৬২,৭৪০ মধ্যম বেতন এমন একটি পেশা প্রতিফলিত করে যা দক্ষতার পুরস্কার দেয়। এই ক্ষেত্রের বিশেষজ্ঞরা যারা শারীরিক পারফরম্যান্স দক্ষতার সাথে প্রযুক্তিগত পোস্ট-প্রোডাকশন দক্ষতা একত্রিত করেন তারা এমন বাজারে প্রিমিয়াম হার কমান্ড করবেন যা জেনেরেলিস্ট ঝেড়ে ফেলছে কিন্তু এখনো মাস্টারদের প্রয়োজন। প্রধান চলচ্চিত্র এবং মর্যাদাপূর্ণ সিরিজে কাজ করা শীর্ষ ফোলি আর্টিস্টরা ছয় অঙ্কের মধ্যে ভালোভাবে উপার্জন করতে পারেন, বিশেষ করে পুরস্কারের প্রতিযোগিতামূলক চলচ্চিত্রে ক্রেডিটকারীরা।

দীর্ঘমেয়াদী দৃষ্টিভঙ্গিতে একটি চূড়ান্ত নোট: হাতে তৈরি সাউন্ড ডিজাইনের মর্যাদাপূর্ণ বাজার বিলুপ্ত হচ্ছে না, কারণ দর্শকরা ক্রমশ প্রামাণিকতা চিনতে এবং মূল্য দিতে প্রশিক্ষিত হচ্ছে। ডিজিটালের পর যেভাবে ভিনাইল রেকর্ড ফিরে এসেছে, যেভাবে স্মার্টফোনের যুগে মেকানিক্যাল ঘড়ি এখনো প্রিমিয়াম কমান্ড করে, হাতে পারফর্মড ফোলি সেই প্রোডাকশনগুলির জন্য সাংস্কৃতিক মূল্য প্রিমিয়াম ধরে রাখবে যারা এটি বহন করতে পারে। প্রশ্ন হলো সেই প্রিমিয়াম বাজারের আকার বর্তমান কর্মশক্তি বজায় রাখার জন্য যথেষ্ট বড় কিনা। প্রজেক্টেড -৩% হ্রাস দেওয়া সৎ উত্তর হলো কিছু সংকোচন আসছে। যে শিল্পীরা টিকে থাকবেন তারা হলেন যারা নিজেদের আগাম অবস্থান করেছিলেন।

সম্পূর্ণ টাস্ক-স্তরের ডেটা এবং ট্রেন্ড প্রজেকশনের জন্য, ফোলি আর্টিস্টদের ডেটা পেজ দেখুন।


_এই বিশ্লেষণটি Anthropic Economic Index এবং Bureau of Labor Statistics প্রজেকশন থেকে ডেটা ব্যবহার করে AI-সহায়তা গবেষণার উপর ভিত্তি করে। সর্বশেষ আপডেট: এপ্রিল ২০২৬।_

Analysis based on the Anthropic Economic Index, U.S. Bureau of Labor Statistics, and O*NET occupational data. Learn about our methodology

আপডেট ইতিহাস

  • ৭ এপ্রিল, ২০২৬ তারিখে প্রথম প্রকাশিত।
  • ১৭ মে, ২০২৬ তারিখে সর্বশেষ পর্যালোচিত।

এই বিষয়ে আরও

Arts Media Hospitality

Tags

#foley artist#sound design#AI audio tools#film production#automation risk