প্রধান টেকওয়ে
- ফেসিয়াল রিকগনিশন অ্যালগরিদমগুলি মুখোশের সাথে মুখ পড়ার ক্ষেত্রে আরও ভাল হচ্ছে।
- একটি নতুন অধ্যয়ন কীভাবে একটি অ্যালগরিদম মুখোশ পড়তে পারে তার সীমাবদ্ধতা দেখায়, যেমন মুখোশের রঙ এবং আকৃতি৷
- বিশেষজ্ঞরা বলছেন যে ফেসিয়াল রিকগনিশন ইন্ডাস্ট্রি তাদের অ্যালগরিদমে ফেস মাস্ক অন্তর্ভুক্ত করার জন্য সক্রিয়ভাবে কাজ করছে৷
ফেসিয়াল রিকগনিশন ইন্ডাস্ট্রি সহ অনেক শিল্পকে মহামারীর সাথে সামঞ্জস্য করতে হবে। বিশেষজ্ঞরা বলছেন যে ফেস মাস্ক পরা লোকেদের চিনতে প্রযুক্তি ধীরে ধীরে উন্নত হচ্ছে৷
ন্যাশনাল ইনস্টিটিউট অফ স্ট্যান্ডার্ডস অ্যান্ড টেকনোলজি (এনআইএসটি) দ্বারা প্রকাশিত একটি নতুন প্রতিবেদনে COVID-19 মহামারী শুরু হওয়ার পরে তৈরি 65টি নতুন ফেসিয়াল রিকগনিশন অ্যালগরিদমের ফলাফল দেখায়, সেইসাথে প্রাক-মহামারী জমা দেওয়া 87টি অ্যালগরিদম। প্রতিবেদনে প্রকাশ করা হয়েছে যে সফ্টওয়্যার বিকাশকারীরা এমন অ্যালগরিদম তৈরিতে আরও ভাল হচ্ছে যা মুখোশযুক্ত মুখগুলিকে চিনতে পারে, এমনকি নিয়মিত ফেসিয়াল রিকগনিশন অ্যালগরিদমের মতো নির্ভুল হয়ে উঠছে৷
"কয়েকটি প্রাক-মহামারী অ্যালগরিদম এখনও মুখোশযুক্ত ফটোগুলির মধ্যে সবচেয়ে নির্ভুল রয়ে গেছে, কিছু বিকাশকারী মহামারীর পরে উল্লেখযোগ্যভাবে উন্নত নির্ভুলতা দেখিয়ে অ্যালগরিদম জমা দিয়েছেন এবং এখন আমাদের পরীক্ষায় সবচেয়ে নির্ভুলদের মধ্যে রয়েছে," রিপোর্টটি পড়ে.
গবেষণায় কী পাওয়া গেছে
এই অধ্যয়নটি NIST দ্বারা পরিচালিত তার ধরণের দ্বিতীয় ছিল একই ডেটাসেট যা মুখের মাস্কের উপস্থিতিতে ফেসিয়াল রিকগনিশন অ্যালগরিদম এবং তাদের নির্ভুলতা পরীক্ষা করার জন্য। প্রতিবেদনের লেখকরা 6.2 মিলিয়ন ফটো ব্যবহার করেছেন এবং এই চিত্রগুলিতে বিভিন্ন ডিজিটাল মাস্ক সংমিশ্রণের সিমুলেশন প্রয়োগ করেছেন।
মেই এনগান, রিপোর্টের সহ-লেখক এবং এনআইএসটি-এর কম্পিউটার বিজ্ঞানী, লাইফওয়্যারকে একটি ফোন সাক্ষাত্কারে বলেছিলেন যে মুখের মাস্কের উপস্থিতি মূলত মুখের স্বীকৃতি প্রযুক্তিকে প্রায় দুই থেকে তিন বছর আগে নিয়ে গেছে।
"ত্রুটির হার 2.5% এবং 5%-এর মধ্যে যে কোন জায়গায় - 2017 সালে যেখানে অত্যাধুনিক প্রযুক্তি ছিল তার সাথে তুলনা করা যায়।"
বিশ্ব স্বাস্থ্য সংস্থা বিশ্বব্যাপী মহামারী ঘোষণা করার আগে, 2020 সালের মার্চের আগে পেশ করা ফেসিয়াল রিকগনিশন অ্যালগরিদমগুলির কার্যকারিতা দেখেছিল জুলাই মাসে প্রকাশিত NIST-এর আগের একটি প্রতিবেদন। এই প্রথম গবেষণায় এই প্রাক-মহামারী অ্যালগরিদমের ত্রুটির হার 5% এবং 50% এর মধ্যে পাওয়া গেছে।
এমনকি এই অ্যালগরিদমগুলি মুখোশ পড়া মুখগুলি পড়ার ক্ষেত্রে আরও ভাল হয়ে উঠলেও, সাম্প্রতিক গবেষণায় দেখা গেছে যে কিছু কারণ ত্রুটির হারকে প্রভাবিত করে, যেমন মুখোশের রঙ (লাল বা কালোর মতো গাঢ় মুখোশগুলির ত্রুটির হার বেশি) এবং কীভাবে মাস্ক আকৃতির (রাউন্ডার মাস্কের আকারের ত্রুটির হার কম)।
Ngan বলেছেন যে অ্যালগরিদমগুলি মুখোশের মাধ্যমে পড়ার পরিবর্তে মুখের বৈশিষ্ট্যগুলি সনাক্ত করতে কারও মুখের দৃশ্যমান অংশ, যেমন চোখের চারপাশের অঞ্চল এবং কপাল ব্যবহার করে৷
ফেসিয়াল রিকগনিশন এবং ফেস মাস্কের ভবিষ্যত
Ngan বলেছেন যে এটা স্পষ্ট যে ডেভেলপাররা তাদের ফেসিয়াল রিকগনিশন অ্যালগরিদমগুলির সাথে উল্লেখযোগ্য উন্নতি করেছে যখন এটি মুখোশের ক্ষেত্রে আসে৷
"ফেস মাস্ক পরার সীমাবদ্ধতার মধ্যে কাজ করার জন্য স্পষ্টতই মুখের শনাক্তকরণ সিস্টেমের প্রয়োজনীয়তা রয়েছে," তিনি বলেছিলেন। "আমরা যে জিনিসগুলি করছিলাম এবং আমাদের সাম্প্রতিক গবেষণার ফলাফলের পরিপ্রেক্ষিতে, আমরা দেখতে পাচ্ছি যে ফেসিয়াল রিকগনিশন ইন্ডাস্ট্রি তাদের অ্যালগরিদমগুলিতে মুখোশগুলি অন্তর্ভুক্ত করার জন্য সক্রিয়ভাবে কাজ করছে।"
যেহেতু প্রযুক্তির উন্নতি হচ্ছে, তার মানে ফেস মাস্ক পরার সময় আমাদের ফোন আনলক করার মতো জিনিসগুলি করা সহজ হবে, তবে মুখের স্বীকৃতির ক্ষেত্রে এইভাবে অগ্রসর হওয়ার ক্ষেত্রে অন্যান্য প্রভাব রয়েছে৷
অসংখ্য গবেষণা দেখায় যে মুখের স্বীকৃতি ব্যাপকভাবে ভুল ব্যক্তিকে ভুল শনাক্ত করতে এবং জাতিগত পক্ষপাতিত্বের জন্য রিপোর্ট করা হয়েছে। NIST-এর একটি 2019 সমীক্ষায় দেখা গেছে যে ফেসিয়াল রিকগনিশন প্রযুক্তি কালো এবং এশিয়ান লোকেদেরকে শ্বেতাঙ্গদের তুলনায় প্রায় 100 গুণ বেশি ভুল শনাক্ত করে৷
এমনকি যদি ফেস মাস্ক পড়ার ক্ষেত্রে প্রযুক্তি আরও উন্নত হচ্ছে, তবুও ত্রুটির শতাংশ-যতই ছোট হোক না কেন-ফেস মাস্ক পরা ব্যক্তিকে ভুল শনাক্ত করার জন্য এখনও উদ্বেগ হতে পারে।
যদিও সাম্প্রতিকতম NIST রিপোর্ট দেখায় যে ফেস মাস্ক টাস্ক পরিচালনার ক্ষেত্রে অ্যালগরিদমগুলি আরও ভাল হয়ে উঠছে, Ngan বলেছেন যে মহামারীর সময়ে মুখের স্বীকৃতির ভবিষ্যত আসলেই এটি কোথায় যাচ্ছে কিনা তা কেবল সময়ই বলে দেবে৷
"হয়তো আমরা আরও ত্রুটি হ্রাস আশা করতে পারি, অথবা বিকাশকারীরা মুখোশহীন অঞ্চলে অনন্য তথ্যের পরিমাণের সীমাবদ্ধতা খুঁজে পেতে পারে," এনগান বলেছেন৷