প্রধান টেকওয়ে
- নতুন প্রযুক্তি এমন কম্পিউটারের দিকে নিয়ে যেতে পারে যা মানুষের কথাবার্তা আরও ভালোভাবে বোঝে।
- Microsoft এবং NVIDIA সম্প্রতি ভাষা ব্যাখ্যা করার জন্য একটি নতুন AI-চালিত পদ্ধতি ঘোষণা করেছে৷
- কোয়ান্টাম কম্পিউটিং ভাষা প্রক্রিয়াকরণের ক্ষেত্রে অগ্রসর হওয়ার আরেকটি উপায় হতে পারে।
আজকাল কমান্ড দেওয়ার জন্য প্রচুর স্মার্ট গ্যাজেট রয়েছে, তবে আমরা এখনও এমন কম্পিউটার থেকে অনেক দূরে রয়েছি যেগুলি কথোপকথনমূলক বক্তব্য বোঝে৷
Microsoft এবং NVIDIA সম্প্রতি বক্তৃতা ব্যাখ্যা করার জন্য একটি নতুন AI-চালিত পদ্ধতি ঘোষণা করেছে যা আমরা আমাদের ইলেকট্রনিক্সের সাথে কীভাবে চ্যাট করি তা পরিবর্তন করতে পারে। এটি একটি ক্রমবর্ধমান আন্দোলনের অংশ যা কম্পিউটার কীভাবে বক্তৃতা বোঝে, যাকে ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিং (NLP)ও বলা হয়।
"এনএলপিকে চালিত করার মডেলগুলি আরও বড় এবং আরও উন্নত হয়ে উঠছে এবং মানুষের বোঝার কাছাকাছি হচ্ছে," এআই বিশেষজ্ঞ হামিশ ওগিলভি লাইফওয়্যারকে একটি ইমেল সাক্ষাত্কারে বলেছেন৷
"একটি বড় অগ্রগতি হল যে NLP সাধারণ কীওয়ার্ডের বাইরে চলে যাচ্ছে৷ আপনি আজকে অনুসন্ধানের ফলাফল পেতে এক বা দুটি কীওয়ার্ড টাইপ করতে বা বলতে অভ্যস্ত হতে পারেন, কিন্তু নতুন প্রাকৃতিক ভাষা প্রক্রিয়াকরণ মডেলগুলি আরও সমৃদ্ধ ফলাফল প্রদানের জন্য প্রসঙ্গ ব্যবহার করে"
চ্যাট বট
NVIDIA এবং মাইক্রোসফ্ট মেগাট্রন-টুরিং ন্যাচারাল ল্যাঙ্গুয়েজ জেনারেশন মডেল (MTNLG) তৈরি করার জন্য যৌথভাবে কাজ করেছে, যেটি এই যুগল দাবি করে "এখন পর্যন্ত প্রশিক্ষিত সবচেয়ে শক্তিশালী মনোলিথিক ট্রান্সফরমার ভাষা মডেল।" এআই মডেল সুপার কম্পিউটারে চলে।
কিন্তু গবেষকরা দেখেছেন যে MTNLG মডেলটি মানুষের বক্তৃতা নমুনার পাহাড়ের মধ্য দিয়ে আঁচড়ানোর সময় মানুষের পক্ষপাতগুলি তুলে ধরেছে৷
"যদিও দৈত্য ভাষার মডেলগুলি ভাষা তৈরিতে শিল্পের অবস্থাকে এগিয়ে নিয়ে যাচ্ছে, তারা পক্ষপাত ও বিষাক্ততার মতো সমস্যাগুলিও ভোগ করছে," গবেষকরা একটি ব্লগ পোস্টে লিখেছেন৷ "MT-NLG এর সাথে আমাদের পর্যবেক্ষণ হল যে মডেলটি যে ডেটাতে প্রশিক্ষিত তা থেকে স্টেরিওটাইপস এবং পক্ষপাতগুলি তুলে নেয়৷"
যে কম্পিউটারগুলি বক্তৃতা আরও ভালভাবে বোঝে সেগুলি কেবল আলেক্সার মতো স্মার্ট স্পিকারগুলিকে উন্নত করবে না, ওগিলভি দাবি করেছেন৷ অ্যামাজনের মতো পাঠ্য-ভিত্তিক অনুসন্ধান ওয়েবসাইটগুলিও টাইপ করা প্রশ্নগুলি আরও ভালভাবে বুঝতে পারবে।
"গুগলের এখানে সুস্পষ্ট নেতৃত্ব রয়েছে, কিন্তু NLP প্রযুক্তি সর্বত্র হতে চলেছে," ওগিলভি বলেছেন। "পাঠ্য- এবং ভয়েস-ভিত্তিক অনুসন্ধানের জন্য, ব্যবহারকারীরা আরও বর্ণনামূলক হতে পারে কারণ NLP কেবল পাঠ্যের চেয়ে বেশি বোঝে; এটি ভাল ফলাফল ফেরাতে আপনি যা খুঁজছেন তার প্রেক্ষাপট বুঝতে পারে৷"
কোয়ান্টাম চ্যাট?
কোয়ান্টাম কম্পিউটিং এনএলপির ক্ষেত্রকে এগিয়ে নেওয়ার এক উপায় হতে পারে। বুধবার, কেমব্রিজ কোয়ান্টাম কোম্পানি lambeq ঘোষণা করেছে, যা দাবি করে যে এটি NLP-এর জন্য প্রথম কোয়ান্টাম টুলকিট।
…NLP শুধু পাঠ্যের চেয়ে বেশি বোঝে; এটি ভাল ফলাফল ফেরাতে আপনি যা খুঁজছেন তার প্রেক্ষাপট বুঝতে পারে৷
কোম্পানি বলেছে যে টুলটি কোয়ান্টাম কম্পিউটারে চালানো কোয়ান্টাম সার্কিট ব্যবহার করে প্রাকৃতিক ভাষায় বাক্য অনুবাদের অনুমতি দেয়। কোয়ান্টাম কম্পিউটিং হল এক ধরনের গণনা যা কোয়ান্টাম অবস্থার অস্বাভাবিক বৈশিষ্ট্যগুলি ব্যবহার করে, যেমন সুপারপজিশন, হস্তক্ষেপ এবং এনট্যাঙ্গলমেন্ট, গণনা সম্পাদন করতে।
"কোয়ান্টাম কম্পিউটার যেভাবে এনএলপি পরিচালনা করে তা ধ্রুপদী মেশিনের থেকে অনেক আলাদা৷ আসলে, এনএলপি 'কোয়ান্টাম নেটিভ'," কেমব্রিজ কোয়ান্টামের প্রধান বিজ্ঞানী বব কোয়েক লাইফওয়্যারকে একটি ইমেল সাক্ষাত্কারে বলেছেন৷ "কয়েক বছর আগে আমাদের করা একটি আবিষ্কারের কারণে এটি হয়েছে, যে ব্যাকরণ নিয়ন্ত্রণকারী বাক্য এবং অর্থ কোয়ান্টাম কম্পিউটার প্রোগ্রাম করার জন্য ব্যবহৃত গণিতের সাথে খুব অনুরূপ কাঠামো নেয়।"
Coecke বলেছেন যে কোয়ান্টাম NLP আরও ভাল ভয়েস সহকারী এবং অনুবাদ সরঞ্জামের দিকে নিয়ে যেতে পারে৷
ভাষী স্বীকৃতি উন্নত করার আরেকটি প্রতিশ্রুতিশীল পদ্ধতি, যার নাম জ্যাক লিউ, কোম্পানি হাইপারজায়েন্টের একজন ডেটা বিজ্ঞানী, লাইফওয়্যারকে একটি ইমেল সাক্ষাত্কারে বলেছেন। "সংক্ষেপে, যখন ডেটা বিজ্ঞানীরা এনএলপি ডেটা উন্নত করেন, তখন এটি প্রায় গ্যারান্টি দেয় যে তাদের আরও ভাল এনএলপি মডেল এবং আরও ভাল এনএলপি ক্ষমতা থাকবে৷"
পরবর্তী ধাপ হল কম্পিউটার ভিশন মডেলগুলিকে NLP-এর সাথে একীভূত করা, যেমন ভিডিও দেখার জন্য একটি AI মডেলকে প্রশিক্ষণ দেওয়া এবং সেই ভিডিওটির একটি পাঠ্য সারাংশ তৈরি করা, লিউ বলেছেন৷
"এই অগ্রগতির প্রয়োগ সীমাহীন হতে পারে, স্বাস্থ্যসেবা, রেডিওলজিক্যাল ফিল্ম পড়া এবং প্রাথমিক রোগ নির্ণয়, বাড়ি, কাপড়, গয়না বা অনুরূপ আইটেম ডিজাইন করা পর্যন্ত," তিনি যোগ করেছেন। "গ্রাহক প্রয়োজনীয়তাগুলি মৌখিকভাবে বা লিখিত আকারে ব্যাখ্যা করতে পারে, এবং এই বিবরণটি স্বয়ংক্রিয়ভাবে চিত্র বা ভিডিওতে রূপান্তরিত হতে পারে ভাল ভিজ্যুয়ালাইজেশনের জন্য৷"