কীভাবে হ্যালুসিনেশন এআই আপনাকে আরও ভালোভাবে বুঝতে সাহায্য করতে পারে

সুচিপত্র:

কীভাবে হ্যালুসিনেশন এআই আপনাকে আরও ভালোভাবে বুঝতে সাহায্য করতে পারে
কীভাবে হ্যালুসিনেশন এআই আপনাকে আরও ভালোভাবে বুঝতে সাহায্য করতে পারে
Anonim

প্রধান টেকওয়ে

  • একটি নতুন মেশিন লার্নিং মডেল অনুবাদে সহায়তা করার জন্য একটি ভাষায় বাক্যটির উপস্থিতির একটি চিত্রকে হ্যালুসিনেট করে৷
  • ভালহাল্লা নামক এআই সিস্টেমটি মানুষের ভাষা বোঝার উপায় অনুকরণ করার জন্য ডিজাইন করা হয়েছিল৷
  • নতুন সিস্টেমটি ভাষা বোঝার জন্য এআই ব্যবহার করার জন্য একটি ক্রমবর্ধমান আন্দোলনের অংশ৷
Image
Image

শব্দ অনুবাদ করার সময় ছবি দেখার মানবিক পদ্ধতি কৃত্রিম বুদ্ধিমত্তা (AI) আপনাকে আরও ভালভাবে বুঝতে সাহায্য করতে পারে৷

একটি নতুন মেশিন লার্নিং মডেল একটি ভাষাতে একটি বাক্য দেখতে কেমন তা একটি চিত্রকে হ্যালুসিন করে। সাম্প্রতিক একটি গবেষণা পত্র অনুসারে, কৌশলটি তখন অনুবাদে সহায়তা করার জন্য ভিজ্যুয়ালাইজেশন এবং অন্যান্য সূত্র ব্যবহার করে। এটি ভাষা বোঝার জন্য AI ব্যবহার করার একটি ক্রমবর্ধমান আন্দোলনের অংশ।

"লোকেরা কীভাবে কথা বলে এবং লেখে তা অনন্য কারণ আমাদের সবার টোন এবং শৈলী কিছুটা আলাদা," মেরিভিল ইউনিভার্সিটির ডেটা অ্যানালিটিক্সের অধ্যাপক বেথ কুডনি, যিনি গবেষণার সাথে জড়িত ছিলেন না, লাইফওয়্যারকে একটি ইমেল সাক্ষাত্কারে বলেছেন. "প্রসঙ্গ বোঝা কঠিন কারণ এটি অসংগঠিত ডেটা নিয়ে কাজ করার মতো। এখানেই প্রাকৃতিক ভাষা প্রক্রিয়াকরণ (NLP) কার্যকর। NLP হল AI এর একটি শাখা যা মেশিন রিডিং কম্প্রিহেনশন ব্যবহার করে আমরা কীভাবে যোগাযোগ করি তার পার্থক্যগুলি সমাধান করে। NLP-তে মূল পার্থক্য, AI এর একটি শাখা হিসাবে, আমরা যে শব্দগুলি বলি বা লিখি তার আক্ষরিক অর্থের উপর ফোকাস করে না। এটি অর্থের দিকে নজর দেয়।"

যাও অ্যালিসকে জিজ্ঞাসা করুন

ভালহাল্লা নামে নতুন এআই সিস্টেম, এমআইটি, আইবিএম এবং সান দিয়েগোতে ক্যালিফোর্নিয়া বিশ্ববিদ্যালয়ের গবেষকরা তৈরি করেছেন, মানুষের ভাষা বোঝার উপায় অনুকরণ করার জন্য ডিজাইন করা হয়েছে। বিজ্ঞানীদের মতে, সংবেদনশীল তথ্য ব্যবহার করে, মাল্টিমিডিয়ার মতো, নতুন এবং অপরিচিত শব্দের সাথে যুক্ত করা, যেমন ছবি সহ ফ্ল্যাশকার্ড, ভাষা অর্জন এবং ধরে রাখার উন্নতি করে৷

এই সিস্টেমগুলি চ্যাটবটগুলির শক্তি বাড়িয়ে তুলছে যেগুলি বর্তমানে শুধুমাত্র প্রশিক্ষিত এবং নির্দিষ্ট কথোপকথন করতে সক্ষম…

দলটি দাবি করে যে তাদের পদ্ধতিটি কেবলমাত্র পাঠ্য অনুবাদের চেয়ে মেশিন অনুবাদের নির্ভুলতা উন্নত করে। বিজ্ঞানীরা দুটি ট্রান্সফরমার সহ একটি এনকোডার-ডিকোডার আর্কিটেকচার ব্যবহার করেছেন, এক ধরণের নিউরাল নেটওয়ার্ক মডেল যা সিকোয়েন্স-নির্ভর ডেটার জন্য উপযুক্ত, যেমন ভাষার, যা একটি বাক্যের কীওয়ার্ড এবং শব্দার্থবিদ্যায় মনোযোগ দিতে পারে। একটি ট্রান্সফরমার একটি ভিজ্যুয়াল হ্যালুসিনেশন তৈরি করে এবং অন্যটি প্রথম ট্রান্সফরমার থেকে আউটপুট ব্যবহার করে মাল্টিমোডাল অনুবাদ সম্পাদন করে।

"বাস্তব-বিশ্বের পরিস্থিতিতে, উত্স বাক্যটির ক্ষেত্রে আপনার কাছে একটি চিত্র নাও থাকতে পারে," গবেষণা দলের অন্যতম সদস্য রামেশ্বর পান্ডা একটি সংবাদ বিজ্ঞপ্তিতে বলেছেন। "সুতরাং, আমাদের অনুপ্রেরণা ছিল মূলত: ইনপুট হিসাবে অনুমান করার সময় একটি বাহ্যিক চিত্র ব্যবহার করার পরিবর্তে, আমরা কি ভিজ্যুয়াল হ্যালুসিনেশন ব্যবহার করতে পারি - ভিজ্যুয়াল দৃশ্য কল্পনা করার ক্ষমতা - মেশিন ট্রান্সলেশন সিস্টেম উন্নত করতে?"

AI বোঝা

উল্লেখযোগ্য গবেষণা NLP অগ্রসর করার উপর দৃষ্টি নিবদ্ধ করে, কুডনি উল্লেখ করেছেন। উদাহরণস্বরূপ, এলন মাস্ক ওপেন এআই সহ-প্রতিষ্ঠা করেছেন, যেটি GPT-3-তে কাজ করছে, এমন একটি মডেল যা একজন মানুষের সাথে কথোপকথন করতে পারে এবং পাইথন এবং জাভাতে সফ্টওয়্যার কোড তৈরি করতে যথেষ্ট সচেতন।

Google এবং Meta তাদের LAMDA নামক সিস্টেমের সাথে কথোপকথনমূলক AI বিকাশের জন্যও কাজ করছে। "এই সিস্টেমগুলি চ্যাটবটগুলির শক্তি বাড়াচ্ছে যেগুলি বর্তমানে শুধুমাত্র প্রশিক্ষিত এবং নির্দিষ্ট কথোপকথনে সক্ষম, যা সম্ভবত গ্রাহক সহায়তা এবং সহায়তা ডেস্কগুলির চেহারা পরিবর্তন করবে," কুডনি বলেছেন।

Aaron Sloman, সহ-প্রতিষ্ঠাতা CLIPr, একটি AI টেক কোম্পানি, একটি ইমেলে বলেছেন যে GPT-3-এর মতো বড় ভাষার মডেলগুলি মানুষের প্রতিক্রিয়ার ভিত্তিতে পাঠ্যের সারাংশে উন্নতি করতে খুব কম প্রশিক্ষণ উদাহরণ থেকে শিখতে পারে। উদাহরণস্বরূপ, তিনি বলেছিলেন, আপনি একটি বড় ভাষার মডেলকে একটি গণিত সমস্যা দিতে পারেন এবং AI কে ধাপে ধাপে চিন্তা করতে বলতে পারেন।

"আমরা তাদের ক্ষমতা এবং সীমাবদ্ধতা সম্পর্কে আরও শিখার সাথে সাথে বৃহত্তর ভাষার মডেলগুলি থেকে বৃহত্তর অন্তর্দৃষ্টি এবং যুক্তি বের করার আশা করতে পারি," স্লোম্যান যোগ করেছেন। "আমি আশা করি যে এই ভাষা মডেলগুলি আরও মানব-সদৃশ প্রক্রিয়া তৈরি করবে কারণ মডেলাররা আগ্রহের নির্দিষ্ট কাজের জন্য মডেলগুলিকে সূক্ষ্ম-টিউন করার আরও ভাল উপায় বিকাশ করে।"

জর্জিয়া টেক কম্পিউটিং প্রফেসর দিই ইয়াং একটি ইমেল সাক্ষাত্কারে ভবিষ্যদ্বাণী করেছেন যে আমরা আমাদের দৈনন্দিন জীবনে প্রাকৃতিক ভাষা প্রক্রিয়াকরণ (NLP) সিস্টেমের আরও বেশি ব্যবহার দেখতে পাব, ইমেল এবং ফোন কলগুলিতে সহায়তা করার জন্য NLP-ভিত্তিক ব্যক্তিগত সহকারী থেকে শুরু করে, ভ্রমণ বা স্বাস্থ্যসেবায় তথ্য-সন্ধানের জন্য জ্ঞানী সংলাপ সিস্টেমে।"পাশাপাশি ন্যায্য AI সিস্টেম যা কাজগুলি সম্পাদন করতে পারে এবং মানুষকে একটি দায়িত্বশীল এবং পক্ষপাতমুক্ত উপায়ে সহায়তা করতে পারে," ইয়াং যোগ করেছেন৷

GPT-3 এবং DeepText-এর মতো ট্রিলিয়ন প্যারামিটার ব্যবহার করে বিশাল AI মডেলগুলি সমস্ত ভাষার অ্যাপ্লিকেশনের জন্য একটি একক মডেলের দিকে কাজ চালিয়ে যাবে, ডায়ালেক্সার একজন মেশিন লার্নিং ইঞ্জিনিয়ার স্টিফেন হেজ একটি ইমেল সাক্ষাত্কারে ভবিষ্যদ্বাণী করেছেন। তিনি বলেন যে নির্দিষ্ট ব্যবহারের জন্য নতুন ধরনের মডেল তৈরি করা হবে, যেমন ভয়েস-কমান্ডেড অনলাইন শপিং।

"একটি উদাহরণ হতে পারে একজন ক্রেতা বলছে 'আমাকে মধ্যরাতের নীল রঙে এই আইশ্যাডোটি আরও হ্যালো সহ দেখাও', এটি কীভাবে প্রয়োগ করা হয় তার উপর কিছুটা নিয়ন্ত্রণের সাথে ব্যক্তির চোখের উপর সেই শেডটি দেখাতে," হেজ যোগ করেছেন।

প্রস্তাবিত: