প্রধান টেকওয়ে
- Google একটি নতুন টুল চালু করেছে যা ব্যবহারকারীদের গুনগুন করে, গান গেয়ে বা শিস দিয়ে গান অনুসন্ধান করতে দেয়৷
- নতুন টুলটি ক্রমাগত আপডেট করা দেড় মিলিয়নেরও বেশি গানের ডাটাবেসের সাথে একটি গুঞ্জনযুক্ত ট্র্যাক মেলানোর জন্য মেশিন লার্নিং ব্যবহার করে৷
- Google ব্যবহারকারীরা জিজ্ঞেস করে কোন গানটি প্রতি মাসে প্রায় 100 বার বাজছে।
Google একটি হতাশাজনক সমস্যা সমাধানের জন্য "হাম টু সার্চ" নামে একটি নতুন বৈশিষ্ট্য চালু করেছে: আপনার মাথায় একটি গান আটকে থাকা এবং এটিকে কী বলা হয় তা বুঝতে না পারা৷
একটি গান খুঁজতে গুনগুন করার ধারণাটি অবিশ্বাস্যভাবে সহজ বলে মনে হচ্ছে, তাহলে কেন Google শুধুমাত্র 2020 সালে এই বৈশিষ্ট্যটি চালু করছে? ঠিক আছে, দেখা যাচ্ছে যে এইভাবে গানগুলি সনাক্ত করা আসলে বেশ জটিল, কারণ আমাদের গুঞ্জন সংস্করণগুলি মূল ট্র্যাক থেকে বেশ আলাদা হতে থাকে। তার AI ব্লগে একটি সাম্প্রতিক পোস্টে, Google ব্যাখ্যা করে যে কীভাবে এটি এই সমস্যাটি সমাধান করতে মেশিন লার্নিং ব্যবহার করেছে, এবং শেষ পর্যন্ত লোকেদের গুনগুন করে, শিস দিয়ে বা সুর করে গান খুঁজে পেতে সাহায্য করে, এমনকি যখন তাদের উপস্থাপনা সঠিক থেকে কম হয়।
"হাম টু সার্চের জন্য আমাদের ফোকাস লোকেদের তাদের মাথায় আটকে থাকা সঙ্গীত সনাক্ত করতে এবং খুঁজে পেতে সহায়তা করা," একজন Google মুখপাত্র লাইফওয়্যারকে একটি ইমেলে বলেছেন৷
শুধু গুনগুন করা শুরু করুন
গুগল ব্যবহারকারীরা জিজ্ঞাসা করেন কোন গানটি প্রতি মাসে প্রায় 100 মিলিয়ন বার বাজছে, অপর্ণা চেন্নাপ্রগাদা, গুগলের ভাইস প্রেসিডেন্ট এবং কনজিউমার শপিংয়ের জেনারেল ম্যানেজার বলেছেন, একটি ভিডিও বেশ কয়েকটি নতুন অনুসন্ধান বৈশিষ্ট্য উপস্থাপন করেছে। এখন খুঁজে বের করার একটি উপায় আছে৷
"হাম টু সার্চ" বৈশিষ্ট্যটি Google-এর মোবাইল অ্যাপ, Google অনুসন্ধান উইজেট এবং Google সহকারীর মধ্যে তৈরি করা হয়েছে৷ অ্যাপের মাধ্যমে এটি অ্যাক্সেস করতে, মাইক্রোফোন আইকনে আলতো চাপুন এবং বলুন "এই গানটি কী?" "একটি গান খুঁজুন" বোতাম নির্বাচন করাও কাজ করে৷
সঠিকভাবে কাজ করতে, বৈশিষ্ট্যটির জন্য আপনাকে কমপক্ষে 10-15 সেকেন্ডের জন্য গুনগুন করতে হবে। অ্যান্ড্রয়েড ব্যবহারকারীরা 20 টিরও বেশি ভাষায় গান খুঁজে পেতে পারেন, যখন শুধুমাত্র ইংরেজি গান আইফোনে কাজ করে। টুলটি সবসময় একটি গানকে সরাসরি শনাক্ত করতে সক্ষম হয় না, কিন্তু একবার এটি হয়ে গেলে, ফলাফলগুলি বেশ ভাল হয়৷
"ভেরিয়েবলের বিস্তৃত সেটের অর্ধেকেরও বেশি গান (টোন, পিচ, ভলিউম, ইত্যাদি) আমাদের অ্যালগরিদম দ্বারা স্বীকৃত, তবে অবশ্যই, নির্ভুলতা গুনগুনের গুণমানের উপর নির্ভর করে, গান, এবং আরও অনেক কিছু," গুগলের মুখপাত্র একটি ইমেলে লাইফওয়্যারকে বলেছেন। "কিন্তু একবার এটি স্বীকৃত হলে, মোটামুটি পাঁচটি উত্তরের মধ্যে চারটি সঠিক।"
যদিও, সঙ্গীত শনাক্তকারী অ্যাপে এই প্রথমবার গুনগুন ব্যবহার করা হয়নি।সাউন্ডহাউন্ড একটি অনুরূপ বৈশিষ্ট্য অফার করে, যেমনটি সিএনএন বিজনেস দ্বারা উল্লেখ করা হয়েছে এবং এটি অ্যান্ড্রয়েড এবং আইওএস-এও উপলব্ধ। গুগলের মুখপাত্রের মতে, নতুন বৈশিষ্ট্যটি কোনও গোপনীয়তার উদ্বেগ বাড়ায় না, বা এটি "গুগল যেভাবে অডিও-ভিত্তিক ইন্টারঅ্যাকশন পরিচালনা করে তা পরিবর্তন করে না," তারা লাইফওয়্যারকে একটি ইমেলে বলেছিল।
মেশিন লার্নিং
ধারণার সরলতা সত্ত্বেও, স্টুডিও রেকর্ডিং খুঁজে পেতে একটি সুর গুনগুন করা প্রযুক্তিগতভাবে বেশ কঠিন। এর বেশ কয়েকটি কারণ রয়েছে, 12 নভেম্বরের একটি ব্লগ পোস্টে গুগল রিসার্চের ক্রিশ্চিয়ান ফ্রাঙ্ক ব্যাখ্যা করেছেন। প্রথমত, গানের একটি গুনগুন করা সংস্করণ প্রকৃত রেকর্ডিং থেকে অনেকটাই আলাদা হতে পারে, যা দুটির সাথে মিল করা কঠিন করে তোলে। সুতরাং, যখন আপনি একটি রেস্টুরেন্ট বা অন্য পাবলিক প্লেসে শুনছেন সেই গানটি শনাক্ত করার জন্য Shazam এবং অন্যান্য অ্যাপের একটি হোস্ট ইতিমধ্যেই বিদ্যমান, সেই অনুসন্ধানের ভিত্তি হিসাবে একটি গুঞ্জন সুর ব্যবহার করা আরও জটিল হতে পারে৷
"গানের কথা, ব্যাকগ্রাউন্ড ভোকাল এবং যন্ত্রের সাহায্যে, একটি মিউজিক্যাল বা স্টুডিও রেকর্ডিংয়ের অডিও একটি গুনগুন করা সুর থেকে বেশ আলাদা হতে পারে," ফ্র্যাঙ্ক লিখেছেন।"ভুল বা নকশা দ্বারা, যখন কেউ একটি গানের তাদের ব্যাখ্যাকে গুনগুন করে, প্রায়শই পিচ, কী, টেম্পো বা তাল সামান্য বা এমনকি উল্লেখযোগ্যভাবে পরিবর্তিত হতে পারে।"
যেহেতু গানের গুনগুন করা সংস্করণগুলি আসল থেকে এতটাই আলাদা হতে পারে, ফ্র্যাঙ্ক নোট করেছেন যে অনেক অতীত পদ্ধতিতে একজন ব্যক্তির গুনগুনের সাথে গানের একটি সংস্করণের সাথে মিলিত হওয়া প্রয়োজন যেটিতে শুধুমাত্র একটি সুর রয়েছে বা একটি ট্র্যাক যার মধ্যে গুনগুন অন্তর্ভুক্ত রয়েছে। এটি বাস্তব-বিশ্বের ব্যবহারের ক্ষেত্রে চ্যালেঞ্জিং করে তুলেছে, কারণ এই গানগুলির ডেটাবেস সীমিত হতে পারে এবং ম্যানুয়ালি আপডেট করা প্রয়োজন৷
Google ব্যাখ্যা করে যে হাম টু সার্চ বৈশিষ্ট্যের জন্য, এটি অডিওকে "সংখ্যা-ভিত্তিক ক্রম"-এ পরিণত করতে মেশিন লার্নিং মডেল ব্যবহার করে যা গানের সুরকে প্রতিনিধিত্ব করে- যা বলে তা "আঙুলের ছাপ" হিসাবে ভাবা যেতে পারে"
আরো ব্যবহারকারী-বান্ধব
Google-এর হাম টু সার্চ ফিচারে মেশিন লার্নিংয়ের ব্যবহার শেষ পর্যন্ত টুলটিকে বাস্তব জগতে ব্যবহার করা অনেক সহজ করে তোলে।যেহেতু হাম টু সার্চ প্রকৃত গানের সাথে অনুসন্ধানকারীর গুনগুন করা সুরের সাথে মিলে যায়, তাই টুলটি নতুন গানগুলির সাথে কাজ করতে সক্ষম হয় কারণ সেগুলি একটি ডাটাবেসের পরিবর্তে প্রকাশ করা হয় যা ক্রমাগত প্রতিটি ট্র্যাকের হামড সংস্করণগুলির সাথে আপডেট করা প্রয়োজন৷ এছাড়াও, এটি ব্যবহার করার জন্য আপনার নিখুঁত পিচের প্রয়োজন নেই।
"বর্তমান সিস্টেমটি একটি গানের ডাটাবেসে উচ্চ স্তরের নির্ভুলতায় পৌঁছেছে যাতে অর্ধ মিলিয়নেরও বেশি গান রয়েছে যা আমরা ক্রমাগত আপডেট করছি," গুগল তার হাম টু সার্চ ঘোষণায় বলেছে৷ "এই গানের কর্পাসটিতে এখনও বিশ্বের অনেক সুর অন্তর্ভুক্ত করার জায়গা আছে।"