রিয়েল-টাইম সাবটাইটেল এবং অনুবাদ ভিডিও চ্যাটের ভবিষ্যত হতে পারে

সুচিপত্র:

রিয়েল-টাইম সাবটাইটেল এবং অনুবাদ ভিডিও চ্যাটের ভবিষ্যত হতে পারে
রিয়েল-টাইম সাবটাইটেল এবং অনুবাদ ভিডিও চ্যাটের ভবিষ্যত হতে পারে
Anonim

প্রধান টেকওয়ে

Facebook

  • এটি নিখুঁত থেকে অনেক দূরে তবে ইতিমধ্যেই যথেষ্ট ভাল৷
  • সাবটাইটেলগুলি অ্যাক্সেসযোগ্যতার জন্য দুর্দান্ত৷
  • Image
    Image

    Navi এমন একটি অ্যাপ যা আপনার ফেসটাইম কলে লাইভ সাবটাইটেল এবং রিয়েল-টাইম অনুবাদ যোগ করে।

    আপনার ফেসটাইম কলগুলিতে 20টি ভাষায় সাবটাইটেল এবং অনুবাদ যোগ করতে অ্যাপটি শেয়ারপ্লে এবং বিল্ট-ইন স্পিচ রিকগনিশন ব্যবহার করে।এটি SharePlay-এর একটি অবিশ্বাস্য ব্যবহার, যাকে আমাদের বেশিরভাগই অন্য জায়গার লোকেদের সাথে সিঙ্ক করা সিনেমা দেখার একটি ছলনামূলক উপায় হিসাবে বিবেচনা করে। আপনার এখনও আপনার অনুবাদককে বরখাস্ত করার প্রয়োজন নাও হতে পারে, তবে একটি অ্যাপ যা এটি ভাল করে তা অত্যন্ত কার্যকর হতে পারে৷

    "আমি ফেসটাইম কল থেকে অডিও পাচ্ছি না," টুইটারে Navi ডেভেলপার জর্ডি ব্রুইন লিখেছেন, "কিন্তু কলে অংশগ্রহণকারীদের মধ্যে শেয়ার করার জন্য শেয়ারপ্লে ব্যবহার করছি।"

    শেয়ার প্লে

    SharePlay হল iOS 15 এবং macOS 12.1-এ একটি নতুন বৈশিষ্ট্য যা আপনাকে FaceTime কলগুলিতে জিনিসগুলি ভাগ করতে এবং সিঙ্ক্রোনাইজ করতে দেয়৷ উপরের মুভি দেখার উদাহরণের সাহায্যে, যেকোন অংশগ্রহণকারী মুভিটি বিরতি দিতে বা চালাতে পারেন, উদাহরণস্বরূপ, যখন আপনি ফেসটাইম কলে চ্যাট করছেন। ফেসটাইম ভিডিওটি একটি ছোট, ভাসমান, পিকচার-ইন-পিকচার প্যানেলে খোলা থাকে এবং প্রতিটি অংশগ্রহণকারী তাদের ডিভাইসে স্থানীয়ভাবে অ্যাপটি চালায়। SharePlay-এর কৌশল হল এই স্থানীয় অ্যাপগুলিতে যা কিছু ঘটছে তা সিঙ্ক করা, তাই প্রত্যেকেই অভিজ্ঞতা ভাগ করে নেয়, এটি একটি চলচ্চিত্র, একটি ফিটনেস+ ওয়ার্কআউট বা স্প্রেডশীট হোক।

    Navi একই প্রযুক্তি ব্যবহার করে, শুধুমাত্র ইন-কল অ্যাপ কোনো সিনেমা নয়-এটি একটি রিয়েল-টাইম অনুবাদ ইঞ্জিন। এটি ব্যবহার করতে, আপনি একটি ফেসটাইম কলে থাকাকালীন অ্যাপটি চালু করুন এবং 'সাবটাইটেল চালু করুন' বোতামটি আলতো চাপুন। তারপরে, অন্যান্য অংশগ্রহণকারীরাও অ্যাকশনে যোগ দিতে পারেন এবং বর্তমান স্পিকারের জন্য লাইভ সাবটাইটেল দেখতে পারেন। যদি কেউ একচেটিয়া কথা বলে, তবে তাদের বক্তৃতা বুদবুদ বেড়ে যায় এবং একটু বেশি সময় লেগে থাকে।

    Image
    Image

    বধিরদের জন্য, এর অর্থ লোকেদের ডাকা বা না করার মধ্যে পার্থক্য হতে পারে। এবং যে কারো জন্য, এর অর্থ হল আপনি এমন লোকেদের মধ্যে দরকারী কথোপকথন করতে পারেন যারা ভাষা ভাগ করে না৷

    সর্বজনীন পাঠ

    ইন্টারনেট পাঠ্যের উপর নির্মিত, এবং এটি দুর্দান্ত। এটি ছোট এবং তৈরি করা, পড়া এবং অনুবাদ করা সহজ। সংশ্লেষিত বক্তৃতায় পরিণত করাও সহজ। ফলাফল হল যে কোন স্থান থেকে যে কেউ যে কোন কথোপকথনে অংশগ্রহণ করতে পারে। ভাষা কোনো বাধা নয়, এবং বধিরতা বা কোনো ধরনের অন্ধত্বও নয়- যতক্ষণ না আপনি দৃষ্টিশক্তি বা শ্রবণশক্তির জন্য ভালো অ্যাক্সেসিবিলিটি টুল সহ একটি ডিভাইস ব্যবহার করছেন।

    কিন্তু উচ্চারিত শব্দ প্রক্রিয়া করা অনেক কঠিন। স্পিচ-টু-টেক্সট ডিকটেশন চিত্তাকর্ষক, তবে এটি তুলনামূলকভাবে সম্প্রতি যে সাধারণ বক্তৃতা স্বীকৃতি সাধারণ ব্যবহারের জন্য যথেষ্ট ভাল হয়েছে - অ্যাপলের অনুবাদ অ্যাপটি একটি ভাল উদাহরণ। iOS 15 এ প্রবর্তিত, এটি রিয়েল-টাইম অডিও অনুবাদ অফার করে। আমরা যদি এখনও বিদেশী ছুটিতে যাই, তাহলে তা নিখুঁত হবে।

    এখন আমরা কাজের জন্য এবং বন্ধুবান্ধব এবং পরিবারের সাথে যোগাযোগ রাখতে ভিডিও ব্যবহার করি। ভবিষ্যতে আমরা যেভাবে কাজ করি না কেন, ভিডিও কলের বাধা পুরোপুরি ভেঙে ফেলা হয়েছে। এটি এখন একটি সাধারণ হাতিয়ার, তবে এতে লিখিত যোগাযোগের সরঞ্জামগুলির অনেক সূক্ষ্মতার অভাব রয়েছে৷

    নাভির মতো কিছু, যা রিয়েল-টাইম সাবটাইটেল এবং অনুবাদ অফার করে, তা তাৎপর্যপূর্ণ হতে পারে। অ্যাক্সেসিবিলিটি একটি দিক, কিন্তু আপনি যাদের ভাষায় কথা বলেন না তাদের সাথে কথা বলার ক্ষমতা আন্তর্জাতিক ব্যবসাকে চমকপ্রদ মাত্রায় উন্মুক্ত করে।

    Image
    Image

    অ্যাকশনে

    আমি অ্যাপ ডেভেলপার, লেখক এবং শ্রবণ সহায়ক ব্যবহারকারী গ্রাহাম বোওয়ারের সাথে Navi পরীক্ষা করেছি। এটি বেশ ভাল কিন্তু এখনও সমালোচনামূলক কাজের জন্য প্রস্তুত নয়। কিছু ট্রান্সক্রিপশন হাস্যকরভাবে খারাপ এবং সম্পর্কযুক্ত খুব অশ্লীল ছিল। যদিও আমাদের কথোপকথন চলতে থাকে, তার বক্তৃতাকে সঠিকভাবে চিনতে এটি অনেক ভালো হয়ে গিয়েছিল। এটি বোধগম্য কারণ iOS ডিক্টেশন ইঞ্জিন সময়ের সাথে সাথে আপনার ভয়েসের সাথে খাপ খায়৷

    অনুবাদটিও কাজ করেছে, যদিও এর অনুবাদের গুণমান ইনপুটের নির্ভুলতার উপর নির্ভর করে।

    এই সপ্তাহে ভবিষ্যতের অ্যাপল চশমা বা যে কোনো গুজব AR/VR প্রোডাক্ট কাজ করছে তাতে এই ধরনের প্রযুক্তি প্রজেক্ট করা সহজ৷

    আমাদের কথোপকথনের সময় বোয়ার বলেন, "আমি এটি এআর চশমায় কাজ করছে দেখতে পাচ্ছি।" "কিছু লোক, এমনকি সাধারণ শ্রবণশক্তির সাথেও, চলচ্চিত্রে সাবটাইটেল পছন্দ করে। এটি বাস্তব জীবনের সাবটাইটেলের মতো হবে।"

    একটি চিত্তাকর্ষক প্রযুক্তির ডেমো থাকাকালীন, Navi এখনও সেখানে নেই। নির্ভরযোগ্য ব্যবসায়িক ব্যবহারের জন্য, অ্যাপলের প্রাথমিক বক্তৃতা স্বীকৃতি অনেক বেশি সঠিক হতে হবে। কিন্তু গতির দিক থেকে, এটা ঠিক আছে, এবং অনুবাদগুলো যে কোনোটির মতোই ভালো।

    কিন্তু আমরা এখন পথে আছি, এবং এই ধরনের জিনিস শুধুমাত্র ভাল হবে।

    প্রস্তাবিত: