এই সুপার-ইম্প্রেসিভ এআই অডিওবুক ভয়েসগুলি কি ভাল বা খারাপ?

সুচিপত্র:

এই সুপার-ইম্প্রেসিভ এআই অডিওবুক ভয়েসগুলি কি ভাল বা খারাপ?
এই সুপার-ইম্প্রেসিভ এআই অডিওবুক ভয়েসগুলি কি ভাল বা খারাপ?
Anonim

প্রধান টেকওয়ে

  • DeepZen পাঠ্য থেকে চমকপ্রদ বাস্তবসম্মত অডিওবুক তৈরি করতে AI (কৃত্রিম বুদ্ধিমত্তা) ব্যবহার করে৷
  • বিল্ডিং ব্লকগুলি প্রদান করতে প্রযুক্তি প্রকৃত মানব ভয়েস অভিনেতা ব্যবহার করে৷
  • Amazon এবং Audible বর্তমানে কম্পিউটার দ্বারা তৈরি অডিওবুক গ্রহণ করে না।
Image
Image

DeepZen হল এমন একটি কোম্পানি যা অডিওবুকে ব্যবহৃত কম্পিউটার ভয়েস তৈরি করে, যা মানব অভিনেতাদের বাস্তব কণ্ঠের উপর ভিত্তি করে। গুণমানটি ভীতিকর-এক সময়ে ঘন্টার জন্য শোনার জন্য যথেষ্ট সহজ।এখানে কৌশলটি হল AI (কৃত্রিম বুদ্ধিমত্তা) উপাদান, যা পাঠ্যটি পড়তে পারে এবং প্রেক্ষাপটের ভিত্তিতে সঠিক মানসিক প্রতিক্রিয়া অনুমান করতে পারে। এটি তখন সেই আবেগকে কণ্ঠে রাখে।

এটি চিত্তাকর্ষক এবং খুব সুবিধাজনক। কিন্তু আমরা কি সত্যিই একটি সমজাতীয় অডিওবুকের অভিজ্ঞতা চাই? আর সেই ভয়েস অভিনেতাদের কী হবে?

"ইন্ডি প্রকাশকের দৃষ্টিকোণ থেকে, অডিওবুক উৎপাদনের খরচ কমিয়ে দেয় এমন কিছু খুবই আকর্ষণীয়," স্বাধীন প্রকাশক কার্লাইল মিডিয়ার মালিক রিক কার্লাইল ইমেলের মাধ্যমে লাইফওয়্যারকে বলেছেন৷

"কিন্তু সেই আকর্ষণ অনুমান করে যে পণ্যটি ঐতিহ্যগত বর্ণনার সমান মানের হবে। আমি মনে করি না যে আমরা এখনও সেখানে একশো শতাংশ আছি। আমাকে ভুল করবেন না, ডিপজেন আশ্চর্যজনকভাবে ভাল। এটি একটি অসাধারণ অগ্রগতি, এবং এর নির্মাতারা প্রচুর প্রশংসা এবং সাফল্যের দাবিদার। কিন্তু এটি এখনও নিখুঁত নয়।"

অডিও এটা 'যথেষ্ট ভালো'

DeepZen-এর গুণমান বোঝার সর্বোত্তম উপায় হল নমুনাগুলি শোনা৷আপনি যদি না জানতেন যে সেগুলি কম্পিউটার দ্বারা তৈরি, আপনি হয়তো বুঝতেও পারবেন না। যাইহোক কিছুক্ষণের জন্য নয়। ধরা যাক যে ডিপজেনের এআই নিখুঁত এবং এটি কখনই আবেগপূর্ণ নোটগুলির ভুল ব্যাখ্যা করে না যা আঘাত করার কথা।

Image
Image

এমনকি, একজন মানুষ আরও সূক্ষ্ম এবং প্রায়ই আরও আশ্চর্যজনক ব্যাখ্যা দিতে পারে। একজন অভিনেতা এমন শব্দগুলিতে একটি অপ্রত্যাশিত মোচড় দিতে পারে যা কম্পিউটার কখনই বিবেচনা করবে না। এবং বাস্তবে, AI ব্যাখ্যাটি অবশ্যই একজন পেশাদার ভয়েস অভিনেতার মতো ভাল নয়।

"একজন হিসাবে যিনি চলচ্চিত্রে কাজ করেন এবং অতি সম্প্রতি অডিও বর্ণনার জগতে, যখন আমি AI-তে মুগ্ধ হয়েছি- আমি জানি যে অর্থের গভীরতা রয়েছে যা একটি মেশিন ব্যাখ্যা করতে পারে না," পেশাদার ভয়েস অভিনেতা পল ক্র্যাম ইমেলের মাধ্যমে লাইফওয়্যারকে জানিয়েছেন৷

"এটি কি অজানা লেখকদের সংখ্যা বৃদ্ধি পাবে? আমি গ্যারান্টি দিচ্ছি কারণ এটি 'যথেষ্ট ভালো'""

যথেষ্ট ভাল হওয়া, সুবিধা এবং খরচ সাশ্রয়ের সাথে মিলিত হওয়া, ইন্ডি প্রকাশকদের পরিষেবাতে চালিত করার জন্য যথেষ্ট হতে পারে৷

"অডিওবুকগুলির প্রতি সমাপ্ত ঘন্টার অডিওর জন্য $500 পর্যন্ত খরচ হতে পারে (সেলিব্রিটি ভয়েসের জন্য অনেক বেশি), এবং এতে ব্যবস্থাপনা এবং প্রশাসকের সময় ব্যয় অন্তর্ভুক্ত নয়," কার্লাইল বলেছেন৷ "ডিপজেনের মতো একটি প্রদানকারীর কাছে একটি পাণ্ডুলিপি আপলোড করে সেই খরচ অর্ধেক করতে সক্ষম হওয়া অত্যন্ত আকর্ষণীয়।"

কথা বলতে সমস্যা

এটি এখনও আপনার ভয়েস অভিনেতাদের বরখাস্ত করা এবং ডিপজেনে পাণ্ডুলিপি আপলোড করার মতো সহজ নয়৷ সহজ অডিওবুক এআই বক্তৃতার ক্ষেত্রে বর্তমানে একটি বাধা রয়েছে এবং এটি অ্যামাজন থেকে।

Image
Image

"বর্তমানে, ACX, শ্রবণযোগ্য এবং অ্যামাজন অডিওবুক বিতরণের স্ব-প্রকাশকের রুট, এমন অডিওবুক গ্রহণ করবে না যা একজন মানুষ রেকর্ড করেনি," কার্লাইল বলেছেন৷

কেন? গুণমান। এখানে ওয়েবসাইট থেকে প্রায়শই জিজ্ঞাসিত প্রশ্ন এন্ট্রি আছে:

"টেক্সট-টু-স্পিচ বা অন্যান্য স্বয়ংক্রিয় রেকর্ডিং অনুমোদিত নয়৷ শ্রবণযোগ্য শ্রোতারা উপাদানের পাশাপাশি গল্পের পারফরম্যান্সের জন্য অডিওবুকগুলি বেছে নেয়৷ সেই প্রত্যাশা পূরণ করতে, আপনার অডিওবুক অবশ্যই একজন মানুষের দ্বারা রেকর্ড করা উচিত৷"

এর অর্থ হল ডিপজেন-জেনারেট করা অডিওবুকগুলি অন্তত আপাতত বন্ধ। এটি বিশুদ্ধ অনুমান, কিন্তু ডিপজেনকে আমাজনের জন্য একটি বেশ ভাল অধিগ্রহণ বলে মনে হবে, এটিকে পরিষেবা বিক্রি করতে দেয় এবং এটি শুধুমাত্র শ্রবণযোগ্য বইগুলির জন্য রেখে দেয়। এবং তা না ঘটলেও, কম্পিউটার-জেনারেটেড অডিওবুকগুলির মান যদি এর মতোই ভাল হয়, তবে এই নিয়মের ব্যতিক্রম না করার খুব কম কারণই মনে হয়।

আপনি কি এইভাবে তৈরি অডিওবুকগুলি শুনে খুশি হবেন? যখন এটি ঘটবে, বেশিরভাগ লোকেরা সন্দেহও করবে না। কেউ কেউ কম্পিউটার-উত্পাদিত ভয়েসের নিখুঁততা পছন্দ করতে পারে কারণ তারা ভোকাল টিক্স এবং অভ্যাস থেকে মুক্ত থাকবে যা কখনও কখনও বিভ্রান্ত করতে পারে। প্রযুক্তিটি ভিডিও গেম, টিভি এবং রেডিও বিজ্ঞাপন এবং অন্য যেকোন দৃশ্যের জন্যও উপযুক্ত যেখানে আপনি একজন ভয়েস অভিনেতা ভাড়া করতে চান।

DeepZen এর প্রযুক্তি লিখিত নিবন্ধগুলি থেকে স্বয়ংক্রিয়ভাবে সংবাদ পডকাস্ট তৈরি করার একটি দুর্দান্ত উপায় তৈরি করবে, যা যাতায়াতের জন্য সুবিধাজনক হতে পারে।

আর সেই ভয়েস অভিনেতাদের কী হবে? ঠিক আছে, অন্তত একটি সুযোগ থাকবে: তারা ডিপজেনের হয়ে কাজ করতে পারে।

প্রস্তাবিত: