NVIDIA-এর নতুন NeRF প্রযুক্তি মেটাভার্সে সাহায্য করতে পারে

সুচিপত্র:

NVIDIA-এর নতুন NeRF প্রযুক্তি মেটাভার্সে সাহায্য করতে পারে
NVIDIA-এর নতুন NeRF প্রযুক্তি মেটাভার্সে সাহায্য করতে পারে
Anonim

প্রধান টেকওয়ে

  • Nvidia সম্প্রতি একটি কৌশল দেখিয়েছে যা মাত্র সেকেন্ডের মধ্যে 2D ফটোগুলিকে 3D দৃশ্যে পরিণত করে৷
  • বাস্তব জগতে আলো কীভাবে আচরণ করে তা অনুমান করতে পদ্ধতিটি কম্পিউটার শক্তি ব্যবহার করে৷
  • মেটাভার্স হল এমন একটি ক্ষেত্র যেখানে 3D দৃশ্যগুলি সহায়ক কারণ সেগুলি যেকোন ক্যামেরার দৃষ্টিকোণ থেকে দেখা যায়৷
Image
Image

Nvidia-এর নতুন কৃত্রিম বুদ্ধিমত্তা (AI) প্রযুক্তি শীঘ্রই মাত্র সেকেন্ডের মধ্যে 2D ফটোগুলিকে 3D দৃশ্যে পরিণত করতে পারে, মেটাভার্সের মতো নিমজ্জিত ভার্চুয়াল স্পেস তৈরি করে যা ওয়ার্ড প্রসেসিংয়ের মতো তুচ্ছ৷

Nvidia সম্প্রতি ইন্সট্যান্ট এনআরএফ নামক ফটো পদ্ধতি প্রদর্শন করেছে, যা বাস্তব জগতে আলো কীভাবে আচরণ করে তা অনুমান করতে কম্পিউটিং শক্তি ব্যবহার করে। এটি আপনার পুরানো ফটোগুলিকে একটি ভিডিও গেমের দৃশ্যে রূপান্তরিত করতে পারে, অথবা এটি বাস্তব-বিশ্বের বস্তুর আকার এবং আকৃতি বোঝার জন্য রোবট এবং স্ব-চালিত গাড়িকে প্রশিক্ষণ দিতে ব্যবহার করা যেতে পারে৷

"3D ইমেজিং রূপান্তরের একটি নতুন জগত নিয়ে আসে," Oren Debbi, Visionary.ai-এর সিইও, একটি কম্পিউটার ভিশন কোম্পানি যা এনভিডিয়া প্ল্যাটফর্মে তার 3D অ্যালগরিদম চালায়, একটি ইমেল সাক্ষাত্কারে Lifewire-কে জানিয়েছেন৷ "3D ব্যবহার করে, আপনি দৃশ্যের মধ্যে বাস্তব-বিশ্বের গভীরতা অনুকরণ করেন এবং চিত্রটিকে আরও জীবন্ত এবং বাস্তবসম্মত করে তোলেন। এআর/ভিআর এবং শিল্প ক্যামেরা ছাড়াও, যেখানে 3D খুব সাধারণ, আমরা এখন এটি প্রায় প্রতিটি স্মার্টফোনে ব্যবহার করা দেখতে পাচ্ছি ব্যবহারকারী এমনকি জানেন।"

মাত্রা যোগ করা হচ্ছে

প্রথম তাত্ক্ষণিক ছবি, একটি পোলারয়েড ক্যামেরা দিয়ে 75 বছর আগে তোলা, যার লক্ষ্য 3D বিশ্বকে একটি 2D ছবিতে দ্রুত ক্যাপচার করা। এখন, এআই গবেষকরা বিপরীতে কাজ করছেন: স্থির চিত্রের সংগ্রহকে সেকেন্ডের মধ্যে ডিজিটাল 3D দৃশ্যে পরিণত করা।

বিপরীত রেন্ডারিং হিসাবে পরিচিত, এই প্রক্রিয়াটি বাস্তব জগতে আলো কীভাবে আচরণ করে তা অনুমান করতে AI ব্যবহার করে, গবেষকদের বিভিন্ন কোণে তোলা মুষ্টিমেয় 2D চিত্র থেকে একটি 3D দৃশ্য পুনর্গঠন করতে সক্ষম করে৷ এনভিডিয়া দাবি করেছে যে এটি এমন একটি পদ্ধতি তৈরি করেছে যা প্রায় সঙ্গে সঙ্গে এই কাজটি সম্পন্ন করে৷

Nvidia নিউরাল রেডিয়েন্স ফিল্ড বা NeRF নামে একটি নতুন প্রযুক্তির মাধ্যমে এই পদ্ধতি ব্যবহার করেছে। সংস্থাটি বলেছে যে ফলাফল, ডাব ইনস্ট্যান্ট এনআরএফ, এখন পর্যন্ত দ্রুততম এনআরএফ কৌশল। মডেলটির কয়েক ডজন স্থির ফটোতে প্রশিক্ষণের জন্য মাত্র সেকেন্ডের প্রয়োজন হয় এবং তারপরে দশ মিলিসেকেন্ডের মধ্যে 3D দৃশ্য রেন্ডার করতে পারে।

"যদি বহুভুজ জালের মতো প্রথাগত 3D উপস্থাপনাগুলি ভেক্টর চিত্রের মতো হয়, NeRFগুলি বিটম্যাপ চিত্রগুলির মতো: তারা একটি বস্তু থেকে বা একটি দৃশ্যের মধ্যে যেভাবে আলো বিকিরণ করে তা ঘনভাবে ক্যাপচার করে," ডেভিড লুয়েবকে, গ্রাফিক্স গবেষণার ভাইস প্রেসিডেন্ট এনভিডিয়া, একটি সংবাদ বিজ্ঞপ্তিতে বলেছে৷ “সেই অর্থে, তাত্ক্ষণিক এনআরএফ 3D এর জন্য ততটা গুরুত্বপূর্ণ হতে পারে যতটা ডিজিটাল ক্যামেরা এবং JPEG কম্প্রেশন 2D ফটোগ্রাফির জন্য হয়েছে - 3D ক্যাপচার এবং ভাগ করে নেওয়ার গতি, স্বাচ্ছন্দ্য এবং নাগাল ব্যাপকভাবে বৃদ্ধি করেছে৷”

NeRF খাওয়ানোর জন্য ডেটা সংগ্রহ করার জন্য নিউরাল নেটওয়ার্কের প্রয়োজন হয় দৃশ্যের চারপাশে একাধিক অবস্থান থেকে তোলা কয়েক ডজন ছবি, সেইসাথে সেই শটের প্রতিটির ক্যামেরার অবস্থান।

NeRF একটি ছোট নিউরাল নেটওয়ার্ককে থ্রিডি স্পেসের যেকোন বিন্দু থেকে যেকোন দিক থেকে আলোর রঙের পূর্বাভাস দিয়ে দৃশ্যটি পুনর্গঠনের জন্য প্রশিক্ষণ দেয়৷

3D এর আবেদন

মেটাভার্স হল এমন একটি ক্ষেত্র যেখানে 3D দৃশ্যগুলি দরকারী কারণ সেগুলি যে কোনও ক্যামেরার দৃষ্টিকোণ থেকে দেখা যায়, ব্র্যাড কুইন্টন, পারসেপ্টাস প্ল্যাটফর্ম ফর অগমেন্টেড রিয়েলিটি (AR) এর প্রতিষ্ঠাতা, লাইফওয়্যারকে একটি ইমেল সাক্ষাত্কারে বলেছেন৷ ঠিক যেমন আমরা বাস্তব জীবনে একটি ঘরের মধ্য দিয়ে হেঁটে যেতে পারি এবং এর বিষয়বস্তু বিভিন্ন কোণ থেকে দেখতে পারি, একটি পুনর্গঠিত 3D দৃশ্যের মাধ্যমে, আমরা কার্যত একটি স্থানের মধ্য দিয়ে যেতে পারি এবং যেকোনো দৃষ্টিকোণ থেকে দেখতে পারি।

Image
Image

"ভার্চুয়াল বাস্তবতায় ব্যবহারের জন্য পরিবেশ তৈরি করার জন্য এটি বিশেষভাবে কার্যকর হতে পারে," কুইন্টন বলেছেন৷

অ্যাপলের অবজেক্ট ক্যাপচারের মতো প্রোগ্রামগুলি 2D চিত্রগুলির একটি সিরিজ থেকে ভার্চুয়াল 3D অবজেক্ট তৈরি করতে ফটোগ্রামমেট্রি নামক একটি কৌশল ব্যবহার করে। 3D মডেলগুলি ভার্চুয়াল রিয়েলিটি এবং এআর অ্যাপ্লিকেশনগুলিতে ব্যাপকভাবে ব্যবহৃত হবে, কুইন্টন ভবিষ্যদ্বাণী করেছেন। উদাহরণস্বরূপ, কিছু এআই, পারসেপ্টাস এআর প্ল্যাটফর্মের মতো, বাস্তব বিশ্বের বোঝার জন্য 3D মডেল ব্যবহার করে, যা রিয়েল-টাইম এআর অ্যাপ্লিকেশনের জন্য অনুমতি দেয়।

3D চিত্রের ব্যবহার একটি দৃশ্যে বাস্তব-বিশ্বের গভীরতাকে অনুকরণ করে এবং ছবিটিকে আরও জীবন্ত এবং বাস্তবসম্মত করে তোলে, ডেবি বলেন। একটি বোকেহ প্রভাব (ওরফে পোর্ট্রেট মোড বা সিনেমাটিক মোড) তৈরি করতে, 3D গভীরতা ম্যাপিং প্রয়োজন। এই কৌশলটি প্রায় প্রতিটি স্মার্টফোনে ব্যবহৃত হয়৷

"এটি ইতিমধ্যেই পেশাদার ভিডিওগ্রাফারদের জন্য চলচ্চিত্রের চিত্রগ্রহণের মান, এবং এটি প্রতিটি ভোক্তার জন্য আদর্শ হয়ে উঠছে, " ডেবি যোগ করেছেন৷

প্রস্তাবিত: