প্রধান টেকওয়ে
- Facebook এর প্রযুক্তিগত সমস্যা দুর্ভাগ্যজনক ছিল, কিন্তু সমস্যাটি সম্ভবত আরও দ্রুত সমাধান হয়ে যেত যদি এটি এতগুলো আন্তঃসংযুক্ত সিস্টেমের উপর নির্ভর না করত।
- সিস্টেম ব্যর্থতা সম্পূর্ণরূপে প্রতিরোধ করার কোন উপায় নেই, তবে তাদের সম্ভাবনা কম করার উপায় রয়েছে।
- কোন সিস্টেম কখন ব্যর্থ হয় তার জন্য ব্যাকআপ প্ল্যান রাখা 'বিরক্তিকর' এবং 'বিপর্যয়কর' এর মধ্যে পার্থক্য করতে পারে।'
সাম্প্রতিক ফেসবুকের বিপর্যয় দেখায় যে কীভাবে আন্তঃসংযুক্ত সিস্টেমগুলি ব্যর্থ হতে বাধ্য এবং কেন আমাদের সবকিছুর জন্য সেগুলি ব্যবহার করা উচিত নয়৷
সোমবার কয়েক ঘণ্টার জন্য ফেসবুক, হোয়াটসঅ্যাপ এবং ইনস্টাগ্রাম হারানো অসুবিধাজনক, ব্যবসার জন্য ক্ষতিকর এবং কিছু ক্ষেত্রে প্রায় বিপর্যয়কর। ফেসবুকের মতে, এটি সবই তার নেটওয়ার্ক সমন্বয়কারী রাউটারে কনফিগারেশন পরিবর্তনের কারণে হয়েছে।
এটি একটি যুক্তিসঙ্গত ব্যাখ্যা, তবে সত্য যে এর মতো একটি একক ত্রুটি কেবল ফেসবুক নয়, ফেসবুকের মালিকানাধীন অন্যান্য সিস্টেমগুলিকে থামিয়ে দিতে পারে তা কিছুটা উদ্বেগজনক৷
একটি ভুল রাউটার কনফিগার পরিবর্তনের কারণে একাধিক পরিষেবা এবং এমনকি VR হেডসেটগুলি সম্পূর্ণরূপে কাজ করা বন্ধ করে দিয়েছে৷ সর্বোপরি, Facebook-এর নিজস্ব স্বীকারোক্তিতে, কোম্পানির ডেটা সেন্টারগুলি কীভাবে যোগাযোগ করে তার উপর এটি একটি ক্যাসকেডিং প্রভাব ফেলে, তাদের সমস্ত পরিষেবা বন্ধ করে দেয়৷
"আন্তঃসংযুক্ত সিস্টেমের উপর নির্ভরতা এটির সাথে সিস্টেম বা এমনকি পরিষেবা ব্যর্থতার অন্তর্নিহিত ঝুঁকি বহন করে," গ্লোবালডটসের সিনিয়র প্রযুক্তিগত বিক্রয় প্রকৌশলী ফ্রান্সেস্কো অল্টোমার লাইফওয়্যারের সাথে একটি ইমেল সাক্ষাত্কারে বলেছেন, "এই ভয়ঙ্কর ঝুঁকি মোকাবেলা করার জন্য, কোম্পানিগুলি SRE (সিস্টেম নির্ভরযোগ্যতা প্রকৌশল) নীতির পাশাপাশি অন্যান্য সরঞ্জামগুলি ব্যবহার করে, যেগুলি সমস্ত সিস্টেমের অবকাঠামোর প্রতিটি স্তরে তৈরি বিভিন্ন মাত্রার অপ্রয়োজনীয়তার সাথে মোকাবিলা করে৷"
কী ভুল হতে পারে
এটা লক্ষণীয় যে যখন এর মতো একটি সিস্টেম ব্যর্থ হয়, তখন এটির জন্য সাধারণত ভুল হয়ে যাওয়ার একটি নিখুঁত ঝড়ের প্রয়োজন হয়। এটি একটি তাসের ঘরের মতো যা পড়ে যাওয়ার জন্য অপেক্ষা করছে এবং একটি মহাকাশ স্টেশনে একটি উন্মুক্ত তাপ নিষ্কাশন বন্দরের মতো একটি ছোট চাঁদের আকারের মতো৷
অধিকাংশ কোম্পানি চেষ্টা করে এবং নিশ্চিত করার জন্য পদক্ষেপ নেয় যে একটি জিনিস যা সবকিছুকে বিশৃঙ্খলার মধ্যে ফেলে দিতে পারে তা কখনই ঘটে না-কিন্তু নির্বিশেষে, এটি ঘটতে পারে।
"অপ্রত্যাশিত ব্যর্থতাগুলি ব্যবসার একটি অংশ এবং কর্মীদের অবহেলা, ইন্টারনেট পরিষেবা প্রদানকারীর নেটওয়ার্কে ত্রুটি বা এমনকি ক্লাউড স্টোরেজ পরিষেবাগুলির সমস্যাগুলির ফলে উদ্ভূত হতে পারে," ফাস্টপিপলসার্চের সহ-প্রতিষ্ঠাতা স্যালি স্টিভেনস বলেছেন একটি ইমেইল ইন্টারভিউ।
"…যতক্ষণ সিস্টেম রক্ষার জন্য প্রয়োজনীয় পদক্ষেপগুলি- যেমন ব্যাকআপ, অন-সাইট রাউটার, এবং টায়ার্ড অ্যাক্সেস-স্থানে রাখা হয়, এই ব্যর্থতাগুলি খুব কমই।" এমনকি ব্যর্থ-নিরাপদ সেনাবাহিনীর সাথেও, লিঞ্চপিনের পক্ষে ব্যর্থ হওয়া এখনও সম্ভব।
যদি যোগাযোগের প্রাথমিক ফর্ম, যন্ত্রপাতি, দরজা ইত্যাদির মতো জিনিসগুলি নিয়ন্ত্রণ করে এমন সিস্টেম ব্যর্থ হয়, ফলাফলগুলি উল্লেখযোগ্য হতে পারে৷ মৃদু অসুবিধা থেকে সম্পূর্ণ বিপর্যয়কর পর্যন্ত, ব্যক্তি এবং সংস্থাগুলি কতটা নির্ভর করে তার উপর নির্ভর করে৷
"রিফ্রিজারেটর এবং ওভেন টোস্টারের মতো যেকোনও কম সুরক্ষিত ডিভাইস থেকে হ্যাকারদের সিস্টেমে প্রবেশের ঝুঁকি রয়েছে," স্টিভেনস যোগ করেছেন, "যা ডেটা চুরি এবং র্যানসমওয়্যার হতে পারে।"
আমরা কীভাবে প্রস্তুতি নিতে পারি
একটি সিস্টেম কখনই ব্যর্থ হবে না তার গ্যারান্টি দেওয়ার কোনও উপায় নেই, তবে এমন পদক্ষেপ রয়েছে যা ব্যর্থতার সম্ভাবনা কম করতে বা ব্যর্থতাকে আরও মসৃণভাবে মোকাবেলা করতে নেওয়া যেতে পারে।দুটি পন্থার সংমিশ্রণ যা ব্যর্থ-নিরাপদ এবং কন্টিনজেন্সি প্ল্যান এবং ব্যাকআপ সিস্টেমের সাথে পাল্টা ব্যবস্থা গ্রহণ করে তা আদর্শ হবে৷
"ফাইন্ডপিপলফাস্টের প্রতিষ্ঠাতা এবং প্রধান প্রযুক্তি কর্মকর্তা ড্যানিয়েলা সয়ার বলেছেন, "কার্যকরভাবে পরিচালনা করা তৃতীয়-পক্ষের পণ্য এবং পরিষেবাগুলির দ্বারা সৃষ্ট এই বিপদগুলি দূর করার জন্য, তৃতীয়-পক্ষের ঝুঁকি ব্যবস্থাপনা সংক্রান্ত ভূমিকা এবং কর্তব্যগুলি অবশ্যই কঠোরভাবে বর্ণনা করা উচিত" একটি ইমেল সাক্ষাত্কারে, "এই নতুন পরিবেশে বিকাশ লাভের জন্য, ঝুঁকি পরিচালকদের অবশ্যই এমন একটি পরিশীলিত বাস্তুতন্ত্রের প্রয়োজনীয় অংশগুলি উপলব্ধি করতে হবে।"
ফেসবুক, হোয়াটসঅ্যাপ, এবং ইনস্টাগ্রামের সাথে যা ঘটেছে তা দুর্ভাগ্যজনক, তবে আশা করা যায় চোখ খোলার মতো। যারা আন্তঃসংযুক্ত সিস্টেমের উপর নির্ভর করে তাদের অবশ্যই বুঝতে হবে যে সঠিক জিনিসটি ভুল হয়ে যাওয়া সবকিছুকে ব্যাহত করতে পারে। এবং এই ধরনের বাধাগুলিকে কম সম্ভাবনাময় এবং কম প্রভাবশালী করার জন্য ব্যবস্থাগুলি অবশ্যই স্থাপন করা উচিত (বা যাচাই করা এবং পরিমার্জিত)৷
Facebook এর ক্ষেত্রে, এর সমস্যাটি রাউটারের সমস্যা ছিল না, বরং এর প্রায় পুরো ইকোসিস্টেমটি অন্য সবকিছুর সাথে সংযুক্ত ছিল।এইভাবে, ফেসবুক (পরিষেবা) ডাউন থাকায়, ফেসবুককে (কোম্পানি) অনেক বেশি সময় এবং শক্তি ব্যয় করতে হয়েছিল কেবল সমস্যাটি সংগঠিত করতে এবং সমাধান করতে। যদি এটি এমন একটি গভীর-মূল, আন্তঃসংযুক্ত সিস্টেম ব্যবহার না করত বা এর মতো বিভ্রাট মোকাবেলা করার জন্য ব্যাকআপ পরিকল্পনা না থাকত, তবে এটি ঠিক করতে সম্ভবত অনেক কম সময় লাগত৷