একটি টি-পরীক্ষা হল শিক্ষার্থীর টি-ডিস্ট্রিবিউশন ব্যবহার করে ডেটাসেটের মধ্যে পরিসংখ্যানগতভাবে উল্লেখযোগ্য পার্থক্য আছে কিনা তা সিদ্ধান্ত নেওয়ার একটি উপায়। এক্সেলের টি-টেস্ট হল দুটি নমুনা টি-পরীক্ষা যা দুটি নমুনার মাধ্যমের তুলনা করে। এই নিবন্ধটি পরিসংখ্যানগত তাৎপর্যের অর্থ কী তা ব্যাখ্যা করে এবং কিভাবে এক্সেলে একটি টি-টেস্ট করতে হয় তা দেখায়।
এই নিবন্ধের নির্দেশাবলী Excel 2019, 2016, 2013, 2010, 2007-এ প্রযোজ্য; Microsoft 365 এবং Excel অনলাইনের জন্য Excel৷
পরিসংখ্যানগত তাৎপর্য কি?
কল্পনা করুন আপনি জানতে চান দুটি পাশার মধ্যে কোনটি ভালো স্কোর দেবে। আপনি প্রথম ডাই রোল করুন এবং একটি 2 পান; আপনি দ্বিতীয় ডাই রোল করুন এবং একটি 6 পান।এটি কি আপনাকে বলে যে দ্বিতীয় ডাই সাধারণত উচ্চ স্কোর দেয়? আপনি যদি উত্তর দেন, "অবশ্যই না," তাহলে আপনি ইতিমধ্যেই পরিসংখ্যানগত তাত্পর্য সম্পর্কে কিছুটা বুঝতে পেরেছেন। আপনি বুঝতে পারেন যে পার্থক্যটি স্কোরের এলোমেলো পরিবর্তনের কারণে হয়েছিল, প্রতিবার ডাই রোল করা হয়। কারণ নমুনাটি খুব ছোট ছিল (শুধুমাত্র একটি রোল) এটি উল্লেখযোগ্য কিছু দেখায়নি।
এখন কল্পনা করুন আপনি প্রতিটি ডাইকে ৬ বার রোল করবেন:
- প্রথম ডাই রোল 3, 6, 6, 4, 3, 3; গড়=4.17
- সেকেন্ড ডাই রোলস 5, 6, 2, 5, 2, 4; গড়=4.00
এটি কি এখন প্রমাণ করে যে প্রথম ডাই দ্বিতীয়টির চেয়ে বেশি স্কোর দেয়? সম্ভবত না. উপায়গুলির মধ্যে তুলনামূলকভাবে ছোট পার্থক্য সহ একটি ছোট নমুনা এটিকে র্যান্ডম বৈচিত্রের কারণে এখনও পার্থক্যের সম্ভাবনা তৈরি করে। আমরা ডাইস রোলের সংখ্যা বাড়ার সাথে সাথে প্রশ্নের একটি সাধারণ জ্ঞানের উত্তর দেওয়া কঠিন হয়ে পড়ে - স্কোরগুলির মধ্যে পার্থক্য কি এলোমেলো পরিবর্তনের ফলাফল নাকি একটি আসলে অন্যটির চেয়ে বেশি স্কোর দেওয়ার সম্ভাবনা বেশি?
তাৎপর্য হল সম্ভাব্যতা যে নমুনার মধ্যে একটি পর্যবেক্ষিত পার্থক্য এলোমেলো পরিবর্তনের কারণে। তাত্পর্যকে প্রায়শই আলফা স্তর বা সহজভাবে 'α' বলা হয়। আত্মবিশ্বাসের স্তর, বা সহজভাবে 'c,' হল সম্ভাব্যতা যে নমুনার মধ্যে পার্থক্য এলোমেলো পরিবর্তনের কারণে নয়; অন্য কথায়, অন্তর্নিহিত জনসংখ্যার মধ্যে পার্থক্য রয়েছে। অতএব: c=1 – α
আমরা তাত্পর্য প্রমাণ করেছি আত্মবিশ্বাসী বোধ করার জন্য আমরা যে স্তরে চাই 'α' সেট করতে পারি। প্রায়শই α=5% ব্যবহার করা হয় (95% আত্মবিশ্বাস), কিন্তু আমরা যদি সত্যিই নিশ্চিত হতে চাই যে কোনো পার্থক্য এলোমেলো পরিবর্তনের কারণে হয় না, তাহলে আমরা α=1% বা এমনকি α=0.1 ব্যবহার করে একটি উচ্চতর আত্মবিশ্বাসের স্তর প্রয়োগ করতে পারি। %.
বিভিন্ন পরিসংখ্যানগত পরীক্ষা বিভিন্ন পরিস্থিতিতে তাৎপর্য গণনা করতে ব্যবহৃত হয়। দুটি জনসংখ্যার মাধ্যম আলাদা কিনা তা নির্ধারণ করতে টি-টেস্ট ব্যবহার করা হয় এবং ভিন্নতা ভিন্ন কিনা তা নির্ধারণ করতে F-পরীক্ষা ব্যবহার করা হয়।
পরিসংখ্যানগত তাৎপর্যের জন্য পরীক্ষা কেন?
বিভিন্ন জিনিসের তুলনা করার সময়, একটি অন্যটির চেয়ে ভাল কিনা তা নির্ধারণ করতে আমাদের তাৎপর্য পরীক্ষা ব্যবহার করতে হবে। এটি অনেক ক্ষেত্রে প্রযোজ্য, উদাহরণস্বরূপ:
- ব্যবসায়, লোকেদের বিভিন্ন পণ্য এবং বিপণন পদ্ধতির তুলনা করতে হবে।
- খেলাধুলায়, মানুষকে বিভিন্ন সরঞ্জাম, কৌশল এবং প্রতিযোগীদের তুলনা করতে হবে।
- ইঞ্জিনিয়ারিংয়ে, লোকেদের বিভিন্ন ডিজাইন এবং প্যারামিটার সেটিংস তুলনা করতে হবে।
আপনি যদি পরীক্ষা করতে চান যে কোনো কিছুর থেকে কোনো কিছুর চেয়ে ভালো পারফর্ম করে কিনা, আপনাকে পরিসংখ্যানগত তাৎপর্য পরীক্ষা করতে হবে।
একজন ছাত্রের টি-ডিস্ট্রিবিউশন কি?
একজন শিক্ষার্থীর টি-বন্টন একটি সাধারণ (বা গাউসিয়ান) বিতরণের অনুরূপ। এই দুটিই ঘণ্টা-আকৃতির ডিস্ট্রিবিউশন যার বেশিরভাগ ফলাফলই গড়র কাছাকাছি, কিন্তু কিছু বিরল ঘটনা উভয় দিকেই গড় থেকে বেশ দূরে, যাকে ডিস্ট্রিবিউশনের লেজ হিসাবে উল্লেখ করা হয়।
শিক্ষার্থীর টি-বন্টনের সঠিক আকৃতি নমুনার আকারের উপর নির্ভর করে। 30 টিরও বেশি নমুনার জন্য এটি সাধারণ বিতরণের মতোই। নমুনার আকার ছোট হওয়ার সাথে সাথে লেজগুলি বড় হয়ে যায়, যা একটি ছোট নমুনার উপর ভিত্তি করে অনুমান করা থেকে আসা বর্ধিত অনিশ্চয়তার প্রতিনিধিত্ব করে৷
এক্সেলে টি-টেস্ট কিভাবে করবেন
দুটি নমুনার মাধ্যমের মধ্যে পরিসংখ্যানগতভাবে উল্লেখযোগ্য পার্থক্য আছে কিনা তা নির্ধারণ করতে আপনি একটি টি-টেস্ট প্রয়োগ করার আগে, আপনাকে প্রথমে একটি F-টেস্ট করতে হবে। এর কারণ টি-টেস্টের জন্য বিভিন্ন গণনা করা হয় ভিন্নতার মধ্যে উল্লেখযোগ্য পার্থক্য আছে কিনা তার উপর নির্ভর করে।
এই বিশ্লেষণটি সম্পাদন করতে আপনার বিশ্লেষণ টুলপ্যাক অ্যাড-ইন সক্রিয় করতে হবে।
অ্যানালাইসিস টুলপ্যাক অ্যাড-ইন চেক করা এবং লোড করা হচ্ছে
অ্যানালাইসিস টুলপ্যাক চেক করতে এবং সক্রিয় করতে এই ধাপগুলি অনুসরণ করুন:
- FILE ট্যাবটি নির্বাচন করুন > বিকল্প।
- অপশন ডায়ালগ বক্সে, বাম দিকের ট্যাব থেকে Add-Ins নির্বাচন করুন।
-
উইন্ডোর নীচে, ম্যানেজ ড্রপ-ডাউন মেনু নির্বাচন করুন, তারপরে Excel অ্যাড-ইনস নির্বাচন করুন। বেছে নিন যান।
- Analysis Toolpak এর পাশের চেক-বক্সটি নিশ্চিত করুন, তারপরে ঠিক আছে। নির্বাচন করুন।
- অ্যানালাইসিস টুলপ্যাক এখন সক্রিয় এবং আপনি এফ-টেস্ট এবং টি-টেস্ট প্রয়োগ করতে প্রস্তুত।
এক্সেলে একটি এফ-টেস্ট এবং একটি টি-টেস্ট করা
-
একটি স্প্রেডশীটে দুটি ডেটাসেট লিখুন। এই ক্ষেত্রে, আমরা এক সপ্তাহে দুটি পণ্যের বিক্রয় বিবেচনা করছি। প্রতিটি পণ্যের জন্য গড় দৈনিক বিক্রয় মূল্যও গণনা করা হয়, এর মানক বিচ্যুতি সহ।
-
ডেটা ট্যাব > ডেটা বিশ্লেষণ নির্বাচন করুন
-
তালিকা থেকে F-পরীক্ষার জন্য দুটি-নমুনা নির্বাচন করুন, তারপর বেছে নিন ঠিক আছে।
এফ-টেস্ট অ-স্বাভাবিকতার জন্য অত্যন্ত সংবেদনশীল। তাই এটি একটি Welch পরীক্ষা ব্যবহার করা নিরাপদ হতে পারে, কিন্তু এটি Excel এ আরো কঠিন৷
-
ভেরিয়েবল 1 রেঞ্জ এবং ভ্যারিয়েবল 2 রেঞ্জ নির্বাচন করুন; আলফা সেট করুন (0.05 95% আত্মবিশ্বাস দেয়); আউটপুটের উপরের বাম কোণে একটি ঘর নির্বাচন করুন, এটি বিবেচনা করে যে এটি 3টি কলাম এবং 10টি সারি পূরণ করবে। বেছে নিন ঠিক আছে।
ভেরিয়েবল 1 রেঞ্জের জন্য, সবচেয়ে বড় স্ট্যান্ডার্ড বিচ্যুতি (বা প্রকরণ) সহ নমুনাটি অবশ্যই নির্বাচন করতে হবে।
-
ভেরিয়েন্সের মধ্যে উল্লেখযোগ্য পার্থক্য আছে কিনা তা নির্ধারণ করতে এফ-টেস্টের ফলাফল দেখুন। ফলাফল তিনটি গুরুত্বপূর্ণ মান দেয়:
- F: ভিন্নতার মধ্যে অনুপাত।
- P(F<=f) এক-টেইল: সম্ভাব্যতা যে ভেরিয়েবল 1 এর আসলে ভেরিয়েবল 2 এর চেয়ে বড় বৈচিত্র্য নেই। যদি এটি আলফার চেয়ে বড় হয়, যা সাধারণত 0.05 হয়, তারপর পার্থক্যগুলির মধ্যে কোন উল্লেখযোগ্য পার্থক্য নেই।
- F ক্রিটিক্যাল ওয়ান-টেইল: P(F<=f)=α দিতে যে F-এর মান প্রয়োজন হবে। যদি এই মানটি F-এর থেকে বেশি হয়, তাহলে এটিও নির্দেশ করে যে বৈচিত্রগুলির মধ্যে কোনও উল্লেখযোগ্য পার্থক্য নেই৷
P(F<=f) F এর সাথে FDIST ফাংশন এবং প্রতিটি নমুনার ইনপুট হিসাবে স্বাধীনতার ডিগ্রি ব্যবহার করেও গণনা করা যেতে পারে। স্বাধীনতার ডিগ্রি হল একটি নমুনা বিয়োগ একের মধ্যে পর্যবেক্ষণের সংখ্যা।
-
এখন আপনি জানেন যে ভিন্নতার মধ্যে পার্থক্য আছে কিনা আপনি উপযুক্ত টি-টেস্ট নির্বাচন করতে পারেন। ডেটা ট্যাব > ডেটা অ্যানালাইসিস নির্বাচন করুন, তারপর যেকোন একটি নির্বাচন করুন টি-টেস্ট: দুই-নমুনা অনুমান সমান বৈচিত্র্য বা টি-পরীক্ষা: অসম বৈচিত্র্য অনুমান করে দুটি নমুনা
-
আগের ধাপে আপনি যে বিকল্পটি বেছে নিয়েছেন তা নির্বিশেষে, বিশ্লেষণের বিশদ বিবরণ লিখতে আপনাকে একই ডায়ালগ বক্স উপস্থাপন করা হবে। শুরু করতে, ভেরিয়েবল 1 রেঞ্জ এবং ভেরিয়েবল 2 রেঞ্জ।
- ধরে নিই যে আপনি উপায়গুলির মধ্যে কোনও পার্থক্যের জন্য পরীক্ষা করতে চান, অনুমানিত গড় পার্থক্যকে শূন্যে সেট করুন।
- তাত্পর্য স্তর আলফা সেট করুন (0.05 95% আত্মবিশ্বাস দেয়), এবং আউটপুটের উপরের বাম কোণে একটি ঘর নির্বাচন করুন, এটি বিবেচনা করে যে এটি 3টি কলাম এবং 14টি সারি পূরণ করবে। ঠিক আছে নির্বাচন করুন।
-
মাধ্যমের মধ্যে উল্লেখযোগ্য পার্থক্য আছে কিনা তা নির্ধারণ করতে ফলাফল পর্যালোচনা করুন।
F-টেস্টের মতোই, যদি p-মান, এই ক্ষেত্রে P(T<=t), আলফার থেকে বড় হয়, তাহলে কোন উল্লেখযোগ্য পার্থক্য নেই। যাইহোক, এই ক্ষেত্রে দুটি পি-মান দেওয়া আছে, একটি ওয়ান-টেইল টেস্টের জন্য এবং অন্যটি টু-টেইল টেস্টের জন্য। এই ক্ষেত্রে, দুই-টেইল মান ব্যবহার করুন কারণ যেকোন একটি ভেরিয়েবলের গড় একটি উল্লেখযোগ্য পার্থক্য হবে।