একটি এলিমেন্ট আলোচ্য নর্মাল ডিস্ট্রিবিউশনের গড় মান থেকে কত একক স্ট্যান্ডার্ড ডেভিয়েশন দূরত্বে অবস্থান করে সেই ভ্যালুকে উক্ত এলিমেন্টের স্ট্যান্ডার্ড স্কোর, সিগমা বা z-score বলে। এভাবে একটি ডাটাকে z-score এ কনভার্ট করাকেই স্ট্যান্ডার্ডাইজেশন বলে।
সূত্র, z-score = (যে ভ্যালুর স্ট্যান্ডার্ডাইজেশন করতে হবে - গড়)/ স্ট্যান্ডার্ড ডেভিয়েশন
এটা করার ফলে বিশেষ কিছু সময়ে সুবিধা পাওয়া যায়। যেমন উদাহরণ সরূপ - একজন শিক্ষক ১১ জন ছাত্রের পরীক্ষা নিলেন ৬০ নম্বরের মধ্যে। পাশ মার্ক বলে দিলেন ৩০। কিন্তু পরীক্ষা এতোই কঠিন হল যে ১০ জন ছাত্রই ৩০ এর চেয়ে কম মার্ক পেল। এখন সবাইকে তো আর ফেইল করে দেয়া যায় না। তাই তিনি ঠিক করলেন মার্কস গুলোকে স্ট্যান্ডার্ডাইজ করবেন এবং যারা ১ একক স্ট্যান্ডার্ড ডেভিয়েশনের নিচে মার্ক পেয়েছে শুধু তাদেরকে ফেইল করে দিবেন। এতে করে তিনি শতকরা ৬৮% ভালো ছাত্র বেছে নিতে পারছেন।
mean বের করে ফেলি,
marks = np.array([20, 15, 26, 32, 18, 28, 35, 14, 26, 22, 17])
np.mean(marks)
23.0
স্ট্যান্ডার্ড ডেভিয়েশন
np.std(marks)
6.6332495807107996
অতএব, সূত্র অনুযায়ী উপরের মার্কস গুলোর স্ট্যান্ডার্ড স্কোর যথাক্রমে,
-0.45, -1.21(fail), 0.45, 1.36, -0.76, 0.76, 1.82, -1.36(fail), 0.45, -0.15, -0.91
অর্থাৎ শুধুমাত্র 15 এবং 14 মার্ক পাওয়া ছাত্র দুজনকে ফেইল করে দিতে পারেন তিনি।