Standard Deviation in Statistics | Explained in Hindi with Examples

Standard Deviation) क्या है?

सामान्य विचलन (σ) यह बताता है कि किसी डेटा का एक सामान्य हिस्सा औसत (average) से कितना दूर है। इसका मतलब है कि यह मापता है कि डेटा की कितनी एंट्रीज़ औसत के करीब हैं या उससे कितनी दूर हैं।

सामान्य विचलन कई सांख्यिकी (statistics) में महत्वपूर्ण होता है, खासकर जब हमें यह जानना हो कि डेटा एक जगह पर इकट्ठा है या बहुत फैला हुआ है।

यहाँ 2020 तक के सभी 934 नोबेल पुरस्कार विजेताओं की उम्र का हिस्टोग्राम दिया गया है, जिसमें दिखाया गया है कि उनकी उम्र औसत से कितनी अलग है:

इस हिस्टोग्राम से आप देख सकते हैं कि ज़्यादातर नोबेल पुरस्कार विजेताओं की उम्र औसत उम्र के आस-पास है, और कितने लोग औसत से कम या ज़्यादा उम्र के हैं। अगर सामान्य विचलन कम है, तो इसका मतलब है कि ज़्यादातर लोग औसत उम्र के करीब हैं।

हिस्टोग्राम में हर डॉटेड लाइन एक अतिरिक्त सामान्य विचलन (standard deviation) की शिफ्ट को दिखाती है।

अगर डेटा सामान्य वितरण (normally distributed) में है, तो:

करीब 68.3% डेटा औसत (average) के 1 सामान्य विचलन के अंदर होगा (μ-1σ से μ+1σ तक)।
करीब 95.5% डेटा औसत के 2 सामान्य विचलनों के अंदर होगा (μ-2σ से μ+2σ तक)।
करीब 99.7% डेटा औसत के 3 सामान्य विचलनों के अंदर होगा (μ-3σ से μ+3σ तक)।

नोट: सामान्य वितरण (normal distribution) का आकार “घंटी” जैसा (bell-shaped) होता है और यह दोनों तरफ बराबर फैलता है।

Standard Deviation Calculation (सामान्य विचलन की गणना)

जनसंख्या के लिए सामान्य विचलन का फॉर्मूला:

σ = √(Σ(Xᵢ - μ)² / N)

नमूने के लिए सामान्य विचलन का फॉर्मूला:

s = √(Σ(Xᵢ - X̄)² / (n - 1))

सिंबल:

N = कुल अवलोकनों की संख्या (Total number of observations)
Σ = सब नंबर जोड़ने का सिंबल (Summation symbol)
Xᵢ = डेटा में दिए गए मान (Data values)
μ = जनसंख्या का औसत (Population mean)
X̄ = नमूने का औसत (Sample mean)

उदाहरण:

उदाहरण के लिए 4 मान: 4, 11, 7, 14

औसत (Mean):

μ = (4 + 11 + 7 + 14) / 4 = 9

अंतर निकालें (Differences):

4 - 9 = -5
11 - 9 = 2
7 - 9 = -2
14 - 9 = 5

स्क्वेयर (Squares):

(-5)² = 25
2² = 4
(-2)² = 4
5² = 25

जोड़ें (Sum):

25 + 4 + 4 + 25 = 58

N से विभाजित करें (Divide by N):

58 / 4 = 14.5

वर्गमूल (Square root):

√14.5 ≈ 3.81

प्रोग्रामिंग से सामान्य विचलन (Standard Deviation) की गणना

सामान्य विचलन (Standard Deviation) कई प्रोग्रामिंग भाषाओं से आसानी से निकाला जा सकता है। बड़े डेटा सेट के लिए, हाथ से गणना करना मुश्किल हो जाता है, इसलिए सॉफ्टवेयर और प्रोग्रामिंग का उपयोग अधिक सामान्य होता है।

जनसंख्या के लिए सामान्य विचलन (Population Standard Deviation)

Python Example

Python में, आप NumPy लाइब्रेरी के std() मेथड का उपयोग करके सामान्य विचलन आसानी से निकाल सकते हैं। उदाहरण के लिए, अगर आपके पास 4, 11, 7, और 14 मान (values) हैं, तो आप इसे इस तरह कर सकते हैं:

import numpy
values = [4, 11, 7, 14]
x = numpy.std(values)
print(x)

Symbol (सिंबल)	Description (विवरण)

σ	जनसंख्या का सामान्य विचलन (Population standard deviation). इसे ‘sigma’ कहते हैं।

s	नमूने का सामान्य विचलन (Sample standard deviation).

μ	जनसंख्या का औसत (Population mean). इसे ‘mu’ कहते हैं।

X̄	नमूने का औसत (Sample mean). इसे ‘x-bar’ कहते हैं।

Σ	योग संचालक (Summation operator), इसे ‘capital sigma’ कहते हैं।

x	वह वैरिएबल जिसके लिए औसत निकाला जा रहा है (The variable ‘x’ for calculating average).

i	वैरिएबल ‘x’ का इंडेक्स, जो हर अवलोकन की पहचान करता है (The index ‘i’ of the variable ‘x’).

N	अवलोकनों की संख्या (Number of observations).

Statistics for Data Science Course in Hindi | Vista Academy

Curriculum