Population Proportion (जनसंख्या अनुपात) उस हिस्से को दर्शाता है जो किसी विशेष category (श्रेणी) में आता है। इसे समझने के लिए हम confidence intervals (कॉन्फिडेंस इंटरवल्स) का उपयोग करते हैं, जो हमें जनसंख्या के अनुपातों का estimate (अनुमान) लगाने में मदद करते हैं।
कॉन्फिडेंस इंटरवल की गणना करने के लिए निम्नलिखित steps (चरणों) का पालन किया जाता है:
Check the Conditions (शर्तों की जाँच करें):
Find the Point Estimate (पॉइंट एस्टीमेट खोजें):
Decide the Confidence Level (कॉन्फिडेंस लेवल तय करें):
Calculate the Margin of Error (मर्जिन ऑफ़ एरर की गणना करें):
Calculate the Confidence Interval (कॉन्फिडेंस इंटरवल की गणना करें):
Population: Nobel Prize winners (नोबेल पुरस्कार विजेता)
Category: Born in the United States of America (संयुक्त राज्य अमेरिका में जन्मे)
हम एक sample ले सकते हैं और देख सकते हैं कि उनमें से कितने लोग अमेरिका में जन्मे हैं। इस data (डेटा) का उपयोग करके हम सभी नोबेल पुरस्कार विजेताओं में अमेरिका में जन्मे लोगों के हिस्से का अनुमान लगा सकते हैं।
उदाहरण:
यदि हमने 30 नोबेल पुरस्कार विजेताओं को यादृच्छिक रूप से चुना और पाया कि उनमें से 6 अमेरिका में जन्मे थे:
इस data का उपयोग करते हुए हम कॉन्फिडेंस इंटरवल की गणना कर सकते हैं।
जनसंख्या अनुपात के लिए कॉन्फिडेंस इंटरवल की गणना करने के लिए conditions (शर्तें) हैं:
हमारे उदाहरण में: हमने अमेरिका में जन्मे 6 लोगों को यादृच्छिक रूप से चुना। बाकी के 24 लोग अमेरिका में नहीं जन्मे।
इसलिए, शर्तें इस मामले में पूरी होती हैं।
Note (नोट): बिना हर श्रेणी में 5 सदस्यों के कॉन्फिडेंस इंटरवल की गणना करना संभव है, लेकिन इसके लिए विशेष adjustments (समायोजन) करने की आवश्यकता होती है।
Table of Contents
Toggleपॉइंट एस्टिमेट (Point Estimate) को हम सैंपल प्रपोर्शन (𝑝̂) के रूप में व्यक्त करते हैं।
सैंपल प्रपोर्शन की गणना करने का फ़ॉर्मूला है:
𝑝̂ = &frac;x;n
जहाँ:
x = घटनाओं की संख्या (Number of occurrences)n = सैंपल का आकार (Sample size)हमारे उदाहरण में, यदि 6 में से 30 लोग अमेरिका में पैदा हुए हैं:
x = 6n = 30तो प्रपोर्शन का पॉइंट एस्टिमेट होगा:
𝑝̂ = &frac;6;30 = 0.20
इसलिए, 20% सैंपल अमेरिका में पैदा हुए थे।
कॉन्फिडेंस लेवल (Confidence Level) को प्रतिशत या दशमलव संख्या में व्यक्त किया जाता है।
उदाहरण के लिए, यदि कॉन्फिडेंस लेवल 95% या 0.95 है:
तो शेष संभावना (α) होगी:
α = 1 - 0.95 = 0.05 (5%)
α = 0.1α = 0.05α = 0.01नोट: 95% कॉन्फिडेंस लेवल का मतलब है कि यदि हम 100 अलग-अलग सैंपल लेते हैं और प्रत्येक के लिए कॉन्फिडेंस इंटरवल बनाते हैं, तो:
सच्चा पैरामीटर 100 में से 95 बार कॉन्फिडेंस इंटरवल के अंदर होगा।
हम मार्जिन ऑफ एरर (Margin of Error) को खोजने के लिए स्टैण्डर्ड नॉर्मल डिस्ट्रीब्यूशन (Standard Normal Distribution) का उपयोग करते हैं।
शेष संभावनाएँ (α) को दो भागों में विभाजित किया जाता है ताकि हर एक टेल एरिया में आधी हो:
α/2 (प्रत्येक टेल एरिया में)
ज़ेड वैल्यू ऐक्सिस पर वो मान जो टेल एरियाज को बीच से अलग करते हैं, उन्हें क्रिटिकल ज़ेड वैल्यूज़ (Critical Z-values) कहा जाता है।
नीचे स्टैण्डर्ड नॉर्मल डिस्ट्रीब्यूशन के ग्राफ़ दिए गए हैं, जो अलग-अलग कॉन्फिडेंस लेवल के लिए टेल एरियाज (α) को दर्शाते हैं।
मार्जिन ऑफ एरर (Margin of Error) पॉइंट एस्टिमेट और निचले तथा ऊपरी सीमाओं के बीच का अंतर है।
प्रपोर्शन के लिए मार्जिन ऑफ एरर (E) की गणना की जाती है:
E = z * SE
जहाँ:
z = क्रिटिकल ज़ेड वैल्यू (Critical Z-value), जो स्टैण्डर्ड नॉर्मल डिस्ट्रीब्यूशन और कॉन्फिडेंस लेवल से प्राप्त होता है।SE = स्टैण्डर्ड एरर (Standard Error), जो पॉइंट एस्टिमेट (𝑝̂) और सैंपल साइज (n) से प्राप्त होता है।हमारे उदाहरण में, यदि 30 में से 6 नोबेल पुरस्कार विजेता अमेरिका में पैदा हुए थे, तो स्टैण्डर्ड एरर की गणना होगी:
SE = √(&frac;𝑝̂(1 - 𝑝̂);n)
यहाँ,
𝑝̂ = &frac;6;30 = 0.20n = 30तो:
SE = √(&frac;0.20(1 - 0.20);30)
यदि हम कॉन्फिडेंस लेवल के रूप में 95% चुनते हैं, तो:
α = 1 - 0.95 = 0.05
अब हमें क्रिटिकल ज़ेड वैल्यू (z) खोजना होगा।
क्रिटिकल ज़ेड वैल्यू को Z-टेबल का उपयोग करके या किसी प्रोग्रामिंग भाषा की फ़ंक्शन का उपयोग करके पाया जा सकता है।
Python में, Scipy Stats लाइब्रेरी का norm.ppf() फ़ंक्शन का उपयोग करके α/2 = 0.025 के लिए Z-वैल्यू खोजें:
import scipy.stats as stats
उदाहरण: Python का उपयोग करें
Python में, Scipy Stats लाइब्रेरी का norm.ppf() फ़ंक्शन का उपयोग करके α/2 = 0.025 के लिए Z-वैल्यू खोजें:
import scipy.stats as stats
print(stats.norm.ppf(1 – 0.025))
किसी भी method का उपयोग करके हम यह पा सकते हैं कि critical Z-value है:
Z-value: (यहाँ पर Z-value डालें)
Standard error: (यहाँ पर standard error डालें)
इसलिए, margin of error (MOE) होगा:
Margin of Error (MOE) का formula:
MOE=Z−value×StandarderrorMOE = Z-value \times Standard errorMOE=Z−value×Standarderror
तो, MOE = (यहाँ पर Z-value और standard error के मान डालें)
इस तरह से, margin of error की calculation की जाती है।”
करने के लिए हम lower और upper bounds निकालते हैं। यह bounds निकालने के लिए हम margin of error (MOE) को point estimate से घटाते और जोड़ते हैं।
Example:
यदि हमारे example में point estimate 0.2 है और margin of error 0.143 है, तो:
Lower bound:
PointEstimate−MOE=0.2−0.143=0.057Point Estimate – MOE = 0.2 – 0.143 = 0.057PointEstimate−MOE=0.2−0.143=0.057Upper bound:
PointEstimate+MOE=0.2+0.143=0.343Point Estimate + MOE = 0.2 + 0.143 = 0.343PointEstimate+MOE=0.2+0.143=0.343Confidence Interval:
[LowerBound,UpperBound]=[0.057,0.343]या[5.7%,34.4%][Lower Bound, Upper Bound] = [0.057, 0.343] \quad \text{या} \quad [5.7\%, 34.4\%][LowerBound,UpperBound]=[0.057,0.343]या[5.7%,34.4%]
हम इस confidence interval को summarize कर सकते हैं यह कहकर:
95% Confidence Interval: US में जन्मे Nobel Prize winners का proportion 5.7% से 34.4% के बीच है।”
Calculate the Confidence Interval
हम confidence interval का lower और upper bound, point estimate और margin of error (MOE) की मदद से निकालते हैं।
Formulae:
Python Code:
# Given values point_estimate = 0.2 # Example point estimate margin_of_error = 0.143 # Example margin of error (MOE) # Calculating lower and upper bounds lower_bound = point_estimate – margin_of_error upper_bound = point_estimate + margin_of_error # Confidence Interval confidence_interval = (lower_bound, upper_bound) # Displaying the results print(“Lower Bound:”, lower_bound) print(“Upper Bound:”, upper_bound) print(“Confidence Interval:”, confidence_interval)
Conclusion:
हम यह कह सकते हैं कि 95% confidence interval, US में जन्मे Nobel Prize winners का proportion 5.7% से 34.4% के बीच है।
