Tabla de Contenidos
जनसंख्या के भीतर डेटा की परिवर्तनशीलता या फैलाव को मापने के लिए जनसंख्या मानक विचलन सबसे महत्वपूर्ण जनसंख्या मापदंडों में से एक है। आँकड़ों में किसी भी पैरामीटर की तरह, यह एक ग्रीक अक्षर द्वारा दर्शाया गया है, इस मामले में, अक्षर σ (सिग्मा)। यह इसे नमूने के मानक विचलन से आसानी से अलग करने की अनुमति देता है, जो हालांकि समान है, समान नहीं है और न ही समान सूत्रों के साथ इसकी गणना की जाती है।
इसके बाद, हम एक उदाहरण के माध्यम से जनसंख्या के मानक विचलन की गणना करने के विभिन्न तरीकों को देखेंगे । यह ध्यान दिया जाना चाहिए कि, जनसंख्या मानक विचलन की गणना करने के लिए , सभी जनसंख्या डेटा को जानना आवश्यक है। यह वास्तविक संदर्भों में शायद ही कभी होता है, लेकिन यह समझना अभी भी महत्वपूर्ण है कि इसकी गणना कैसे की जाती है, क्योंकि यह इस महत्वपूर्ण पैरामीटर की कुछ गणितीय विशेषताओं को समझने में मदद करता है।
जनसंख्या मानक विचलन सूत्र
उपलब्ध आंकड़ों के आधार पर, तीन अलग-अलग सूत्रों का उपयोग करके जनसंख्या मानक विचलन निर्धारित किया जा सकता है।
जनसंख्या मानक विचलन की गणितीय परिभाषा
मानक विचलन को प्रसरण के वर्गमूल, σ 2 के रूप में परिभाषित किया गया है । अर्थात्, यदि हम जनसंख्या के प्रसरण को जानते हैं, तो हम निम्नलिखित समीकरण का उपयोग करके मानक विचलन की गणना कर सकते हैं:
यह मामला शायद ही कभी होता है, लेकिन यह ध्यान में रखना अच्छा होता है।
अन्य जनसंख्या मानक विचलन सूत्र
यदि जनसंख्या के विचरण को जानने के बजाय , हम उन सभी एन डेटा आइटमों को जानते हैं जो इसे बनाते हैं, तो हम जनसंख्या मानक विचलन की गणना माध्य से वर्ग विचलन के औसत के वर्गमूल के रूप में कर सकते हैं। यानी:
इस समीकरण में, xi जनसंख्या में प्रत्येक डेटा आइटम के मूल्य का प्रतिनिधित्व करता है, N जनसंख्या में डेटा आइटम की संख्या (या जनसंख्या का आकार, जो समान है) का प्रतिनिधित्व करता है और μ जनसंख्या का मतलब है। ध्यान दें कि जनसंख्या माध्य को एक ग्रीक अक्षर द्वारा भी दर्शाया जाता है क्योंकि यह एक अन्य जनसंख्या पैरामीटर है और जनसंख्या के आकार को n से अलग करने के लिए N (कैपिटल लेटर) द्वारा दर्शाया जाता है जो आमतौर पर एक नमूने के आकार से जुड़ा होता है।
जनसंख्या माध्य, μ, द्वारा दिया गया है:
समीकरण 2 को प्राप्त करने के लिए विस्तारित, पुनर्व्यवस्थित और सरलीकृत किया जा सकता है:
जनसंख्या के अलग-अलग डेटा नहीं होने के मामले में लेकिन डेटा को एक आवृत्ति तालिका में समूहीकृत किया गया है, पिछले सूत्रों को देने के लिए थोड़ा संशोधित किया गया है:
उपरोक्त समीकरणों में, जड़ के भीतर स्थित मात्रा जनसंख्या विचरण से अधिक कुछ नहीं है। समीकरण 4 को विशेष रूप से जनसंख्या डेटा के संदर्भ में स्थापित होने का लाभ है न कि कुछ जनसंख्या पैरामीटर के रूप में समीकरण 2 और 5 के मामले में।
जनसंख्या मानक विचलन की गणना का उदाहरण
मान लीजिए हम एक विशेष कार मॉडल के वजन में परिवर्तनशीलता का निर्धारण करना चाहते हैं, जिसके केवल 20 उदाहरण दुनिया भर में मौजूद हैं। इन 20 कारों के किलोग्राम में वजन का डेटा निम्न तालिका में प्रस्तुत किया गया है:
410 | 408 | 408 | 405 | 391 | 390 | 402 | 397 | 397 | 395 |
390 | 404 | 397 | 394 | 399 | 397 | 405 | 408 | 410 | 400 |
चूंकि हम जानते हैं कि इस मॉडल की केवल 20 कारें हैं, ये पूरी आबादी का प्रतिनिधित्व करती हैं, इसलिए हमारे पास जनसंख्या मानक विचलन को निर्धारित करने के लिए आवश्यक सभी डेटा हैं । आइए इस मानक विचलन को निर्धारित करने के तीन अलग-अलग तरीकों पर गौर करें।
विधि 1: प्रसरण की परिभाषा के आधार पर गणना
यह विधि ऊपर प्रस्तुत समीकरण 2 के उपयोग पर आधारित है। जैसा कि हम देख सकते हैं, समीकरण को जनसंख्या माध्य और गणनाओं की एक और श्रृंखला के उपयोग की आवश्यकता होती है जो नीचे विस्तृत हैं:
चरण 1: जनसंख्या माध्य निर्धारित करें
जनसंख्या माध्य या μ की गणना समीकरण 3 के माध्यम से की जाती है, जिसमें सभी डेटा को जोड़ा जाता है और डेटा की कुल संख्या से विभाजित किया जाता है, जो इस मामले में 20 है।
चरण 2: माध्य से विचलन की गणना करें
इस चरण में घटाव (x i – μ) की गणना करना शामिल है। उदाहरण के लिए:
x 1 – μ = 410 – 400.35 किग्रा = 9.65 किग्रा
x 2 – μ = 408 – 400.35 किग्रा = 7.65 किग्रा
x 3 – μ = 408 – 400.35 किग्रा = 7.65 किग्रा
…
X 20 – μ = 400 किग्रा – 400.35 किग्रा = – 0.35
परिणाम निम्न तालिका में प्रस्तुत किए गए हैं:
एक्स मैं | एक्स आई – μ |
410 | 9.65 |
408 | 7.65 |
408 | 7.65 |
405 | 4.65 |
391 | -9.35 |
390 | -10.35 |
402 | 1.65 |
397 | -3.35 |
397 | -3.35 |
395 | -5.35 |
390 | -10.35 |
404 | 3.65 |
397 | -3.35 |
394 | -6.35 |
399 | -1.35 |
397 | -3.35 |
405 | 4.65 |
408 | 7.65 |
410 | 9.65 |
400 | -0.35 |
चरण 3: माध्य से सभी विचलनों का वर्ग करें
(x 1 – μ) 2 = (9.65) 2 = 93.1225 किग्रा 2
(x 2 – μ) 2 = (7.65) 2 = 58.5225 किग्रा 2
(x 3 – μ) 2 = (7.65) 2 = 58.5225 किग्रा 2
…
(x 20 – μ) 2 = (- 0.35) 2 = 0.1225 किग्रा 2
परिणाम निम्न तालिका में प्रस्तुत किए गए हैं:
एक्स आई / किग्रा | (x i – μ)/ किग्रा | (x i – μ ) 2 / किग्रा 2 |
410 | 9.65 | 93.1225 |
408 | 7.65 | 58.5225 |
408 | 7.65 | 58.5225 |
405 | 4.65 | 21.6225 |
391 | -9.35 | 87.4225 |
390 | -10.35 | 107.1225 |
402 | 1.65 | 2.7225 |
397 | -3.35 | 11.2225 |
397 | -3.35 | 11.2225 |
395 | -5.35 | 28.6225 |
390 | -10.35 | 107.1225 |
404 | 3.65 | 13.3225 |
397 | -3.35 | 11.2225 |
394 | -6.35 | 40.3225 |
399 | -1.35 | 1.8225 |
397 | -3.35 | 11.2225 |
405 | 4.65 | 21.6225 |
408 | 7.65 | 58.5225 |
410 | 9.65 | 93.1225 |
400 | -0.35 | 0.1225 |
चरण 4: सभी विचलनों का वर्ग जोड़ें
चरण 5: समीकरण 2 के सूत्र को लागू करें
अब जब हमारे पास यह योग है, तो केवल समीकरण 2 में इस मान को बदलने के साथ-साथ डेटा की संख्या, जो 20 है, को बदलना बाकी है:
इस प्रकार, हम प्राप्त करते हैं कि 20 कारों की आबादी के वजन का मानक विचलन लगभग है। 6.5 किग्रा।
विधि 2: पुनर्व्यवस्थित समीकरण का उपयोग करना
अब हम समान गणना करेंगे, लेकिन समीकरण 4 का उपयोग करते हुए, जो हमारे द्वारा उपयोग किए गए समीकरण के समतुल्य है, लेकिन अधिक व्यावहारिक है, खासकर यदि आप बड़ी संख्या में डेटा के साथ काम कर रहे हैं। मुख्य लाभ यह है कि विचलन की गणना करने में सक्षम होने के लिए एक अतिरिक्त पैरामीटर (जनसंख्या माध्य) की गणना करना आवश्यक नहीं है, लेकिन मूल व्यक्तिगत डेटा के आधार पर सब कुछ गणना की जाती है। साथ ही, आपको किसी भी समय ऋणात्मक संख्याओं के साथ काम करने की आवश्यकता नहीं है, जो छात्रों के बीच त्रुटि का एक प्रमुख स्रोत हैं।
चरण 1: प्रत्येक व्यक्तिगत डेटा के वर्ग की गणना करें
अर्थात्, निम्नलिखित गणनाएँ की जाती हैं:
(x 1 ) 2 = (410) 2 = 168,100 किग्रा 2
(x 2 ) 2 = (408) 2 = 166.464 किग्रा 2
(x 3 ) 2 = (408) 2 = 166.464 किग्रा 2
…
(x 20 ) 2 = (400) 2 = 160,000 किग्रा 2
परिणाम निम्न तालिका में प्रस्तुत किए गए हैं:
एक्स मैं | एक्स आई 2 |
410 | 168,100 |
408 | 166,464 |
408 | 166,464 |
405 | 164,025 |
391 | 152,881 |
390 | 152,100 |
402 | 161,604 |
397 | 157,609 |
397 | 157,609 |
395 | 156,025 |
390 | 152,100 |
404 | 163,216 |
397 | 157,609 |
394 | 155,236 |
399 | 159,201 |
397 | 157,609 |
405 | 164,025 |
408 | 166,464 |
410 | 168,100 |
400 | 160,000 |
चरण 2: सभी अलग-अलग डेटा जोड़ें
चरण 3: सभी वर्गों को जोड़ें
चरण 4: समीकरण 4 का सूत्र लागू करें
जनसंख्या मानक विचलन प्राप्त करने के लिए समीकरण 4 में इन दो मूल्यों और डेटा की संख्या को पेश करने का अंतिम चरण है:
विधि 3: स्प्रेडशीट का उपयोग करना
Microsoft Excel, Apple Numbers या Google पत्रक जैसे स्प्रेडशीट में उनके बुनियादी कार्यों में मानक विचलन (नमूना और जनसंख्या दोनों) की सीधी गणना शामिल है। ये फ़ंक्शन डेटा सेट को एक तर्क के रूप में लेते हैं और पिछली पद्धति में दिखाई गई सभी गणनाओं को उस सेल में सीधे मानक विचलन वापस करने के लिए करते हैं जहां सूत्र दर्ज किया गया है।
प्रक्रिया आगे है:
चरण 1: स्प्रेडशीट में डेटा दर्ज करें
हम स्प्रेडशीट में कहीं भी कॉलम, रो या मैट्रिक्स के रूप में डेटा दर्ज कर सकते हैं। निम्न स्क्रीनशॉट दिखाता है कि Excel 2016 में इस समस्या का डेटा कैसा दिखता है।
चरण 2: मानक विचलन की गणना करने के लिए सूत्र का उपयोग करें
एक बार डेटा जोड़ दिया गया है, हम मानक विचलन फ़ंक्शन का उपयोग करते हैं, जहां डेटा को तर्कों के रूप में पाया जाता है।
स्प्रैडशीट में किसी फ़ंक्शन को कॉल करने के लिए, हम आमतौर पर बराबर चिह्न (=) टाइप करके प्रारंभ करते हैं और उसके बाद उस फ़ंक्शन का नाम लिखते हैं जिसका हम उपयोग करना चाहते हैं। नाम एक एप्लिकेशन से दूसरे एप्लिकेशन में थोड़े बदलते हैं और कुछ मामलों में उस भाषा के आधार पर भी बदलते हैं जिसमें आप काम कर रहे हैं।
एक्सेल (स्पेनिश संस्करण) के मामले में, जनसंख्या मानक विचलन की गणना करने के कार्य को STDEV.P कहा जाता है, जबकि Google पत्रक में यह STDEVP (बिंदु के बिना) है। फिर आपको कोष्ठकों के बीच फ़ंक्शन के तर्क (ओं) को दर्ज करना होगा। हमारे उदाहरण में, हम एक तर्क के रूप में उन कक्षों की श्रेणी को पारित करते हैं जिनमें डेटा स्थित है (कक्ष A3 से J4 तक)।
ENTER दबाकर, प्रोग्राम फ़ंक्शन चलाता है और जनसंख्या के मानक विचलन की गणना करता है, परिणाम को संबंधित सेल में प्रस्तुत करता है, जैसा कि नीचे दिखाया गया है:
जैसा कि हम देख सकते हैं, यहाँ अभ्यास की गई तीन विधियों में से कोई भी एक ही परिणाम देती है। यह एक ही काम करने के अलग-अलग तरीके हैं।
अन्य तरीके
ऊपर बताए गए तीन तरीकों के अलावा, वैज्ञानिक और वित्तीय कैलकुलेटर में डेटा सेट के मानक विचलन को निर्धारित करने के लिए अक्सर एक फ़ंक्शन होता है, चाहे वह नमूना हो या जनसंख्या। जिस तरह से डेटा दर्ज किया जाता है और प्राप्त परिणाम निर्माता से निर्माता और यहां तक कि एक कैलकुलेटर मॉडल से दूसरे में भिन्न होते हैं, इसलिए यहां ऐसा करने के लिए विशिष्ट चरणों को दिखाना अव्यावहारिक है।
इसके बजाय, हम सबसे महत्वपूर्ण सामान्य कदमों पर चर्चा किए बिना उन पर चर्चा करेंगे। जो कोई भी अपने वैज्ञानिक कैलकुलेटर पर इस फ़ंक्शन का उपयोग करना चाहता है, उसे कैलकुलेटर के साथ आए उपयोगकर्ता के मैनुअल को देखना चाहिए या प्रत्येक मामले में विशिष्ट कुंजी संयोजन निर्धारित करने के लिए इसे ऑनलाइन खोजना चाहिए।
चरण 1: स्मृति साफ़ करें
कई कैलकुलेटर पर, पहले से संग्रहीत डेटा दिखाई नहीं देता। यदि हम दूसरों के बारे में डेटा दर्ज करते हैं जो पहले से ही इसे जाने बिना संग्रहीत किया गया था, तो कैलकुलेटर गलत परिणाम देगा। यह सुनिश्चित करने के लिए कि ऐसा न हो, यह सलाह दी जाती है कि नया डेटा दर्ज करने से पहले कैलकुलेटर की सभी मेमोरी (या कम से कम सांख्यिकीय विश्लेषण मोड) को साफ़ कर लें।
चरण 2: आँकड़े मोड तक पहुँचें
मानक विचलन की गणना करने के कार्य अधिकांश कैलकुलेटर पर “सांख्यिकी,” “सांख्यिकी” या बस “एस” मोड का हिस्सा हैं, इसलिए हमें ऑपरेशन के इस मोड में प्रवेश करके प्रारंभ करना चाहिए।
चरण 3: डेटा दर्ज करें
यह एक कैलकुलेटर से दूसरे में भिन्न होता है। कुछ मामलों में तालिका के रूप में डेटा जोड़ा जा सकता है, जबकि अन्य में डीटी (या डीएटी) कुंजी दबाने के बाद एक-एक करके डेटा दर्ज किया जाता है। इस चरण के अंत में दर्ज किए गए डेटा की संख्या की जांच करना महत्वपूर्ण है ताकि यह सुनिश्चित हो सके कि कोई भी गायब नहीं है।
चरण 4: जनसंख्या मानक विचलन की गणना करें
एक बार डेटा दर्ज हो जाने के बाद, जो कुछ बचता है, वह है कि हम जिस परिणाम की तलाश कर रहे हैं, उसके बारे में कैलकुलेटर से पूछें। कई कैलकुलेटर पर, नमूना और जनसंख्या मानक विचलन दोनों को प्रतीक σ द्वारा दर्शाया जाता है (नमूना विचलन के मामले में यह एक त्रुटि होने के बावजूद)। हालाँकि, हम जनसंख्या विचलन से नमूना विचलन को अलग कर सकते हैं क्योंकि नमूना विचलन n-1 के साथ है (अर्थात, यह σ n-1 के रूप में प्रकट होता है ) जबकि जनसंख्या विचलन s n के रूप में प्रकट होता है । यह इस तथ्य को संदर्भित करता है कि नमूना मानक विचलन की गणना में इसे जनसंख्या के रूप में n के बजाय n-1 से विभाजित किया जाता है।
संदर्भ
देवोर, जेएल (2019)। संभाव्यता और सांख्यिकी (पहला संस्करण ।)। सेनगेज लर्निंग।
मेटमोबाइल। (2021, 1 जनवरी)। बिन्ड डेटा के लिए भिन्नता और मानक विचलन | matmobile . https://matemovil.com/varianza-y-desviacion-estandar-para-datos-agrupados-por-intervalos/
गूगल तकनीकी सहायता। (रा)। STDEV (STDEV) – Google दस्तावेज़ संपादक सहायता . Google – Google डॉक्स संपादक सहायता। https://support.google.com/docs/answer/3094054?hl=en-419
सुपरप्रोफ। (रा)। मानक विचलन । गणित शब्दकोश | सुपरप्रोफ। https://www.superprof.es/diccionario/matematicas/estadistica/desviacion-estandar.html
TOMi.डिजिटल। (रा)। समूहीकृत डेटा के लिए मानक विचलन । https://tomi.digital/en/52202/standard-deviation-for-grouped-data?utm_source=google&utm_medium=seo