विचलन (सांख्यिकी)

From alpha
Jump to navigation Jump to search
यादृच्छिक वितरण के मानक विचलन का प्लॉट

गणित और सांख्यिकी में, विचलन एक चर के देखे गए मान और किसी अन्य निर्दिष्ट मान, अक्सर उस चर के माध्य, के बीच असमानता को मापने के लिए एक उपाय के रूप में कार्य करता है। नमूना माध्य और जनसंख्या माध्य (या सही मान) के संबंध में विचलन को क्रमशः त्रुटियां और अवशेष|त्रुटियां और अवशिष्ट कहा जाता है। विचलन का चिह्न (गणित) उस अंतर की दिशा बताता है: विचलन सकारात्मक होता है जब देखा गया मान संदर्भ मान से अधिक हो जाता है। विचलन का पूर्ण मान अंतर के आकार या परिमाण को इंगित करता है। किसी दिए गए नमूने (सांख्यिकी) में उतने ही विचलन होते हैं जितने नमूना बिंदु होते हैं। सारांश आँकड़े विचलन के एक सेट से प्राप्त किए जा सकते हैं, जैसे मानक विचलन और मतलब निरपेक्ष विचलन, सांख्यिकीय फैलाव के उपाय, और माध्य हस्ताक्षरित विचलन, पूर्वाग्रह का एक उपाय एक अनुमानक|पूर्वाग्रह।[1]

प्रत्येक डेटा बिंदु के विचलन की गणना व्यक्तिगत डेटा बिंदु से डेटा सेट के माध्य को घटाकर की जाती है। गणितीय रूप से, डेटा सेट में डेटा बिंदु x का विचलन d द्वारा दिया जाता है

यह गणना माध्य से डेटा बिंदु की दूरी को दर्शाती है और यह जानकारी प्रदान करती है कि व्यक्तिगत मान औसत से कितने भिन्न हैं। सकारात्मक विचलन माध्य से ऊपर के मूल्यों को दर्शाते हैं, जबकि नकारात्मक विचलन माध्य से नीचे के मूल्यों को दर्शाते हैं।[1]

वर्ग विचलन का योग विचरण की गणना में एक प्रमुख घटक है, जो डेटा सेट के प्रसार या फैलाव का एक और माप है। विचरण की गणना वर्ग विचलन के औसत से की जाती है। सांख्यिकीय विश्लेषण में डेटा बिंदुओं के वितरण और परिवर्तनशीलता को समझने में विचलन एक मौलिक अवधारणा है।[1]


प्रकार

एक विचलन जो देखे गए मूल्य और ब्याज की मात्रा के वास्तविक मूल्य के बीच का अंतर है (जहां वास्तविक मूल्य अपेक्षित मूल्य को दर्शाता है, जैसे जनसंख्या माध्य) एक त्रुटि है।[2]


हस्ताक्षरित विचलन

एक विचलन जो देखे गए मूल्य और ब्याज की मात्रा के वास्तविक मूल्य (जैसे जनसंख्या माध्य) के बीच का अंतर है, एक त्रुटि है।

एक विचलन जो देखे गए मूल्य और वास्तविक मूल्य के अनुमान (उदाहरण के लिए नमूना माध्य) के बीच का अंतर है, एक अवशिष्ट है। ये अवधारणाएँ माप के स्तर#अंतराल पैमाने और माप के स्तर#अनुपात पैमाने के स्तर पर डेटा के लिए लागू होती हैं।[3]


अहस्ताक्षरित या पूर्ण विचलन

  • सांख्यिकी में पूर्ण विचलन एक मीट्रिक है जो व्यक्तिगत डेटा बिंदुओं और केंद्रीय मान के बीच समग्र अंतर को मापता है, आमतौर पर डेटासेट का माध्य या माध्यिका। यह प्रत्येक डेटा बिंदु और केंद्रीय मान के बीच अंतर का पूर्ण मान लेकर और फिर इन पूर्ण अंतरों का औसत निकालकर निर्धारित किया जाता है।[4] सूत्र इस प्रकार व्यक्त किया गया है:

कहाँ

  • डीiपूर्ण विचलन है,
  • एक्सiडेटा तत्व है,
  • m(X) डेटा सेट की केंद्रीय प्रवृत्ति का चुना हुआ माप है - कभी-कभी माध्य (), लेकिन अधिकतर माध्यिका।


आंकड़ों में औसत निरपेक्ष विचलन (एएडी) एक केंद्रीय मूल्य, आमतौर पर माध्य या माध्यिका के आसपास डेटा बिंदुओं के एक सेट के फैलाव या प्रसार का माप है। इसकी गणना प्रत्येक डेटा बिंदु और चुने गए केंद्रीय मान के बीच पूर्ण अंतर का औसत लेकर की जाती है। एएडी डेटासेट में केंद्रीय मूल्य से विचलन के विशिष्ट परिमाण का एक माप प्रदान करता है, जो डेटा की समग्र परिवर्तनशीलता में अंतर्दृष्टि देता है।[5] न्यूनतम निरपेक्ष विचलन (LAD) एक सांख्यिकीय पद्धति है जिसका उपयोग रैखिक मॉडल के गुणांकों का अनुमान लगाने के लिए प्रतिगमन विश्लेषण में किया जाता है। अधिक सामान्य न्यूनतम वर्ग विधि के विपरीत, जो प्रेक्षित और पूर्वानुमानित मानों के बीच वर्ग ऊर्ध्वाधर दूरियों (अवशेषों) के योग को कम करता है, एलएडी विधि पूर्ण ऊर्ध्वाधर दूरियों के योग को कम करती है।

रैखिक प्रतिगमन के संदर्भ में, यदि (x1​,और1​), (एक्स2​,और2​), ... डेटा बिंदु हैं, और ए​ और बी​ रैखिक मॉडल के लिए अनुमान लगाए जाने वाले गुणांक हैं

न्यूनतम निरपेक्ष विचलन अनुमान (ए​ और बी​) योग को न्यूनतम करके प्राप्त किए जाते हैं।

LAD विधि न्यूनतम वर्ग विधि की तुलना में आउटलेर्स के प्रति कम संवेदनशील है, जो इसे तिरछे या भारी-पूंछ वाले अवशिष्ट वितरण की उपस्थिति में एक मजबूत प्रतिगमन तकनीक बनाती है।[6]


सारांश आँकड़े

माध्य हस्ताक्षरित विचलन

एक अनुमानक के पूर्वाग्रह के लिए, न देखे गए जनसंख्या पैरामीटर मान से सभी अवलोकनों के पूरे सेट में हस्ताक्षरित विचलन का औसत मनमाने ढंग से बड़ी संख्या में नमूनों पर शून्य होता है। हालाँकि, निर्माण के अनुसार नमूना औसत मूल्य से मूल्यों के हस्ताक्षरित विचलन का औसत हमेशा शून्य होता है, हालांकि केंद्रीय प्रवृत्ति के किसी अन्य माप, जैसे नमूना माध्यिका से औसत हस्ताक्षरित विचलन, शून्य होने की आवश्यकता नहीं है।

माध्य हस्ताक्षरित विचलन एक सांख्यिकीय माप है जिसका उपयोग केंद्रीय बिंदु से मूल्यों के एक सेट के औसत विचलन का आकलन करने के लिए किया जाता है, आमतौर पर माध्य। इसकी गणना प्रत्येक डेटा बिंदु और डेटासेट के माध्य के बीच हस्ताक्षरित अंतर का अंकगणितीय माध्य लेकर की जाती है।

हस्ताक्षरित शब्द इंगित करता है कि विचलनों को उनके संबंधित संकेतों के साथ माना जाता है, जिसका अर्थ है कि वे औसत से ऊपर या नीचे हैं। गणना में सकारात्मक विचलन (माध्य से ऊपर) और नकारात्मक विचलन (माध्य से नीचे) शामिल हैं। माध्य हस्ताक्षरित विचलन माध्य से डेटा बिंदुओं की औसत दूरी और दिशा का माप प्रदान करता है, जो डेटा की समग्र प्रवृत्ति और वितरण में अंतर्दृष्टि प्रदान करता है।[7]


फैलाव

विचलनों के वितरण के आँकड़ों का उपयोग सांख्यिकीय फैलाव के माप के रूप में किया जाता है।

विभिन्न मानक विचलन वाला वितरण अपने डेटा बिंदुओं के बीच फैलाव की अलग-अलग डिग्री को दर्शाता है। सामान्य वितरण में माध्य से पहला मानक विचलन लगभग 68% डेटा को शामिल करता है। सामान्य वितरण में माध्य से दूसरे मानक विचलन में डेटा का एक बड़ा हिस्सा शामिल होता है, जो लगभग 95% अवलोकनों को कवर करता है।

* मानक विचलन किसी डेटासेट के प्रसार या फैलाव का व्यापक रूप से उपयोग किया जाने वाला माप है। यह डेटासेट के माध्य से व्यक्तिगत डेटा बिंदुओं की भिन्नता या विचलन की औसत मात्रा निर्धारित करता है। यह वर्ग (बीजगणित) विचलन का उपयोग करता है, और इसमें वांछनीय गुण हैं। मानक विचलन चरम मूल्यों के प्रति संवेदनशील है, इसलिए यह मजबूत आँकड़े नहीं हैं।[8]

  • औसत निरपेक्ष विचलन डेटासेट में फैलाव का एक माप है जो चरम मूल्यों से कम प्रभावित होता है। इसकी गणना प्रत्येक डेटा बिंदु और माध्य के बीच पूर्ण अंतर ज्ञात करके, इन पूर्ण अंतरों को जोड़कर और फिर अवलोकनों की संख्या से विभाजित करके की जाती है। यह मीट्रिक मानक विचलन की तुलना में परिवर्तनशीलता का अधिक मजबूत अनुमान प्रदान करता है।[9]
  • माध्यिका निरपेक्ष विचलन एक मजबूत आँकड़ा है जो किसी डेटासेट के प्रसार को मापने के लिए माध्य के बजाय माध्य का उपयोग करता है। इसकी गणना प्रत्येक डेटा बिंदु और माध्यिका के बीच पूर्ण अंतर ज्ञात करके, फिर इन पूर्ण अंतरों के माध्यिका की गणना करके की जाती है। यह औसत पूर्ण विचलन को आउटलेर्स के प्रति कम संवेदनशील बनाता है, जो मानक विचलन के लिए एक मजबूत विकल्प प्रदान करता है।[10]
  • अधिकतम निरपेक्ष विचलन किसी व्यक्तिगत डेटा बिंदु और डेटासेट के माध्य के बीच अधिकतम अंतर का एक सीधा माप है। हालाँकि, यह अत्यधिक गैर-मजबूत है, क्योंकि यह एकल चरम मूल्य से असंगत रूप से प्रभावित हो सकता है। आउटलेर्स वाले डेटासेट से निपटने के दौरान यह मीट्रिक फैलाव का एक विश्वसनीय माप प्रदान नहीं कर सकता है।[9]


सामान्यीकरण

विचलन, जो देखे गए मानों और कुछ संदर्भ बिंदु के बीच अंतर को मापते हैं, स्वाभाविक रूप से उपयोग किए गए माप पैमाने के अनुरूप इकाइयां रखते हैं। उदाहरण के लिए, यदि लंबाई मापी जा रही है, तो विचलन मीटर या फीट जैसी इकाइयों में व्यक्त किया जाएगा। विचलन को इकाई रहित बनाने और विभिन्न डेटासेटों में तुलना की सुविधा के लिए, गैर-आयामीकरण किया जा सकता है।

एक सामान्य विधि में विचलन को पैमाने (सांख्यिकीय फैलाव) के माप से विभाजित करना शामिल है, मानकीकरण के लिए जनसंख्या मानक विचलन का उपयोग किया जाता है या छात्रीकरण के लिए नमूना मानक विचलन (उदाहरण के लिए, छात्रकृत अवशिष्ट)।

गैर-आयामीकरण का एक अन्य दृष्टिकोण फैलाव के बजाय स्थान के आधार पर स्केलिंग पर केंद्रित है। प्रतिशत विचलन इस पद्धति का एक उदाहरण प्रस्तुत करता है, जिसकी गणना प्रेक्षित मूल्य और स्वीकृत मूल्य के बीच अंतर के रूप में की जाती है, जिसे स्वीकृत मूल्य से विभाजित किया जाता है, और फिर 100% से गुणा किया जाता है। स्वीकृत मूल्य के आधार पर विचलन को स्केल करके, यह तकनीक प्रतिशत के संदर्भ में विचलन को व्यक्त करने की अनुमति देती है, जो देखे गए और स्वीकृत मूल्यों के बीच सापेक्ष अंतर पर एक स्पष्ट परिप्रेक्ष्य प्रदान करती है। गैर-आयामीकरण के दोनों तरीके विशिष्ट माप इकाइयों से परे विचलन को तुलनीय और व्याख्या योग्य बनाने के उद्देश्य से काम करते हैं।[11]


उदाहरण

एक उदाहरण में, एक विशेष माध्यम में ध्वनि की गति की माप की एक श्रृंखला ली जाती है। सैद्धांतिक गणना के आधार पर इस माध्यम में ध्वनि की गति के लिए स्वीकृत या अपेक्षित मान 343 मीटर प्रति सेकंड है।

अब, एक प्रयोग के दौरान, विभिन्न शोधकर्ताओं द्वारा कई माप लिए जाते हैं। शोधकर्ता ए ने ध्वनि की गति 340 मीटर प्रति सेकंड मापी, जिसके परिणामस्वरूप अपेक्षित मान से -3 मीटर प्रति सेकंड का विचलन हुआ। दूसरी ओर, शोधकर्ता बी, गति को 345 मीटर प्रति सेकंड मापता है, जिसके परिणामस्वरूप +2 मीटर प्रति सेकंड का विचलन होता है।

इस वैज्ञानिक संदर्भ में, विचलन यह निर्धारित करने में मदद करता है कि व्यक्तिगत माप सैद्धांतिक रूप से अनुमानित या स्वीकृत मूल्य से कैसे भिन्न हैं। यह प्रयोगात्मक परिणामों की सटीकता और परिशुद्धता में अंतर्दृष्टि प्रदान करता है, जिससे शोधकर्ताओं को अपने डेटा की विश्वसनीयता का आकलन करने और विसंगतियों में योगदान देने वाले कारकों की संभावित पहचान करने की अनुमति मिलती है।

एक अन्य उदाहरण में, मान लीजिए कि स्टोइकोमेट्री के आधार पर एक रासायनिक प्रतिक्रिया से 100 ग्राम विशिष्ट यौगिक प्राप्त होने की उम्मीद है। हालाँकि, एक वास्तविक प्रयोगशाला प्रयोग में, विभिन्न स्थितियों के साथ कई परीक्षण किए जाते हैं।

परीक्षण 1 में, वास्तविक उपज 95 ग्राम मापी गई, जिसके परिणामस्वरूप अपेक्षित उपज से −5 ग्राम का विचलन हुआ। परीक्षण 2 में, वास्तविक उपज 102 ग्राम मापी गई, जिसके परिणामस्वरूप +2 ग्राम का विचलन हुआ। अपेक्षित मूल्य से ये विचलन विभिन्न परिस्थितियों में रासायनिक प्रतिक्रिया की दक्षता और प्रतिलिपि प्रस्तुत करने योग्यता के बारे में बहुमूल्य जानकारी प्रदान करते हैं।

वैज्ञानिक प्रतिक्रिया स्थितियों को अनुकूलित करने, त्रुटि के संभावित स्रोतों की पहचान करने और प्रक्रिया की समग्र उपज और विश्वसनीयता में सुधार करने के लिए इन विचलनों का विश्लेषण कर सकते हैं। विचलन की अवधारणा प्रयोगात्मक परिणामों की सटीकता का आकलन करने और वैज्ञानिक प्रयोगों के परिणामों को बढ़ाने के लिए सूचित निर्णय लेने में महत्वपूर्ण है।

यह भी देखें

संदर्भ

  1. 1.0 1.1 1.2 Lee, Dong Kyu; In, Junyong; Lee, Sangseok (2015). "मानक विचलन और माध्य की मानक त्रुटि". Korean Journal of Anesthesiology. 68 (3): 220. doi:10.4097/kjae.2015.68.3.220. ISSN 2005-6419.
  2. Livingston, Edward H. (June 2004). "The mean and standard deviation: what does it all mean?". Journal of Surgical Research. 119 (2): 117–123. doi:10.1016/j.jss.2004.02.008. ISSN 0022-4804.
  3. Dodge, Yadolah, ed. (2003-08-07). सांख्यिकी शर्तों का ऑक्सफोर्ड डिक्शनरी. Oxford University PressOxford. ISBN 978-0-19-850994-3.
  4. Konno, Hiroshi; Koshizuka, Tomoyuki (2005-10-01). "माध्य-पूर्ण विचलन मॉडल". IIE Transactions. 37 (10): 893–900. doi:10.1080/07408170591007786. ISSN 0740-817X.
  5. Pham-Gia, T.; Hung, T. L. (2001-10-01). "माध्य और माध्य निरपेक्ष विचलन". Mathematical and Computer Modelling. 34 (7): 921–936. doi:10.1016/S0895-7177(01)00109-1. ISSN 0895-7177.
  6. Chen, Kani; Ying, Zhiliang (1996-04-01). "हॉल-वेलनर बैंड से संबंधित अनुमान का एक प्रति उदाहरण". The Annals of Statistics. 24 (2). doi:10.1214/aos/1032894456. ISSN 0090-5364.
  7. Dodge, Yadolah, ed. (2003-08-07). सांख्यिकी शर्तों का ऑक्सफोर्ड डिक्शनरी. Oxford University PressOxford. ISBN 978-0-19-850994-3.
  8. "2. Mean and standard deviation | The BMJ". The BMJ | The BMJ: leading general medical journal. Research. Education. Comment. 2020-10-28. Retrieved 2022-11-02.
  9. 9.0 9.1 Pham-Gia, T.; Hung, T. L. (2001-10-01). "माध्य और माध्य निरपेक्ष विचलन". Mathematical and Computer Modelling. 34 (7): 921–936. doi:10.1016/S0895-7177(01)00109-1. ISSN 0895-7177.
  10. Jones, Alan R. (2018-10-09). संभाव्यता, सांख्यिकी और अन्य भयावह सामग्री. Routledge. p. 73. ISBN 978-1-351-66138-6.
  11. Freedman, David; Pisani, Robert; Purves, Roger (2007). आंकड़े (4 ed.). New York: Norton. ISBN 978-0-393-93043-6.