सांख्यिकीय विश्वसनीयता. रूपांतरण अनुकूलन में सांख्यिकीय महत्व क्या है?

सांख्यिकीय अनुमान को उचित ठहराते समय, यह प्रश्न अवश्य पूछा जाना चाहिए: शून्य परिकल्पना को स्वीकार करने और अस्वीकार करने के बीच की रेखा कहाँ है? प्रयोग में यादृच्छिक प्रभावों की उपस्थिति के कारण, यह सीमा बिल्कुल सटीक रूप से नहीं खींची जा सकती है। यह अवधारणा पर आधारित है स्तर का महत्व। स्तर का महत्व शून्य परिकल्पना को ग़लत ढंग से अस्वीकार करने की प्रायिकता कहलाती है। या, दूसरे शब्दों में, महत्वपूर्ण स्तर - निर्णय लेते समय यह प्रथम प्रकार की त्रुटि की संभावना है। इस संभावना को दर्शाने के लिए, एक नियम के रूप में, वे या तो ग्रीक अक्षर α या लैटिन अक्षर का उपयोग करते हैं आर।निम्नलिखित में हम अक्षर का प्रयोग करेंगे आर।

ऐतिहासिक रूप से, व्यावहारिक विज्ञानों में जो सांख्यिकी का उपयोग करते हैं, और विशेष रूप से मनोविज्ञान में, सांख्यिकीय महत्व का निम्नतम स्तर माना जाता है पी = 0.05; पर्याप्त - स्तर आर= 0.01 और उच्चतर स्तर पी = 0.001. इसलिए, सांख्यिकी पाठ्यपुस्तकों के परिशिष्ट में दी गई सांख्यिकीय तालिकाओं में, स्तरों के लिए सारणीबद्ध मान आमतौर पर दिए जाते हैं पी = 0,05, पी = 0.01 और आर= 0.001. कभी-कभी स्तरों के लिए सारणीबद्ध मान दिए जाते हैं आर - 0.025 और पी = 0,005.

0.05, 0.01 और 0.001 के मान सांख्यिकीय महत्व के तथाकथित मानक स्तर हैं। प्रयोगात्मक डेटा का सांख्यिकीय विश्लेषण करते समय, एक मनोवैज्ञानिक को, अध्ययन के उद्देश्यों और परिकल्पनाओं के आधार पर, महत्व के आवश्यक स्तर का चयन करना होगा। जैसा कि हम देख सकते हैं, यहां सबसे बड़ा मूल्य, या सांख्यिकीय महत्व के स्तर की निचली सीमा, 0.05 के बराबर है - इसका मतलब है कि एक सौ तत्वों (मामलों, विषयों) के नमूने में पांच त्रुटियां या बीस में एक त्रुटि की अनुमति है तत्व (मामले, विषय)। ऐसा माना जाता है कि हम न तो छह, न सात, न ही सौ में से अधिक बार गलती नहीं कर सकते। ऐसी गलतियों की कीमत बहुत अधिक होगी.

ध्यान दें कि कंप्यूटर पर आधुनिक सांख्यिकीय पैकेज मानक महत्व स्तरों का उपयोग नहीं करते हैं, बल्कि संबंधित सांख्यिकीय पद्धति के साथ काम करने की प्रक्रिया में सीधे स्तरों की गणना की जाती है। ये स्तर, पत्र द्वारा निर्दिष्ट हैं आर,उदाहरण के लिए, 0 से 1 तक की सीमा में एक अलग संख्यात्मक अभिव्यक्ति हो सकती है, पी = 0,7, आर= 0.23 या आर= 0.012. यह स्पष्ट है कि पहले दो मामलों में प्राप्त महत्व का स्तर बहुत अधिक है और यह कहना असंभव है कि परिणाम महत्वपूर्ण है। वहीं, बाद वाले मामले में परिणाम 12 हजारवें स्तर पर महत्वपूर्ण हैं। यह एक विश्वसनीय स्तर है.

सांख्यिकीय निष्कर्ष को स्वीकार करने का नियम इस प्रकार है: प्राप्त प्रयोगात्मक डेटा के आधार पर, मनोवैज्ञानिक अपने द्वारा चुनी गई सांख्यिकीय पद्धति का उपयोग करके तथाकथित अनुभवजन्य सांख्यिकी या अनुभवजन्य मूल्य की गणना करता है। इस मात्रा को इस प्रकार निरूपित करना सुविधाजनक है एच ईएम . फिर अनुभवजन्य आँकड़े एच ईएम इसकी तुलना दो महत्वपूर्ण मानों से की जाती है जो चयनित सांख्यिकीय पद्धति के लिए 5% और 1% के महत्व स्तरों के अनुरूप हैं और जिन्हें इस प्रकार दर्शाया गया है एच करोड़ . मात्रा एच करोड़ किसी भी सांख्यिकी पाठ्यपुस्तक के परिशिष्ट में दी गई संबंधित तालिकाओं का उपयोग करके किसी दी गई सांख्यिकीय पद्धति के लिए पाया जाता है। ये मात्राएँ, एक नियम के रूप में, हमेशा भिन्न होती हैं और सुविधा के लिए, उन्हें इस प्रकार कहा जा सकता है एच kr1और एच kr2 . तालिकाओं से महत्वपूर्ण मान प्राप्त हुए एच kr1और एच kr2इसे निम्नलिखित मानक संकेतन रूप में प्रस्तुत करना सुविधाजनक है:

हालाँकि, हम इस बात पर ज़ोर देते हैं कि हमने नोटेशन का उपयोग किया है एच ईएम और एच करोड़ "संख्या" शब्द के संक्षिप्त रूप के रूप में। सभी सांख्यिकीय विधियों ने इन सभी मात्राओं के लिए अपने स्वयं के प्रतीकात्मक पदनाम अपनाए हैं: संबंधित सांख्यिकीय विधि का उपयोग करके गणना की गई अनुभवजन्य मूल्य और संबंधित तालिकाओं से पाया गया महत्वपूर्ण मूल्य दोनों। उदाहरण के लिए, इस गुणांक के महत्वपूर्ण मूल्यों की एक तालिका का उपयोग करके स्पीयरमैन रैंक सहसंबंध गुणांक की गणना करते समय, निम्नलिखित महत्वपूर्ण मान पाए गए, जो इस विधि के लिए ग्रीक अक्षर ρ ("rho") द्वारा दर्शाए गए हैं। अभीतक के लिए तो पी =तालिका से 0.05 मान प्राप्त हुआ ρ करोड़ 1 = 0.61 और के लिए पी = 0.01 परिमाण ρ करोड़ 2 = 0,76.

निम्नलिखित प्रस्तुति में अपनाए गए नोटेशन के मानक रूप में, यह इस तरह दिखता है:

अब हमें अपने अनुभवजन्य मूल्य की तुलना तालिकाओं से पाए गए दो महत्वपूर्ण मूल्यों से करने की आवश्यकता है। ऐसा करने का सबसे अच्छा तरीका यह है कि तीनों संख्याओं को "महत्व अक्ष" पर रखा जाए। "महत्व की धुरी" एक सीधी रेखा है, जिसके बाएँ सिरे पर 0 है, हालाँकि, एक नियम के रूप में, यह इस सीधी रेखा पर अंकित नहीं है, और बाएँ से दाएँ संख्या श्रृंखला में वृद्धि होती है। वास्तव में, यह सामान्य स्कूल एब्सिस्सा अक्ष है ओहकार्तीय समन्वय प्रणाली। हालाँकि, इस अक्ष की ख़ासियत यह है कि इसमें तीन खंड, "ज़ोन" हैं। एक चरम क्षेत्र को महत्वहीन क्षेत्र कहा जाता है, दूसरे चरम क्षेत्र को महत्व का क्षेत्र कहा जाता है, और मध्यवर्ती क्षेत्र को अनिश्चितता का क्षेत्र कहा जाता है। तीनों जोन की सीमाएं हैं एच kr1के लिए पी = 0.05 और एच kr2 के लिए पी = 0.01, जैसा कि चित्र में दिखाया गया है।

इस सांख्यिकीय पद्धति में निर्धारित निर्णय नियम (अनुमान नियम) के आधार पर दो विकल्प संभव हैं।

पहला विकल्प: यदि वैकल्पिक परिकल्पना स्वीकार की जाती है एच ईएमएच करोड़ .

या दूसरा विकल्प: यदि वैकल्पिक परिकल्पना स्वीकार की जाती है एच ईएमएच करोड़ .

गिना हुआ एच ईएम कुछ सांख्यिकीय पद्धति के अनुसार, इसे आवश्यक रूप से तीन क्षेत्रों में से एक में आना चाहिए।

यदि अनुभवजन्य मूल्य महत्वहीनता के क्षेत्र में आता है, तो मतभेदों की अनुपस्थिति के बारे में परिकल्पना एच 0 को स्वीकार किया जाता है।

अगर एच ईएम महत्व के क्षेत्र में आता है, वैकल्पिक परिकल्पना एच 1 स्वीकार की जाती है हे मतभेदों की उपस्थिति तथा परिकल्पना H0 अस्वीकृत होती है।

अगर एच ईएम अनिश्चितता के क्षेत्र में आने पर शोधकर्ता को दुविधा का सामना करना पड़ता है। इसलिए, हल की जा रही समस्या के महत्व के आधार पर, वह प्राप्त सांख्यिकीय अनुमान को 5% के स्तर पर विश्वसनीय मान सकता है, और इस तरह परिकल्पना एच 0 को अस्वीकार करते हुए परिकल्पना एच 1 को स्वीकार कर सकता है। , या - 1% के स्तर पर अविश्वसनीय, जिससे परिकल्पना एच 0 को स्वीकार किया जा सके। हालाँकि, हम इस बात पर जोर देते हैं कि यह बिल्कुल वैसा ही मामला है जब एक मनोवैज्ञानिक पहले या दूसरे प्रकार की गलतियाँ कर सकता है। जैसा कि ऊपर चर्चा की गई है, इन परिस्थितियों में नमूना आकार बढ़ाना सबसे अच्छा है।

आइए हम उस मूल्य पर भी जोर दें एच ईएम बिल्कुल मेल खा सकता है एच kr1या एच kr2 . पहले मामले में, हम मान सकते हैं कि अनुमान बिल्कुल 5% के स्तर पर विश्वसनीय है और परिकल्पना एच 1 को स्वीकार करते हैं, या, इसके विपरीत, परिकल्पना एच 0 को स्वीकार करते हैं। दूसरे मामले में, एक नियम के रूप में, मतभेदों की उपस्थिति के बारे में वैकल्पिक परिकल्पना एच 1 को स्वीकार किया जाता है, और परिकल्पना एच 0 को खारिज कर दिया जाता है।

आपको क्या लगता है कि आपके "अन्य आधे" को क्या विशेष और सार्थक बनाता है? क्या इसका संबंध उसके व्यक्तित्व से है या आपकी भावनाओं से है जो आपके मन में इस व्यक्ति के लिए है? या शायद इस साधारण तथ्य के साथ कि आपकी सहानुभूति की यादृच्छिकता के बारे में परिकल्पना, जैसा कि अध्ययनों से पता चलता है, की संभावना 5% से कम है? यदि हम अंतिम कथन को विश्वसनीय मानते हैं, तो सफल डेटिंग साइटें सिद्धांत रूप में मौजूद नहीं होंगी:

जब आप विभाजित परीक्षण या अपनी वेबसाइट का कोई अन्य विश्लेषण करते हैं, तो "सांख्यिकीय महत्व" की गलतफहमी से परिणामों की गलत व्याख्या हो सकती है और इसलिए, रूपांतरण अनुकूलन प्रक्रिया में गलत कार्य हो सकते हैं। यह प्रत्येक मौजूदा उद्योग में प्रतिदिन किए जाने वाले हजारों अन्य सांख्यिकीय परीक्षणों के लिए सच है।

यह समझने के लिए कि "सांख्यिकीय महत्व" क्या है, आपको इस शब्द के इतिहास में गोता लगाना होगा, इसका सही अर्थ सीखना होगा और समझना होगा कि यह "नई" पुरानी समझ आपके शोध के परिणामों की सही व्याख्या करने में कैसे मदद करेगी।

थोड़ा इतिहास

यद्यपि मानवता कई शताब्दियों से विभिन्न समस्याओं को हल करने के लिए सांख्यिकी का उपयोग कर रही है, सांख्यिकीय महत्व, परिकल्पना परीक्षण, यादृच्छिकीकरण और यहां तक ​​कि प्रयोगों के डिजाइन (डीओई) की आधुनिक समझ ने 20 वीं शताब्दी की शुरुआत में ही आकार लेना शुरू कर दिया था और इसके साथ अटूट रूप से जुड़ा हुआ है। सर रोनाल्ड फिशर का नाम (सर रोनाल्ड फिशर, 1890-1962):

रोनाल्ड फिशर एक विकासवादी जीवविज्ञानी और सांख्यिकीविद् थे जिन्हें जानवरों और पौधों के साम्राज्य में विकास और प्राकृतिक चयन के अध्ययन के लिए विशेष जुनून था। अपने शानदार करियर के दौरान, उन्होंने कई उपयोगी सांख्यिकीय उपकरण विकसित और लोकप्रिय बनाए जिनका हम आज भी उपयोग करते हैं।

फिशर ने जीव विज्ञान में प्रभुत्व, उत्परिवर्तन और आनुवंशिक विचलन जैसी प्रक्रियाओं को समझाने के लिए अपने द्वारा विकसित तकनीकों का उपयोग किया। हम आज वेब संसाधनों की सामग्री को अनुकूलित और बेहतर बनाने के लिए उन्हीं टूल का उपयोग कर सकते हैं। यह तथ्य कि इन विश्लेषण उपकरणों का उपयोग उन वस्तुओं के साथ काम करने के लिए किया जा सकता है जो उनके निर्माण के समय अस्तित्व में ही नहीं थीं, काफी आश्चर्यजनक लगती हैं। यह भी उतना ही आश्चर्यजनक है कि लोग बिना कैलकुलेटर या कंप्यूटर के जटिल गणनाएँ करते थे।

एक सांख्यिकीय प्रयोग के परिणामों को सच होने की उच्च संभावना के रूप में वर्णित करने के लिए, फिशर ने "महत्व" शब्द का उपयोग किया।

इसके अलावा, फिशर के सबसे दिलचस्प विकासों में से एक को "सेक्सी बेटा" परिकल्पना कहा जा सकता है। इस सिद्धांत के अनुसार, महिलाएं यौन रूप से कामुक पुरुषों (प्रॉमिसक्यूस) को पसंद करती हैं क्योंकि इससे इन पुरुषों से पैदा होने वाले बेटों में समान प्रवृत्ति होगी और वे अधिक संतान पैदा कर सकेंगे (ध्यान दें कि यह सिर्फ एक सिद्धांत है)।

लेकिन कोई भी, यहाँ तक कि प्रतिभाशाली वैज्ञानिक भी, गलतियाँ करने से अछूता नहीं है। फिशर की खामियाँ आज भी विशेषज्ञों को परेशान करती हैं। लेकिन अल्बर्ट आइंस्टीन के शब्दों को याद रखें: "जिसने कभी गलती नहीं की उसने कभी कुछ नया नहीं बनाया।"

अगले बिंदु पर जाने से पहले, याद रखें: सांख्यिकीय महत्व तब होता है जब परीक्षण के परिणामों में अंतर इतना बड़ा होता है कि अंतर को यादृच्छिक कारकों द्वारा समझाया नहीं जा सकता है।

आपकी परिकल्पना क्या है?

यह समझने के लिए कि "सांख्यिकीय महत्व" का क्या अर्थ है, आपको पहले यह समझने की आवश्यकता है कि "परिकल्पना परीक्षण" क्या है, क्योंकि दोनों शब्द आपस में घनिष्ठ रूप से जुड़े हुए हैं।
एक परिकल्पना सिर्फ एक सिद्धांत है. एक बार जब आप एक सिद्धांत विकसित कर लेते हैं, तो आपको पर्याप्त सबूत इकट्ठा करने और वास्तव में उस सबूत को इकट्ठा करने के लिए एक प्रक्रिया स्थापित करने की आवश्यकता होगी। परिकल्पनाएँ दो प्रकार की होती हैं।

सेब या संतरे - कौन सा बेहतर है?

शून्य परिकल्पना

एक नियम के रूप में, यहीं पर कई लोगों को कठिनाइयों का अनुभव होता है। ध्यान रखने योग्य एक बात यह है कि शून्य परिकल्पना कोई ऐसी चीज़ नहीं है जिसे सिद्ध करने की आवश्यकता है, जैसे, उदाहरण के लिए, आप साबित करते हैं कि किसी वेबसाइट पर एक निश्चित परिवर्तन से रूपांतरण में वृद्धि होगी, लेकिन इसके विपरीत। शून्य परिकल्पना एक सिद्धांत है जो बताता है कि यदि आप साइट में कोई भी बदलाव करते हैं, तो कुछ नहीं होगा। और शोधकर्ता का लक्ष्य इस सिद्धांत का खंडन करना है, न कि इसे सिद्ध करना।

यदि हम अपराधों को सुलझाने के अनुभव को देखें, जहां जांचकर्ता यह भी परिकल्पना बनाते हैं कि अपराधी कौन है, तो शून्य परिकल्पना तथाकथित निर्दोषता की धारणा का रूप ले लेती है, वह अवधारणा जिसके अनुसार आरोपी को दोषी साबित होने तक निर्दोष माना जाता है। कानून की अदालत में.

यदि शून्य परिकल्पना यह है कि दो वस्तुएँ अपने गुणों में समान हैं, और आप यह साबित करने का प्रयास कर रहे हैं कि एक बेहतर है (उदाहरण के लिए, ए बी से बेहतर है), तो आपको विकल्प के पक्ष में शून्य परिकल्पना को अस्वीकार करने की आवश्यकता है। उदाहरण के लिए, आप एक या दूसरे रूपांतरण अनुकूलन उपकरण की तुलना कर रहे हैं। शून्य परिकल्पना में, उन दोनों का लक्ष्य पर समान प्रभाव (या कोई प्रभाव नहीं) पड़ता है। विकल्प के तौर पर इनमें से किसी एक का प्रभाव बेहतर होता है।

आपकी वैकल्पिक परिकल्पना में संख्यात्मक मान हो सकता है, जैसे B - A > 20%। इस मामले में, शून्य परिकल्पना और विकल्प निम्नलिखित रूप ले सकते हैं:

वैकल्पिक परिकल्पना का दूसरा नाम शोध परिकल्पना है क्योंकि शोधकर्ता हमेशा इस विशेष परिकल्पना को सिद्ध करने में रुचि रखता है।

सांख्यिकीय महत्व और पी मान

आइए रोनाल्ड फिशर और सांख्यिकीय महत्व की उनकी अवधारणा पर फिर से लौटें।

अब जब आपके पास एक शून्य परिकल्पना और एक विकल्प है, तो आप एक को कैसे साबित कर सकते हैं और दूसरे को कैसे अस्वीकार कर सकते हैं?

चूँकि आँकड़े, अपने स्वभाव से, एक विशिष्ट जनसंख्या (नमूना) का अध्ययन शामिल करते हैं, आप प्राप्त परिणामों के बारे में कभी भी 100% आश्वस्त नहीं हो सकते। एक अच्छा उदाहरण: चुनाव परिणाम अक्सर प्रारंभिक सर्वेक्षणों और यहां तक ​​कि एग्जिट पूल के परिणामों से भिन्न होते हैं।

डॉ. फिशर एक विभाजन रेखा बनाना चाहते थे जिससे आपको पता चल सके कि आपका प्रयोग सफल हुआ या नहीं। इस प्रकार विश्वसनीयता सूचकांक प्रकट हुआ। विश्वसनीयता वह स्तर है जिसे हम यह कहने के लिए अपनाते हैं कि हम क्या "महत्वपूर्ण" मानते हैं और क्या नहीं। यदि "पी", महत्व सूचकांक, 0.05 या उससे कम है, तो परिणाम विश्वसनीय हैं।

चिंता न करें, यह वास्तव में उतना भ्रमित करने वाला नहीं है जितना लगता है।

गाऊसी संभाव्यता वितरण. किनारों के साथ चर के कम संभावित मान हैं, केंद्र में सबसे अधिक संभावित हैं। पी-स्कोर (हरा छायांकित क्षेत्र) संयोग से घटित होने वाले प्रेक्षित परिणाम की संभावना है।

सामान्य संभाव्यता वितरण (गाऊसी वितरण) एक ग्राफ़ (ऊपर चित्र में) और उनकी आवृत्तियों पर एक निश्चित चर के सभी संभावित मूल्यों का प्रतिनिधित्व है। यदि आप अपना शोध सही ढंग से करते हैं और फिर अपने सभी उत्तरों को एक ग्राफ पर अंकित करते हैं, तो आपको बिल्कुल यही वितरण मिलेगा। सामान्य वितरण के अनुसार, आपको समान उत्तरों का एक बड़ा प्रतिशत प्राप्त होगा, और शेष विकल्प ग्राफ़ के किनारों (तथाकथित "पूंछ") पर स्थित होंगे। मूल्यों का यह वितरण प्रायः प्रकृति में पाया जाता है, इसीलिए इसे "सामान्य" कहा जाता है।

अपने नमूने और परीक्षण परिणामों के आधार पर एक समीकरण का उपयोग करके, आप गणना कर सकते हैं जिसे "परीक्षण आँकड़ा" कहा जाता है, जो इंगित करेगा कि आपके परिणाम कितने विचलित हैं। यह आपको यह भी बताएगा कि आप शून्य परिकल्पना के सत्य होने के कितने करीब हैं।

इसके बारे में जानने में आपकी सहायता के लिए, सांख्यिकीय महत्व की गणना करने के लिए ऑनलाइन कैलकुलेटर का उपयोग करें:

ऐसे कैलकुलेटर का एक उदाहरण

अक्षर "पी" इस संभावना को दर्शाता है कि शून्य परिकल्पना सत्य है। यदि संख्या छोटी है, तो यह परीक्षण समूहों के बीच अंतर को इंगित करेगा, जबकि शून्य परिकल्पना यह होगी कि वे समान हैं। ग्राफिक रूप से, ऐसा लगेगा कि आपका परीक्षण आँकड़ा आपके घंटी के आकार के वितरण की पूंछों में से एक के करीब होगा।

डॉ. फिशर ने महत्व सीमा को p ≤ 0.05 पर निर्धारित करने का निर्णय लिया। हालाँकि, यह कथन विवादास्पद है, क्योंकि इससे दो कठिनाइयाँ पैदा होती हैं:

1. सबसे पहले, तथ्य यह है कि आपने शून्य परिकल्पना को गलत साबित कर दिया है इसका मतलब यह नहीं है कि आपने वैकल्पिक परिकल्पना को साबित कर दिया है। इस सारे महत्व का मतलब सिर्फ इतना है कि आप A या B को साबित नहीं कर सकते।

2. दूसरे, यदि पी-स्कोर 0.049 है, तो इसका मतलब यह होगा कि शून्य परिकल्पना की संभावना 4.9% होगी। इसका मतलब यह हो सकता है कि आपके परीक्षण के परिणाम एक ही समय में सही और गलत दोनों हो सकते हैं।

आप पी-स्कोर का उपयोग कर सकते हैं या नहीं भी कर सकते हैं, लेकिन फिर आपको मामले-दर-मामले आधार पर शून्य परिकल्पना की संभावना की गणना करने की आवश्यकता होगी और यह तय करना होगा कि क्या यह आपके द्वारा योजनाबद्ध और परीक्षण किए गए परिवर्तनों को रोकने के लिए पर्याप्त बड़ा है या नहीं। .

आज सांख्यिकीय परीक्षण आयोजित करने का सबसे आम परिदृश्य परीक्षण चलाने से पहले पी ≤ 0.05 की महत्व सीमा निर्धारित करना है। बस अपने परिणामों की जाँच करते समय पी-वैल्यू को ध्यान से देखना सुनिश्चित करें।

त्रुटियाँ 1 और 2

इतना समय बीत चुका है कि सांख्यिकीय महत्व मीट्रिक का उपयोग करते समय होने वाली त्रुटियों को भी उनके अपने नाम दिए गए हैं।

टाइप 1 त्रुटियाँ

जैसा कि ऊपर उल्लेख किया गया है, 0.05 के पी-मान का मतलब है कि 5% संभावना है कि शून्य परिकल्पना सत्य है। यदि आप ऐसा नहीं करते हैं, तो आप गलती नंबर 1 कर रहे होंगे। परिणाम कहते हैं कि आपकी नई वेबसाइट ने आपकी रूपांतरण दरें बढ़ा दीं, लेकिन 5% संभावना है कि ऐसा नहीं हुआ।

टाइप 2 त्रुटियाँ

यह त्रुटि त्रुटि 1 के विपरीत है: आप शून्य परिकल्पना को तब स्वीकार करते हैं जब वह गलत हो। उदाहरण के लिए, परीक्षण के परिणाम आपको बताते हैं कि साइट में किए गए परिवर्तनों से कोई सुधार नहीं हुआ, जबकि परिवर्तन हुए थे। परिणामस्वरूप, आप अपना प्रदर्शन सुधारने का अवसर चूक जाते हैं।

अपर्याप्त नमूना आकार वाले परीक्षणों में यह त्रुटि आम है, इसलिए याद रखें: नमूना जितना बड़ा होगा, परिणाम उतना ही अधिक विश्वसनीय होगा।

निष्कर्ष

शायद कोई भी शब्द शोधकर्ताओं के बीच सांख्यिकीय महत्व जितना लोकप्रिय नहीं है। जब परीक्षण के परिणाम सांख्यिकीय रूप से महत्वपूर्ण नहीं पाए जाते हैं, तो परिणाम रूपांतरण दरों में वृद्धि से लेकर कंपनी के पतन तक होते हैं।

और चूंकि विपणक अपने संसाधनों का अनुकूलन करते समय इस शब्द का उपयोग करते हैं, इसलिए आपको यह जानना होगा कि इसका वास्तव में क्या मतलब है। परीक्षण की स्थितियाँ भिन्न हो सकती हैं, लेकिन नमूना आकार और सफलता मानदंड हमेशा महत्वपूर्ण होते हैं। यह याद रखना।

कार्य 3.पाँच प्रीस्कूलरों को एक परीक्षा दी जाती है। प्रत्येक कार्य को हल करने में लगने वाला समय दर्ज किया जाता है। क्या पहले तीन परीक्षण आइटमों को हल करने के समय के बीच सांख्यिकीय रूप से महत्वपूर्ण अंतर पाया जाएगा?

विषयों की संख्या

संदर्भ सामग्री

यह असाइनमेंट विचरण के विश्लेषण के सिद्धांत पर आधारित है। सामान्य तौर पर, विचरण के विश्लेषण का कार्य उन कारकों की पहचान करना है जिनका प्रयोग के परिणाम पर महत्वपूर्ण प्रभाव पड़ता है। यदि दो से अधिक नमूने हैं तो विचरण के विश्लेषण का उपयोग कई नमूनों के साधनों की तुलना करने के लिए किया जा सकता है। इस उद्देश्य के लिए विचरण का एक-तरफ़ा विश्लेषण उपयोग किया जाता है।

सौंपे गए कार्यों को हल करने के लिए निम्नलिखित को स्वीकार किया जाता है। यदि कारकों के प्रभाव के मामले में अनुकूलन पैरामीटर के प्राप्त मूल्यों की भिन्नता कारकों के प्रभाव की अनुपस्थिति में परिणामों के भिन्नता से भिन्न होती है, तो ऐसे कारक को महत्वपूर्ण माना जाता है।

जैसा कि समस्या के निरूपण से देखा जा सकता है, सांख्यिकीय परिकल्पनाओं के परीक्षण के तरीकों का उपयोग यहां किया जाता है, अर्थात्, दो अनुभवजन्य भिन्नताओं का परीक्षण करने का कार्य। इसलिए, विचरण का विश्लेषण फिशर परीक्षण का उपयोग करके विचरण के परीक्षण पर आधारित है। इस कार्य में, यह जांचना आवश्यक है कि छह प्रीस्कूलरों में से प्रत्येक द्वारा पहले तीन परीक्षण कार्यों को हल करने के समय के बीच अंतर सांख्यिकीय रूप से महत्वपूर्ण है या नहीं।

शून्य (मुख्य) परिकल्पना को आगे रखी गई परिकल्पना एच ओ कहा जाता है। ई का सार इस धारणा पर आधारित है कि तुलना किए गए मापदंडों के बीच का अंतर शून्य है (इसलिए परिकल्पना का नाम - शून्य है) और देखे गए अंतर यादृच्छिक हैं।

एक प्रतिस्पर्धी (वैकल्पिक) परिकल्पना को H1 कहा जाता है, जो शून्य परिकल्पना का खंडन करती है।

समाधान:

α = 0.05 के महत्व स्तर पर विचरण विधि के विश्लेषण का उपयोग करते हुए, हम छह प्रीस्कूलरों के लिए पहले तीन परीक्षण कार्यों को हल करने के समय के बीच सांख्यिकीय रूप से महत्वपूर्ण अंतर के अस्तित्व के बारे में शून्य परिकल्पना (एच ओ) का परीक्षण करेंगे।

आइए कार्य स्थितियों की तालिका देखें, जिसमें हम तीन परीक्षण कार्यों में से प्रत्येक को हल करने का औसत समय पाएंगे

विषयों की संख्या

कारक स्तर

पहले परीक्षण कार्य को हल करने का समय (सेकंड में)।

दूसरे परीक्षण कार्य को हल करने का समय (सेकंड में)।

तीसरे परीक्षण कार्य को हल करने का समय (सेकंड में)।

समूह औसत

समग्र औसत ज्ञात करना:

प्रत्येक परीक्षण में समय के अंतर के महत्व को ध्यान में रखने के लिए, कुल नमूना भिन्नता को दो भागों में विभाजित किया जाता है, जिनमें से पहले को फैक्टोरियल कहा जाता है, और दूसरे को - अवशिष्ट कहा जाता है।

आइए सूत्र का उपयोग करके समग्र औसत से वर्ग विचलन के कुल योग की गणना करें

या , जहां p परीक्षण कार्यों को हल करने के लिए समय माप की संख्या है, q परीक्षार्थियों की संख्या है। ऐसा करने के लिए, आइए वर्गों की एक तालिका बनाएं

विषयों की संख्या

कारक स्तर

पहले परीक्षण कार्य को हल करने का समय (सेकंड में)।

दूसरे परीक्षण कार्य को हल करने का समय (सेकंड में)।

तीसरे परीक्षण कार्य को हल करने का समय (सेकंड में)।

शोध आमतौर पर कुछ धारणाओं से शुरू होता है जिसके लिए तथ्यों का उपयोग करके सत्यापन की आवश्यकता होती है। यह धारणा - एक परिकल्पना - वस्तुओं के एक निश्चित समूह में घटना या गुणों के संबंध में तैयार की जाती है।

तथ्यों के विरुद्ध ऐसी धारणाओं का परीक्षण करने के लिए, उनके धारकों के संबंधित गुणों को मापना आवश्यक है। लेकिन सभी महिलाओं और पुरुषों में चिंता को मापना असंभव है, जैसे सभी किशोरों में आक्रामकता को मापना असंभव है। इसलिए, अनुसंधान करते समय, यह लोगों की प्रासंगिक आबादी के प्रतिनिधियों के केवल एक अपेक्षाकृत छोटे समूह तक ही सीमित होता है।

जनसंख्या— यह वस्तुओं का संपूर्ण समूह है जिसके संबंध में एक शोध परिकल्पना तैयार की जाती है।

उदाहरण के लिए, सभी पुरुष; या सभी महिलाएँ; या एक शहर के सभी निवासियों. सामान्य आबादी जिसके संबंध में शोधकर्ता अध्ययन के परिणामों के आधार पर निष्कर्ष निकालने जा रहा है, वह संख्या में अधिक मामूली हो सकती है, उदाहरण के लिए, किसी दिए गए स्कूल के सभी प्रथम-ग्रेडर।

इस प्रकार, सामान्य आबादी, हालांकि संख्या में अनंत नहीं है, लेकिन, एक नियम के रूप में, निरंतर अनुसंधान के लिए दुर्गम, संभावित विषयों का एक समूह है।

नमूना या नमूना जनसंख्या- यह संख्या में सीमित वस्तुओं का एक समूह है (मनोविज्ञान में - विषय, उत्तरदाता), विशेष रूप से इसके गुणों का अध्ययन करने के लिए सामान्य आबादी से चुना गया है। तदनुसार, एक नमूने का उपयोग करके सामान्य जनसंख्या के गुणों का अध्ययन कहा जाता है नमूना अध्ययन. लगभग सभी मनोवैज्ञानिक अध्ययन चयनात्मक हैं, और उनके निष्कर्ष सामान्य आबादी तक फैले हुए हैं।

इस प्रकार, एक परिकल्पना तैयार होने और संबंधित आबादी की पहचान होने के बाद, शोधकर्ता को एक नमूना व्यवस्थित करने की समस्या का सामना करना पड़ता है। नमूना ऐसा होना चाहिए कि नमूना अध्ययन के निष्कर्षों का सामान्यीकरण उचित हो - सामान्यीकरण, उनका सामान्य जनसंख्या तक विस्तार। शोध निष्कर्षों की वैधता के लिए मुख्य मानदंडये हैं नमूने की प्रतिनिधित्वशीलता और (अनुभवजन्य) परिणामों की सांख्यिकीय विश्वसनीयता।

नमूने की प्रतिनिधित्वशीलता- दूसरे शब्दों में, इसकी प्रतिनिधित्वशीलता अध्ययन के तहत घटनाओं को पूरी तरह से प्रस्तुत करने के लिए नमूने की क्षमता है - सामान्य जनसंख्या में उनकी परिवर्तनशीलता के दृष्टिकोण से।

बेशक, केवल सामान्य आबादी ही अध्ययन की जा रही घटना की पूरी तस्वीर दे सकती है, इसकी सभी सीमाओं और परिवर्तनशीलता की बारीकियों में। इसलिए, प्रतिनिधित्व हमेशा उस सीमा तक सीमित होता है जहां तक ​​नमूना सीमित होता है। और यह नमूने की प्रतिनिधित्वशीलता है जो शोध निष्कर्षों के सामान्यीकरण की सीमाओं को निर्धारित करने में मुख्य मानदंड है। हालाँकि, ऐसी तकनीकें हैं जो शोधकर्ता के लिए पर्याप्त नमूना प्रतिनिधित्व प्राप्त करना संभव बनाती हैं (इन तकनीकों का अध्ययन "प्रायोगिक मनोविज्ञान" पाठ्यक्रम में किया जाता है)।


पहली और मुख्य तकनीक सरल यादृच्छिक (यादृच्छिक) चयन है। इसमें ऐसी स्थितियाँ सुनिश्चित करना शामिल है कि जनसंख्या के प्रत्येक सदस्य को नमूने में शामिल होने के लिए दूसरों के साथ समान अवसर मिले। यादृच्छिक चयन यह सुनिश्चित करता है कि सामान्य जनसंख्या के विभिन्न प्रतिनिधियों को नमूने में शामिल किया जा सकता है। इस मामले में, चयन के दौरान किसी भी पैटर्न के उद्भव को रोकने के लिए विशेष उपाय किए जाते हैं। और यह हमें आशा करने की अनुमति देता है कि अंततः, नमूने में, अध्ययन की जा रही संपत्ति का प्रतिनिधित्व किया जाएगा, यदि सभी में नहीं, तो इसकी अधिकतम संभव विविधता में।

प्रतिनिधित्व सुनिश्चित करने का दूसरा तरीका स्तरीकृत यादृच्छिक नमूनाकरण, या सामान्य जनसंख्या के गुणों के आधार पर चयन है। इसमें उन गुणों का प्रारंभिक निर्धारण शामिल है जो अध्ययन की जा रही संपत्ति की परिवर्तनशीलता को प्रभावित कर सकते हैं (यह लिंग, आय का स्तर या शिक्षा आदि हो सकता है)। फिर सामान्य जनसंख्या में इन गुणों में भिन्न समूहों (स्तरों) की संख्या का प्रतिशत अनुपात निर्धारित किया जाता है और नमूने में संबंधित समूहों का एक समान प्रतिशत अनुपात सुनिश्चित किया जाता है। इसके बाद, सरल यादृच्छिक चयन के सिद्धांत के अनुसार नमूने के प्रत्येक उपसमूह में विषयों का चयन किया जाता है।

आंकड़ों की महत्ता,या सांख्यिकीय महत्व, एक अध्ययन के परिणाम सांख्यिकीय अनुमान विधियों का उपयोग करके निर्धारित किए जाते हैं।

क्या हम निर्णय लेते समय, शोध परिणामों से कुछ निष्कर्ष निकालते समय गलतियाँ करने से सुरक्षित हैं? बिल्कुल नहीं। आख़िरकार, हमारे निर्णय नमूना जनसंख्या के अध्ययन के परिणामों के साथ-साथ हमारे मनोवैज्ञानिक ज्ञान के स्तर पर आधारित होते हैं। हम गलतियों से पूरी तरह अछूते नहीं हैं। आँकड़ों में, ऐसी त्रुटियों को स्वीकार्य माना जाता है यदि वे 1000 में से एक मामले से अधिक बार नहीं होती हैं (त्रुटि संभावना α = 0.001 या सही निष्कर्ष की संबद्ध आत्मविश्वास संभावना पी = 0.999); 100 में से एक मामले में (त्रुटि की संभावना α = 0.01 या सही निष्कर्ष की संबद्ध आत्मविश्वास संभावना पी = 0.99) या 100 में से पांच मामलों में (त्रुटि की संभावना α = 0.05 या सही निष्कर्ष आउटपुट की संबंधित आत्मविश्वास की संभावना) पी=0.95). मनोविज्ञान में अंतिम दो स्तरों पर निर्णय लिए जाते हैं।

कभी-कभी, सांख्यिकीय महत्व के बारे में बात करते समय, वे "महत्व के स्तर" (α के रूप में चिह्नित) की अवधारणा का उपयोग करते हैं। पी और α के संख्यात्मक मान 1,000 तक एक दूसरे के पूरक हैं - घटनाओं का एक पूरा सेट: या तो हमने सही निष्कर्ष निकाला, या हमने गलती की। इन स्तरों की गणना नहीं की जाती, ये दिए जाते हैं। महत्व के स्तर को एक प्रकार की "लाल" रेखा के रूप में समझा जा सकता है, जिसका प्रतिच्छेदन हमें इस घटना को गैर-यादृच्छिक के रूप में बोलने की अनुमति देगा। प्रत्येक अच्छी वैज्ञानिक रिपोर्ट या प्रकाशन में, निकाले गए निष्कर्षों के साथ उस p या α मान का संकेत होना चाहिए जिस पर निष्कर्ष निकाले गए थे।

गणितीय सांख्यिकी पाठ्यक्रम में सांख्यिकीय अनुमान के तरीकों पर विस्तार से चर्चा की गई है। अब हम केवल यह नोट करते हैं कि संख्या के लिए उनकी कुछ निश्चित आवश्यकताएँ हैं, या नमूने का आकार।

दुर्भाग्य से, आवश्यक नमूना आकार पूर्व-निर्धारित करने के लिए कोई सख्त दिशानिर्देश नहीं हैं। इसके अलावा, शोधकर्ता को आमतौर पर आवश्यक और पर्याप्त संख्या के बारे में प्रश्न का उत्तर बहुत देर से मिलता है - केवल पहले से सर्वेक्षण किए गए नमूने के डेटा का विश्लेषण करने के बाद। हालाँकि, सबसे सामान्य सिफारिशें तैयार की जा सकती हैं:

1. निदान तकनीक विकसित करते समय सबसे बड़े नमूना आकार की आवश्यकता होती है - 200 से 1000-2500 लोगों तक।

2. यदि 2 नमूनों की तुलना करना आवश्यक हो तो उनकी कुल संख्या कम से कम 50 व्यक्ति होनी चाहिए; तुलना किए जाने वाले नमूनों की संख्या लगभग समान होनी चाहिए।

3. यदि किसी संपत्ति के बीच संबंध का अध्ययन किया जा रहा है तो सैंपल का आकार कम से कम 30-35 लोगों का होना चाहिए।

4. जितना अधिक परिवर्तनशीलताजिस संपत्ति का अध्ययन किया जा रहा है, नमूना आकार उतना ही बड़ा होना चाहिए। इसलिए, नमूने की एकरूपता को बढ़ाकर परिवर्तनशीलता को कम किया जा सकता है, उदाहरण के लिए, लिंग, आयु आदि के आधार पर। यह, निश्चित रूप से, निष्कर्ष को सामान्य बनाने की क्षमता को कम करता है।

आश्रित और स्वतंत्र नमूने।एक सामान्य शोध स्थिति तब होती है जब किसी शोधकर्ता की रुचि की संपत्ति का अध्ययन आगे की तुलना के उद्देश्य से दो या दो से अधिक नमूनों पर किया जाता है। ये नमूने उनके संगठन की प्रक्रिया के आधार पर अलग-अलग अनुपात में हो सकते हैं। स्वतंत्र नमूने इस तथ्य की विशेषता है कि एक नमूने में किसी भी विषय के चयन की संभावना दूसरे नमूने में किसी भी विषय के चयन पर निर्भर नहीं करती है। ख़िलाफ़, आश्रित नमूनेइस तथ्य की विशेषता है कि एक नमूने का प्रत्येक विषय एक निश्चित मानदंड के अनुसार दूसरे नमूने के एक विषय से मेल खाता है।

सामान्य तौर पर, आश्रित नमूनों में तुलनात्मक नमूनों में विषयों का जोड़ीवार चयन शामिल होता है, और स्वतंत्र नमूने विषयों के स्वतंत्र चयन का संकेत देते हैं।

यह ध्यान दिया जाना चाहिए कि "आंशिक रूप से निर्भर" (या "आंशिक रूप से स्वतंत्र") नमूनों के मामले अस्वीकार्य हैं: यह अप्रत्याशित रूप से उनकी प्रतिनिधित्वशीलता का उल्लंघन करता है।

निष्कर्ष में, हम ध्यान दें कि मनोवैज्ञानिक अनुसंधान के दो प्रतिमानों को प्रतिष्ठित किया जा सकता है।

तथाकथित आर-पद्धतिइसमें एक निश्चित प्रभाव, कारक या अन्य संपत्ति के प्रभाव में एक निश्चित संपत्ति (मनोवैज्ञानिक) की परिवर्तनशीलता का अध्ययन शामिल है। नमूना विषयों का एक समूह है।

एक और दृष्टिकोण क्यू-पद्धति,इसमें विभिन्न उत्तेजनाओं (परिस्थितियों, परिस्थितियों आदि) के प्रभाव में किसी विषय (व्यक्ति) की परिवर्तनशीलता का अध्ययन शामिल है। यह उस स्थिति से मेल खाता है जब नमूना उत्तेजनाओं का एक सेट है।

सांख्यिकीय अनुसंधान का कार्य अध्ययन के तहत घटना की प्रकृति के अंतर्निहित पैटर्न की पहचान करना है। संकेतक और औसत मूल्यों को वास्तविकता के प्रतिबिंब के रूप में काम करना चाहिए, जिसके लिए उनकी विश्वसनीयता की डिग्री निर्धारित करना आवश्यक है। जनसंख्या द्वारा नमूना जनसंख्या का सही प्रतिनिधित्व प्रतिनिधित्वशीलता कहलाता है . नमूना सांख्यिकीय मूल्यों की सटीकता और विश्वसनीयता का एक माप प्रतिनिधित्वशीलता (प्रतिनिधित्व) की औसत त्रुटियां हैं, जो अध्ययन की जा रही विशेषता के अनुसार नमूना आकार और नमूना आबादी की विविधता की डिग्री पर निर्भर करती हैं।

इसलिए, एक सांख्यिकीय अध्ययन के परिणामों की विश्वसनीयता की डिग्री निर्धारित करने के लिए, प्रत्येक सापेक्ष और औसत मूल्य के लिए संबंधित औसत त्रुटि की गणना करना आवश्यक है। सूचक एमपी की औसत त्रुटि की गणना सूत्र का उपयोग करके की जाती है:

जब प्रेक्षणों की संख्या 30 से कम हो, तो कहां

पी - प्रतिशत, पीपीएम, आदि में संकेतक का मूल्य।

क्यू - इस सूचक को 100 तक जोड़ना यदि यह प्रतिशत है, 1000 तक यदि % 0 है, आदि। (अर्थात् q = 100-पी, 1000-पी, आदि)

उदाहरण के लिए, यह ज्ञात है कि वर्ष के दौरान क्षेत्र में 224 लोग पेचिश से बीमार पड़ गये। जनसंख्या: 33,000। प्रति पेचिश घटना दर

इस सूचक की औसत त्रुटि

किसी संकेतक की विश्वसनीयता की डिग्री के मुद्दे को हल करने के लिए, एक आत्मविश्वास गुणांक (टी) निर्धारित किया जाता है, जो संकेतक के औसत त्रुटि के अनुपात के बराबर है, यानी।

हमारे उदाहरण में

टी जितना अधिक होगा, आत्मविश्वास की डिग्री उतनी ही अधिक होगी। t=1 पर, संकेतक की विश्वसनीयता की संभावना 68.3% है, t=2 पर - 95.5%, t=3 - 99.7% पर। चिकित्सा सांख्यिकीय अध्ययनों में, आमतौर पर 95.5%-99.0% के आत्मविश्वास स्तर (विश्वसनीयता) का उपयोग किया जाता है, और सबसे गंभीर मामलों में - 99.7%। इस प्रकार, हमारे उदाहरण में, घटना दर विश्वसनीय है।

यदि प्रेक्षणों की संख्या 30 से कम है, तो मानदंड का मान छात्र की तालिका का उपयोग करके निर्धारित किया जाता है। यदि परिणामी मूल्य तालिका मूल्य से अधिक या बराबर है, तो संकेतक विश्वसनीय है। यदि यह कम है तो यह विश्वसनीय नहीं है।

यदि दो सजातीय संकेतकों की तुलना करना आवश्यक है, तो उनके अंतर की विश्वसनीयता सूत्र द्वारा निर्धारित की जाती है:

(बड़ी संख्या में से छोटी संख्या घटा दी जाती है)

जहां पी 1 - पी 2 दो तुलनात्मक संकेतकों के बीच का अंतर है,

दो संकेतकों के बीच अंतर की औसत त्रुटि है।

उदाहरण के लिए, क्षेत्र बी में, वर्ष के दौरान 270 लोग पेचिश से बीमार पड़ गए। क्षेत्र की जनसंख्या 45,000 है इसलिए पेचिश की घटनाएँ हैं:

वे। घटना दर विश्वसनीय है.

जैसा कि आप देख सकते हैं, क्षेत्र बी में घटना क्षेत्र ए की तुलना में कम है। हम दो संकेतकों के बीच अंतर की विश्वसनीयता निर्धारित करने के लिए सूत्र का उपयोग करते हैं:

यदि बड़ी संख्या में अवलोकन (30 से अधिक) हैं, तो संकेतकों में अंतर सांख्यिकीय रूप से महत्वपूर्ण है यदि टी = 2 या अधिक। इस प्रकार, हमारे उदाहरण में, क्षेत्र ए में घटना काफी अधिक है, क्योंकि आत्मविश्वास गुणांक (t) 2 से अधिक है।

संकेतक की औसत त्रुटि के मूल्य को जानने के बाद, यादृच्छिक कारणों के प्रभाव के आधार पर इस संकेतक की विश्वास सीमा निर्धारित करना संभव है। आत्मविश्वास सीमाएँ सूत्र द्वारा निर्धारित की जाती हैं:

पी - सूचक;

मी इसकी औसत त्रुटि है;

t - आवश्यक विश्वसनीयता मान के आधार पर आत्मविश्वास गुणांक का चयन किया जाता है: t=1 68.3% मामलों में परिणाम की विश्वसनीयता से मेल खाता है, t=2 – 95.5%, t=2.6 – 99%, t=3 – 99.7 %, t=3.3 – 99.9 मान को अधिकतम त्रुटि कहा जाता है।

उदाहरण के लिए, क्षेत्र बी में, 99.7-9% की सटीकता के साथ पेचिश की घटनाओं की दर सीमा के भीतर यादृच्छिक कारकों के कारण उतार-चढ़ाव हो सकती है। 49.1 से 70.9 तक.