सांख्यिकीय अनुमान
सांख्यिकीयअनुमानं संभाव्यतायाः अन्तर्निहितवितरणस्य गुणानाम् अनुमानं कर्तुं दत्तांशविश्लेषणस्य उपयोगस्य प्रक्रिया अस्ति । अनुमानात्मकसांख्यिकीयविश्लेषणं जनसंख्यायाः गुणानाम् अनुमानं करोति, उदाहरणार्थं परिकल्पनानां परीक्षणेन अनुमानं च व्युत्पन्नं कृत्वा । अवलोकितं दत्तांशसमूहं बृहत्तरजनसंख्यातः नमूनाकृतम् इति कल्प्यते ।
अनुमानात्मकसांख्यिकीयानां वर्णनात्मकसांख्यिकीयैः सह विपरीतता कर्तुं शक्यते । वर्णनात्मकं सांख्यिकी केवलं अवलोकितानां दत्तांशस्य गुणैः सह सम्बद्धं भवति, तथा च दत्तांशः बृहत्तरजनसंख्यातः आगच्छति इति कल्पनायां न अवलम्बते यन्त्रशिक्षणे कदाचित् तस्य स्थाने अनुमानपदस्य प्रयोगः "पूर्वप्रशिक्षितस्य प्रतिरूपस्य मूल्याङ्कनं कृत्वा, पूर्वानुमानं कुरुत" इति अर्थः भवति;अस्मिन् सन्दर्भे प्रतिरूपस्य गुणानाम् अनुमानं प्रशिक्षणं वा शिक्षणं वा (अनुमानस्य अपेक्षया) इति उच्यते, पूर्वानुमानार्थं च प्रतिरूपस्य उपयोगः अनुमानः (भविष्यवाणीयाः स्थाने) इति उच्यते
आमुख
सम्पादयतुसांख्यिकीय-अनुमानं जनसंख्यायाः विषये प्रस्तावान् करोति, जनसंख्यातः आकृष्टानां दत्तांशस्य उपयोगेन केनचित् प्रकारेण नमूनाकरणेन सह । जनसंख्यायाः विषये परिकल्पना दत्ता, यस्याः कृते वयं अनुमानं कर्तुम् इच्छामः, सांख्यिकीयअनुमानं (प्रथमं) दत्तांशं जनयति प्रक्रियायाः सांख्यिकीयप्रतिरूपस्य चयनं कृत्वा (द्वितीयम्) प्रतिरूपात् प्रस्तावान् निष्कर्षयितुं भवति
कोनिशी & कितागावा इत्यस्य कथनमस्ति यत्, "सांख्यिकीय-अनुमानस्य अधिकांशसमस्याः सांख्यिकीय-प्रतिरूपण-सम्बद्धाः समस्याः इति गणयितुं शक्यन्ते" इति । [१] तत्सम्बद्धं सर डेविड् कॉक्स् इत्यनेन उक्तं यत्, "विषयसमस्यातः सांख्यिकीयप्रतिरूपं प्रति अनुवादः कथं भवति इति प्रायः विश्लेषणस्य सर्वाधिकं महत्त्वपूर्णः भागः भवति" इति [२]
सांख्यिकीयनुमानस्य निष्कर्षः सांख्यिकीयप्रस्तावः भवति । सांख्यिकीयप्रस्तावस्य केचन सामान्यरूपाः निम्नलिखितरूपेण सन्ति ।
- एकं बिन्दु-अनुमानं, अर्थात् एकं विशेषं मूल्यं यत् रुचिस्य कस्यचित् मापदण्डस्य सर्वोत्तम-अनुमानं करोति;
- एकः अन्तराल-अनुमानः, यथा- एकः विश्वासान्तरः (अथवा सेट् अनुमानः), अर्थात् जनसंख्यातः आकृष्टस्य दत्तांशसमूहस्य उपयोगेन निर्मितः अन्तरालः यथा, एतादृशानां दत्तांशसमूहानां पुनः पुनः नमूनाकरणस्य अन्तर्गतं, एतादृशेषु अन्तरालेषु उक्तविश्वासस्तरस्य संभाव्यतायाः सह सच्चं पैरामीटर् मूल्यं भवति
- विश्वसनीयः अन्तरालः अर्थात् मूल्यसमूहः यस्मिन्, उदाहरणार्थं, पश्चप्रत्ययस्य ९५% भागः भवति; परिकल्पनायाः प्रत्याख्यानम्; दत्तांशबिन्दून् समूहेषु समूहीकरणं वा वर्गीकरणं वा।
आदर्शाः धारणाश्च
सम्पादयतुकस्यापि सांख्यिकीय-अनुमानस्य कृते काश्चन कल्पनाः आवश्यकाः भवन्ति । सांख्यिकीयप्रतिरूपः अवलोकितदत्तांशस्य तत्सदृशदत्तांशस्य च जननसम्बद्धानां धारणानां समुच्चयः भवति । सांख्यिकीयप्रतिमानानाम् वर्णनानि प्रायः व्याजस्य जनसंख्यामात्रायाः भूमिकायाः उपरि बलं ददति, यस्य विषये वयं अनुमानं कर्तुम् इच्छामः । वर्णनात्मकसांख्यिकीयानां उपयोगः सामान्यतया अधिकऔपचारिकअनुमानानाम् आकर्षणात् पूर्वं प्रारम्भिकपदार्थरूपेण भवति ।
सांख्यिकीविदः प्रतिरूपण-अनुमानानाम् त्रयः स्तराः भेदं कुर्वन्ति;
- पूर्णतया पैरामीटरिकः : दत्तांश-जनन-प्रक्रियायाः वर्णनं कुर्वन्तः संभाव्यता-वितरणं केवलं सीमित-संख्यायाः अज्ञात-मापदण्डानां समावेशं कृत्वा संभाव्यता-वितरणस्य परिवारेण पूर्णतया वर्णितं इति कल्प्यते यथा, जनसंख्यामूल्यानां वितरणं यथार्थतया सामान्यम् इति कल्पयितुं शक्यते, अज्ञातमाध्यं विचरणं च भवति, तथा च दत्तांशसमूहाः 'सरल' यादृच्छिकनमूनाकरणेन उत्पद्यन्ते इति सामान्यीकृतरेखीयप्रतिमानानाम् एकः व्यापकः प्रयुक्तः लचीलः च पैरामीटरिकप्रतिमानवर्गः अस्ति ।
- अ-पैरामीटरिकः : दत्तांशं जनयति प्रक्रियायाः विषये कृताः धारणाः पैरामीटरिक-सांख्यिकीयस्य अपेक्षया बहु न्यूनाः सन्ति, न्यूनतमाः च भवितुम् अर्हन्ति । उदाहरणार्थं, प्रत्येकस्य निरन्तरसंभाव्यतावितरणस्य एकः माध्यिका भवति, यस्य अनुमानं नमूनामध्यमस्य अथवा Hodges–Lehmann–Sen अनुमानकस्य उपयोगेन भवितुं शक्यते, यस्य उत्तमगुणाः सन्ति यदा सरलयादृच्छिकनमूनाकरणात् दत्तांशः उत्पद्यते
- अर्ध-पैरामीटरिकः : अयं पदः सामान्यतया पूर्णतया गैर-पैरामीटरिक-दृष्टिकोणानां 'मध्ये' धारणानां तात्पर्यं करोति । यथा - जनसंख्यावितरणस्य परिमितं माध्यं भवति इति कल्पयितुं शक्यते । अपि च, जनसंख्यायां मध्यमप्रतिक्रियास्तरः यथार्थतया रेखीयरूपेण कस्यचित् सहचयनकस्य (एकः पैरामीटरिकः धारणा) आश्रितः इति कल्पयितुं शक्यते परन्तु तस्य मध्यमस्य परितः विचरणस्य वर्णनं कृत्वा (अर्थात् कस्यापि विषमविविधतायाः उपस्थितेः सम्भाव्यरूपस्य वा विषये) किमपि पैरामीटरिकं धारणा न कर्तुं शक्यते ).अधिकसामान्यतया, अर्ध-पैरामीटरिकप्रतिमानं प्रायः 'संरचनात्मक' तथा 'यादृच्छिकविविधता' घटकेषु पृथक् कर्तुं शक्यते । एकः घटकः पैरामीटरिकरूपेण, अपरः अपैरामीटरिकरूपेण च उपचारितः भवति । सुप्रसिद्धं कोक्स-प्रतिरूपं अर्ध-पैरामीटरिक-अनुमानानाम् एकः समुच्चयः अस्ति । [उद्धरण आवश्यकम्] ।
वैधप्रतिमानानाम्/अनुमानानाम् महत्त्वम्
सम्पादयतुअधिकसामान्य, अर्ध-विरासता विनियोगात्मकतान 'संयोगात्मक' तथा 'यायाृच्छिक' तथा 'सामान्यविविधता' आयुषः । धीर-बाह्य-अभिनय, अपर अपैरिका विदिते । सुप्रसिंशः कोक्स- अनुकूलरूपं अर्ध-अर्ध-अन्तर्-अन-अन-अनन-समुच्चय । [उद्धरण विद्याम्] ।
'सरल' यादृच्छिकनमूनाकरणस्य अशुद्धानि धारणानि सांख्यिकीय-अनुमानं अमान्यं कर्तुं शक्नुवन्ति । अधिकजटिलानि अर्ध- पूर्णतया च पैरामीटरिक-अनुमानाः अपि चिन्ताजनकाः सन्ति । यथा, कोक्स-प्रतिरूपस्य गलत्-कल्पनेन केषुचित् सन्दर्भेषु दोषपूर्णनिष्कर्षाः भवितुं शक्नुवन्ति । जनसंख्यायां सामान्यतायाः अशुद्धानि धारणानि अपि प्रतिगमन-आधारित-अनुमानस्य केचन रूपाणि अमान्ययन्ति । कस्यापि पैरामीटरिकप्रतिरूपस्य उपयोगः मानवजनसंख्यायाः नमूनाकरणस्य अधिकांशविशेषज्ञैः संशयपूर्वकं दृश्यते:"अधिकांशः नमूनाङ्कनशास्त्रज्ञः, यदा ते सर्वथा विश्वासान्तराणां विषये व्यवहारं कुर्वन्ति, तदा अत्यन्तं बृहत् नमूनानां आधारेण [अनुमानकर्तृणां] विषये कथनेषु एव सीमिताः भवन्ति, यत्र केन्द्रीयसीमाप्रमेयः सुनिश्चितं करोति यत् एतेषां [अनुमानकर्तृणां] वितरणं प्रायः सामान्यं भविष्यति विशेषतः सामान्यवितरणं "यदि वयं कस्यापि प्रकारस्य आर्थिकजनसंख्यायाः सह व्यवहारं कुर्मः तर्हि सर्वथा अवास्तविकं विनाशकारीरूपेण च अविवेकी धारणा भविष्यति|अत्र केन्द्रीयसीमाप्रमेयेन उक्तं यत् "अतिबृहत् नमूनानां कृते" नमूनामाध्यमस्य वितरणं प्रायः सामान्यरूपेण वितरितं भवति, यदि वितरणं गुरुपुच्छं न भवति|
अनुमानित वितरणम्
सम्पादयतुनमूनासांख्यिकीयानाम् सटीकवितरणं निर्दिष्टुं कठिनतां दृष्ट्वा एतेषां अनुमानार्थं बहवः पद्धतयः विकसिताः सन्ति ।
परिमितनमूनानां सह, सन्निकर्षपरिणामाः मापयन्ति यत् सीमितवितरणं सांख्यिकीयस्य नमूनावितरणस्य कियत् समीपे गच्छति: उदाहरणार्थं, 10,000 स्वतन्त्रनमूनानां सह सामान्यवितरणं बहुजनसंख्यावितरणस्य कृते नमूनामात्रायाः वितरणस्य अनुमानं करोति (सटीकताद्वयं यावत्), बेरीद्वारा –एस्सेन् प्रमेय।तथापि अनेकव्यावहारिकप्रयोजनानां कृते सामान्यसन्निकर्षः नमूना-माध्यस्य वितरणस्य उत्तमं सन्निकर्षं प्रदाति यदा १० (अथवा अधिकाः) स्वतन्त्राः नमूनाः सन्ति, अनुकरण-अध्ययनस्य सांख्यिकीविदानां अनुभवस्य च अनुसारम् १९५० तमे दशके कोल्मोगोरोवस्य कार्यस्य अनन्तरं उन्नतसांख्यिकी सन्निकर्षस्य त्रुटिं परिमाणयितुं सन्निकर्षसिद्धान्तस्य कार्यात्मकविश्लेषणस्य च उपयोगं करोति ।अस्मिन् दृष्टिकोणे संभाव्यतावितरणस्य मेट्रिकज्यामितिः अध्ययनं भवति; एषः उपायः सन्निकर्षदोषस्य परिमाणं करोति, उदाहरणार्थं, कुल्बैक्–लेब्लरविचलनेन, ब्रेग्मैनविचलनेन, हेलिङ्गरदूरेन च ।
अनिश्चितरूपेण बृहत् नमूनानां सह, केन्द्रीयसीमाप्रमेय इत्यादयः सीमितपरिणामाः नमूनासांख्यिकीयस्य सीमितवितरणस्य वर्णनं कुर्वन्ति यदि कश्चन अस्ति सीमितपरिणामानि परिमितनमूनानां विषये कथनानि न सन्ति, ननु परिमितनमूनानां अप्रासंगिकाः । परन्तु परिमितनमूनानां सह कार्याय प्रायः वितरणानाम् असममितसिद्धान्तः आह्वयते । यथा, क्षणानाम् सामान्यीकृतपद्धतिं सामान्यीकृतानुमानसमीकरणानां प्रयोगं च न्याय्यं कर्तुं प्रायः सीमितपरिणामानां आह्वानं भवति,ये अर्थमापनशास्त्रे जैवसांख्यिकीयशास्त्रे च लोकप्रियाः सन्ति । सीमितवितरणस्य सत्यवितरणस्य च (औपचारिकरूपेण, सन्निकर्षस्य 'दोषः') मध्ये अन्तरस्य परिमाणं अनुकरणस्य उपयोगेन मूल्याङ्कनं कर्तुं शक्यते परिमितनमूनानां कृते परिणामान् सीमितुं अनुमानात्मकः अनुप्रयोगः अनेकेषु अनुप्रयोगेषु सामान्यः अभ्यासः अस्ति, विशेषतः लॉग-अतलसंभावनाभिः सह न्यून-आयामी-प्रतिरूपैः (यथा एक-पैरामीटर् घातीय-परिवारैः सह)