पहचान

From alpha
Jump to navigation Jump to search

आंकड़ों में, पहचान एक ऐसी संपत्ति है जिसे एक सांख्यिकीय मॉडल को संभव होने के लिए सटीक सांख्यिकीय अनुमान के लिए संतुष्ट करना होगा। एक मॉडल की पहचान तब की जा सकती है जब अनंत संख्या में अवलोकन प्राप्त करने के बाद इस मॉडल के अंतर्निहित मापदंडों के वास्तविक मूल्यों को सीखना सैद्धांतिक रूप से संभव हो। गणितीय रूप से, यह कहने के बराबर है कि मापदंडों के विभिन्न मूल्यों को अवलोकन योग्य चर के विभिन्न संभाव्यता वितरण उत्पन्न करना चाहिए। आमतौर पर मॉडल को केवल कुछ तकनीकी प्रतिबंधों के तहत ही पहचाना जा सकता है, ऐसी स्थिति में इन आवश्यकताओं के सेट को पहचान की स्थिति कहा जाता है।

एक मॉडल जो पहचानने योग्य होने में विफल रहता है उसे गैर-पहचान योग्य या अज्ञात कहा जाता है: दो या दो से अधिक सांख्यिकीय पैरामीटर अवलोकन संबंधी तुल्यता हैं। कुछ मामलों में, भले ही एक मॉडल गैर-पहचान योग्य हो, फिर भी मॉडल मापदंडों के एक निश्चित उपसमूह के वास्तविक मूल्यों को सीखना संभव है। इस मामले में हम कहते हैं कि मॉडल आंशिक रूप से पहचाने जाने योग्य है। अन्य मामलों में पैरामीटर स्पेस के एक निश्चित सीमित क्षेत्र तक वास्तविक पैरामीटर का स्थान सीखना संभव हो सकता है, जिस स्थिति में मॉडल को पहचानने योग्य सेट किया जाता है।

मॉडल गुणों की कड़ाई से सैद्धांतिक खोज के अलावा, पहचान योग्यता विश्लेषण का उपयोग करके प्रयोगात्मक डेटा सेट के साथ मॉडल का परीक्षण करते समय पहचान क्षमता को व्यापक दायरे में संदर्भित किया जा सकता है।[1]


परिभाषा

होने देना पैरामीटर स्पेस के साथ एक सांख्यिकीय मॉडल बनें . हम ऐसा कहते हैं यदि मानचित्रण हो तो पहचान योग्य है आक्षेप है|एक-से-एक:[2]

इस परिभाषा का अर्थ है कि θ के अलग-अलग मान अलग-अलग संभाव्यता वितरण के अनुरूप होने चाहिए: यदि θ1≠θ2, फिर भी पीθ1≠Pθ2</उप>.[3] यदि वितरण को संभाव्यता घनत्व फ़ंक्शन (पीडीएफ) के संदर्भ में परिभाषित किया गया है, तो दो पीडीएफ को केवल तभी अलग माना जाना चाहिए, जब वे गैर-शून्य माप के सेट पर भिन्न हों (उदाहरण के लिए दो फ़ंक्शन)1(x)='1'0 ≤ x < 1 और2(x)='1'0 ≤ x ≤ 1 केवल एक बिंदु x = 1 पर अंतर होता है - लेबेस्ग का एक सेट शून्य मापता है - और इस प्रकार इसे अलग पीडीएफ के रूप में नहीं माना जा सकता है)।

मानचित्र की व्युत्क्रमणीयता के अर्थ में मॉडल की पहचान यदि मॉडल को अनिश्चित काल तक देखा जा सकता है तो यह मॉडल के वास्तविक पैरामीटर को सीखने में सक्षम होने के बराबर है। वास्तव में, यदि {एक्सt} ⊆ एस मॉडल से अवलोकनों का क्रम है, फिर बड़ी संख्या के मजबूत कानून द्वारा,

प्रत्येक मापने योग्य सेट ए ⊆ एस के लिए (यहां '1'{...} सूचक कार्य है)। इस प्रकार, अनंत संख्या में प्रेक्षणों के साथ हम वास्तविक संभाव्यता वितरण P ज्ञात करने में सक्षम होंगे0 मॉडल में, और चूंकि उपरोक्त पहचान की स्थिति के लिए मानचित्र की आवश्यकता है उलटा हो, हम उस पैरामीटर का सही मान भी ढूंढने में सक्षम होंगे जो दिए गए वितरण पी उत्पन्न करता है0.

उदाहरण

उदाहरण 1

होने देना सामान्य वितरण स्थान-पैमाने पर परिवार बनें:

तब

यह अभिव्यक्ति लगभग सभी x के लिए शून्य के बराबर है, जब इसके सभी गुणांक शून्य के बराबर हों, जो केवल तभी संभव है जब |σ1| = |पी2| और μ1 = एम2. चूँकि स्केल पैरामीटर में σ शून्य से अधिक होने तक सीमित है, हम यह निष्कर्ष निकालते हैं कि मॉडल पहचानने योग्य है:θ1 = ƒθ2 ⇔ i उप>1 = θ2.

उदाहरण 2

होने देना मानक रैखिक प्रतिगमन मॉडल बनें:

(जहाँ ′ मैट्रिक्स खिसकाना को दर्शाता है)। तब पैरामीटर β पहचाने जाने योग्य है यदि और केवल यदि मैट्रिक्स उलटा है. इस प्रकार, यह मॉडल में पहचान की स्थिति है।

उदाहरण 3

कल्पना करना चर में शास्त्रीय त्रुटि रैखिक मॉडल है:

जहां (ε,η,x*) शून्य अपेक्षित मान और अज्ञात भिन्नताओं के साथ संयुक्त रूप से सामान्य स्वतंत्र यादृच्छिक चर हैं, और केवल चर (x,y) देखे जाते हैं। तब यह मॉडल पहचान योग्य नहीं है,[4] केवल उत्पाद βσ² है (जहां σ² अव्यक्त प्रतिगामी x* का प्रसरण है)। यह भी एक निर्धारित पहचान मॉडल का एक उदाहरण है: यद्यपि β का सटीक मान नहीं सीखा जा सकता है, हम गारंटी दे सकते हैं कि यह अंतराल (β) में कहीं स्थित होना चाहिए उप>yx, 1÷βxy), जहां βyx x, और β पर y के सामान्य न्यूनतम वर्ग प्रतिगमन में गुणांक हैxy y पर x के OLS प्रतिगमन में गुणांक है।[5] यदि हम सामान्यता की धारणा को त्याग देते हैं और चाहते हैं कि x* सामान्य रूप से वितरित 'नहीं' हो, केवल स्वतंत्रता की स्थिति ε ⊥ η ⊥ x* को बनाए रखते हुए, तो मॉडल पहचानने योग्य हो जाता है।[4]


यह भी देखें

संदर्भ

उद्धरण

  1. Raue, A.; Kreutz, C.; Maiwald, T.; Bachmann, J.; Schilling, M.; Klingmuller, U.; Timmer, J. (2009-08-01). "Structural and practical identifiability analysis of partially observed dynamical models by exploiting the profile likelihood". Bioinformatics. 25 (15): 1923–1929. doi:10.1093/bioinformatics/btp358. PMID 19505944.
  2. Lehmann & Casella 1998, Ch. 1, Definition 5.2
  3. van der Vaart 1998, p. 62
  4. 4.0 4.1 Reiersøl 1950
  5. Casella & Berger 2002, p. 583


स्रोत

अग्रिम पठन

  • Walter, É.; Pronzato, L. (1997), Identification of Parametric Models from Experimental Data, Springer



अर्थमिति


श्रेणी:अनुमान सिद्धांत