हैमिल्टनियन फलन (गणित) है जिसका उपयोग गतिशील प्रणाली के इष्टतम नियंत्रण की समस्या को हल करने के लिए किया जाता है। इसे उस समस्या के लैग्रेंज गुणक के तात्कालिक वृद्धि के रूप में समझा जा सकता है जिसे निश्चित समय अवधि में अनुकूलित किया जाना है।[1] हेमिल्टनियन यांत्रिकी से प्रेरित, लेकिन उससे अलग, इष्टतम नियंत्रण सिद्धांत के हैमिल्टनियन को लेव पोंट्रीगिन ने अपने पोंट्रीगिन के न्यूनतम सिद्धांत के भागों के रूप में विकसित किया था।[2] पोंट्रीगिन ने सिद्ध किया कि इष्टतम नियंत्रण समस्या को हल करने के लिए आवश्यक शर्त यह है कि हैमिल्टन को अनुकूलित करने के लिए नियंत्रण को चुना जाना चाहिए।[3]
की गतिशील प्रणाली पर विचार करें प्रथम-क्रम अंतर समीकरण
जहाँ स्थिति चर के वेक्टर को दर्शाता है, और नियंत्रण चर का वेक्टर एक बार प्रारंभिक शर्तें और नियंत्रित करता है निर्दिष्ट हैं, अंतर समीकरणों का समाधान, जिसे प्रक्षेपवक्र कहा जाता है , पाया जा सकता है। इष्टतम नियंत्रण की समस्या चुनना है (कुछ सेट से ) जिससे प्रारंभिक समय के बीच निश्चित हानि फलन को अधिकतम या कम करता है और टर्मिनल समय (जहाँ अनंत हो सकता है) विशेष रूप से, लक्ष्य प्रदर्शन सूचकांक का अनुकूलन करना है समय के प्रत्येक बिंदु पर,
स्थिति चर की गति के उपरोक्त समीकरणों के अधीन। समाधान विधि में सहायक कार्य को परिभाषित करना सम्मिलित है जिसे नियंत्रण हैमिल्टन के रूप में जाना जाता है।
जो ऑब्जेक्टिव फलन और स्टेट समीकरण को स्टैटिक ऑप्टिमाइज़ेशन प्रॉब्लम में लैग्रेंज मल्टीप्लायर की तरह जोड़ता है, केवल यह कि मल्टीप्लायर , कॉस्टेट वेरिएबल्स के रूप में संदर्भित, स्थिरांक के अतिरिक्त समय के कार्य हैं।
लक्ष्य इष्टतम नियंत्रण नीति कार्य खोजना है और, इसके साथ, स्थिति चर का इष्टतम प्रक्षेपवक्र , जो पोंट्रीगिन के अधिकतम सिद्धांत के अनुसार वे तर्क हैं जो हैमिल्टनियन को अधिकतम करते हैं,
सभी के लिए
अधिकतम के लिए प्रथम-क्रम आवश्यक शर्तें किसके द्वारा दी गई हैं
जो अधिकतम सिद्धांत है,
जो स्थिति संक्रमण फलन उत्पन्न करता है ,
जो उत्पन्न करता है
जिनमें से बाद वाले को कॉस्टेट समीकरण कहा जाता है। साथ में, स्थिति और कॉस्टेट समीकरण हैमिल्टनियन गतिशील प्रणाली का वर्णन करते हैं (भौतिक विज्ञान में हैमिल्टनियन प्रणाली से फिर से समान लेकिन अलग), जिसके समाधान में दो-बिंदु सीमा मूल्य समस्या सम्मिलित है, यह देखते हुए कि समय में दो अलग-अलग बिंदुओं को सम्मिलित करने वाली सीमा की स्थिति, प्रारंभिक समय ( स्थिति चर के लिए अंतर समीकरण), और टर्मिनल समय ( कॉस्टेट वेरिएबल्स के लिए डिफरेंशियल समीकरण; जब तक कोई अंतिम कार्य निर्दिष्ट नहीं किया जाता है, सीमा की स्थिति होती है , या अनंत समय क्षितिज के लिए)।[4]
अधिकतम के लिए पर्याप्त शर्त हैमिल्टनियन की अवतलता है जिसका मूल्यांकन समाधान में किया गया है, अर्थात
जहाँ इष्टतम नियंत्रण है, और स्थिति चर के लिए इष्टतम प्रक्षेपवक्र का परिणाम है।[5] वैकल्पिक रूप से,ओल्वी एल मंगसेरियन के परिणामस्वरूप, कार्य करने पर आवश्यक शर्तें पर्याप्त हैं और दोनों अवतल हैं और है।[6]
लाग्रंगियन से व्युत्पत्ति
विवश अनुकूलन समस्या जैसा कि ऊपर कहा गया है, विशेष रूप से लाग्रंगियन अभिव्यक्ति का सुझाव देती है
जहाँ स्थिर अनुकूलन समस्या में लैग्रेंज गुणक की तुलना करता है लेकिन अब, जैसा कि ऊपर उल्लेख किया गया है, समय का कार्य है। मिटाने के लिए , दाईं ओर के अंतिम शब्द को भागों द्वारा एकीकरण का उपयोग करके फिर से लिखा जा सकता है, जैसे कि
जिसे देने के लिए लाग्रंगियन अभिव्यक्ति में वापस प्रतिस्थापित किया जा सकता है।
इष्टतम के लिए प्रथम-क्रम की स्थिति प्राप्त करने के लिए, मान लें कि समाधान मिल गया है और लाग्रंगियन अधिकतम हो गया है। फिर किसी तरह की गड़बड़ी या लाग्रंगियन के मूल्य में गिरावट का कारण होना चाहिए। विशेष रूप से, का कुल व्युत्पन्न का अनुसरण करता है।
इस अभिव्यक्ति के लिए शून्य के बराबर होने के लिए निम्नलिखित इष्टतमता शर्तों की आवश्यकता होती है:
यदि दोनों प्रारंभिक मान और टर्मिनल मान निश्चित हैं, अर्थात् , कोई शर्त नहीं है और आवश्यक है। यदि टर्मिनल मूल्य मुक्त है, जैसा कि अधिकांशतः होता है, अतिरिक्त शर्त श्रेष्ठता के लिए आवश्यक है। उत्तरार्द्ध को निश्चित क्षितिज समस्या के लिए ट्रांसवर्सलिटी स्थिति कहा जाता है।[7]
यह देखा जा सकता है कि आवश्यक शर्तें हैमिल्टनियन के लिए ऊपर बताई गई शर्तों के समान हैं। इस प्रकार हैमिल्टनियन को पहले क्रम की आवश्यक शर्तों को उत्पन्न करने के लिए उपकरण के रूप में समझा जा सकता है।[8]
असतत समय में हैमिल्टनियन
जब समस्या असतत समय में तैयार की जाती है, तो हैमिल्टनियन को इस प्रकार परिभाषित किया जाता है:
(ध्यान दें कि समय पर असतत समय हैमिल्टनियन समय पर कॉस्टेट वैरिएबल सम्मिलित है [9] यह छोटा विवरण आवश्यक है जिससे जब हम इसके संबंध में अंतर करें हमें शब्द सम्मिलित है कॉस्टेट समीकरणों के दाहिने हाथ की ओर। यहां गलत सम्मेलन का उपयोग करने से गलत परिणाम हो सकते हैं, यानी कॉस्टेट समीकरण जो पीछे की ओर अंतर समीकरण नहीं है)।
हैमिल्टनियन का समय के साथ व्यवहार
पोंट्रीगिन के अधिकतम सिद्धांत से, हैमिल्टनियन के लिए विशेष शर्तें प्राप्त की जा सकती हैं।[10] जब आखिरी बार निश्चित है और हैमिल्टन समय पर स्पष्ट रूप से निर्भर नहीं करता है , तब:[11]
या यदि टर्मिनल समय निःशुल्क है, तो:
इसके अतिरिक्त, यदि टर्मिनल समय अनंत तक जाता है, तो हैमिल्टनियन पर पारलौकिक स्थिति स्थिति प्रयुक्त होती है।[12]
यांत्रिकी के हैमिल्टनियन की तुलना में नियंत्रण का हैमिल्टनियन
विलियम रोवन हैमिल्टन ने प्रणाली के यांत्रिकी का वर्णन करने के लिए हैमिल्टनियन यांत्रिकी को परिभाषित किया। यह तीन चरों का कार्य है:
जहाँ लाग्रंगियन यांत्रिकी है, जिसका चरमोत्कर्ष गतिकी को निर्धारित करता है (ऊपर परिभाषित लाग्रंगियन नहीं), स्थिति चर है और इसका काल व्युत्पन्न है।
तथाकथित संयुग्म गति है, द्वारा परिभाषित
हैमिल्टन ने तब सिस्टम की गतिशीलता का वर्णन करने के लिए अपने समीकरण तैयार किए
नियंत्रण सिद्धांत का हैमिल्टन प्रणाली की गतिशीलता का वर्णन नहीं करता है, लेकिन नियंत्रण चर के संबंध में कुछ स्केलर फलन (लैग्रैंगियन) को चरम पर पहुंचाने की स्थिति . जैसा कि सामान्य रूप से परिभाषित किया गया है, यह 4 चरों का कार्य है
जहाँ स्थिति चर है और नियंत्रण चर है जिसके संबंध में हम चरम सीमा पर हैं।
अधिकतम के लिए संबद्ध शर्तें हैं
यह परिभाषा सस्मान और विलेम्स के लेख द्वारा दी गई परिभाषा से सहमत है।[13] (पृष्ठ 39 देखें, समीकरण 14)। सुस्मान और विलेम्स दिखाते हैं कि हैमिल्टनियन नियंत्रण को गतिशीलता में कैसे प्रयोग किया जा सकता है उदा। ब्राचिस्टोक्रोन समस्या के लिए, लेकिन इस दृष्टिकोण पर कैराथोडोरी के पूर्व कार्य का उल्लेख न करें।[14]
वर्तमान मूल्य और वर्तमान मूल्य हैमिल्टनियन
अर्थशास्त्र में, गतिशील अनुकूलन समस्याओं में उद्देश्य कार्य अधिकांशतः केवल घातीय छूट के माध्यम से सीधे समय पर निर्भर करता है, जैसे कि यह रूप लेता है
जहाँ तात्क्षणिक उपयोगिता फलन या परमानंद फलन के रूप में जाना जाता है।[15] यह हैमिल्टनियन को फिर से परिभाषित करने की अनुमति देता है जहाँ
जिसे हैमिल्टनियन के वर्तमान मूल्य के विपरीत, वर्तमान मूल्य हैमिल्टनियन कहा जाता है पहले खंड में परिभाषित। विशेष रूप से कॉस्टेट वेरिएबल्स को फिर से परिभाषित किया गया है , जो संशोधित प्रथम-क्रम स्थितियों की ओर जाता है।
,
जो उत्पाद नियम से तुरंत अनुसरण करता है। आर्थिक रूप से, पूंजीगत वस्तुओं के लिए वर्तमान-मूल्यवान छाया कीमतों का प्रतिनिधित्व करते हैं .
उदाहरण: रैमसे-कैस-कूपमन्स मॉडल
अर्थशास्त्र में, रैमसे-कैस-कूपमन्स मॉडल का उपयोग अर्थव्यवस्था के लिए इष्टतम बचत व्यवहार निर्धारित करने के लिए किया जाता है। उद्देश्य फलन सामाजिक कल्याण कार्य है,
इष्टतम उपभोग पथ के चुनाव द्वारा अधिकतम किया जाना . कार्यक्रम उपभोग के प्रतिनिधि एजेंटउपयोगिता को इंगित करता है किसी भी समय पर। कारण छूट का प्रतिनिधित्व करता है। अधिकतमकरण समस्या पूंजी तीव्रता के लिए निम्नलिखित अंतर समीकरण के अधीन है, जो प्रति प्रभावी कार्यकर्ता पूंजी के समय के विकास का वर्णन करती है:
जहाँ अवधि टी खपत है, प्रति कर्मचारी अवधि टी पूंजी है (के साथ ), अवधि टी उत्पादन है, जनसंख्या वृद्धि दर है, पूंजी मूल्यह्रास दर है, एजेंट भविष्य की उपयोगिता दर पर छूट देता है , साथ और .
यहाँ, स्थिति चर है जो उपरोक्त समीकरण के अनुसार विकसित होता है, और नियंत्रण चर है। हैमिल्टनियन बन जाता है।
इष्टतम स्थिति हैं
ट्रांसवर्सलिटी कंडीशन के अतिरिक्त . अगर हम जाने दें , फिर लॉगरिदमिक विभेदीकरण लॉग-डिफरेंशियेटिंग पहली इष्टतम स्थिति के संबंध में पैदावार
इस समीकरण को दूसरी अनुकूलतम स्थिति में सम्मिलित करने से प्राप्त होता है
जिसे कीन्स-रैमसे नियम के रूप में जाना जाता है, जो हर अवधि में खपत के लिए शर्त देता है, जिसका पालन करने पर अधिकतम जीवनकाल उपयोगिता सुनिश्चित होती है।
संदर्भ
↑Ferguson, Brian S.; Lim, G. C. (1998). गतिशील आर्थिक समस्याओं का परिचय. Manchester: Manchester University Press. pp. 166–167. ISBN0-7190-4996-2.
↑Kirk, Donald E. (1970). Optimal Control Theory : An Introduction. Englewood Cliffs: Prentice Hall. p. 232. ISBN0-13-638098-0.
↑Gandolfo, Giancarlo (1996). आर्थिक गतिशीलता (Third ed.). Berlin: Springer. pp. 375–376. ISBN3-540-60988-1.
↑Seierstad, Atle; Sydsæter, Knut (1987). आर्थिक अनुप्रयोगों के साथ इष्टतम नियंत्रण सिद्धांत. Amsterdam: North-Holland. pp. 107–110. ISBN0-444-87923-4.
↑Mangasarian, O. L. (1966). "नॉनलाइनियर सिस्टम्स के इष्टतम नियंत्रण के लिए पर्याप्त शर्तें". SIAM Journal on Control. 4 (1): 139–152. doi:10.1137/0304013.
↑Kamien, Morton I.; Schwartz, Nancy L. (1991). Dynamic Optimization : The Calculus of Variances and Optimal Control in Economics and Management (Second ed.). Amsterdam: North-Holland. pp. 126–127. ISBN0-444-01609-0.
↑Naidu, Desineni S. (2003). इष्टतम नियंत्रण प्रणाली. Boca Raton: CRC Press. pp. 259–260. ISBN0-8493-0892-5.
↑Torres, Delfim F. M. (2002). "डायनेमिक ऑप्टिमाइज़ेशन एक्सट्रीमल्स की एक उल्लेखनीय संपत्ति". Investigacao Operacional. 22 (2): 253–263. arXiv:math/0212102.
Léonard, Daniel; Long, Ngo Van (1992). "The Maximum Principle". Optimal Control Theory and Static Optimization in Economics. New York: Cambridge University Press. pp. 127–168. ISBN0-521-33158-7.
Wulwick, Nancy (1995). "The Hamiltonian Formalism and Optimal Growth Theory". In Rima, I. H. (ed.). Measurement, Quantification, and Economic Analysis. London: Routledge. ISBN978-0-415-08915-9.