रणनीति (खेल सिद्धांत)

From alpha
Jump to navigation Jump to search

गेम थ्योरी में, एक खिलाड़ी (गेम) की रणनीति कोई भी विकल्प है जिसे वे एक सेटिंग में चुनते हैं जहां परिणाम न केवल अपने कार्यों पर निर्भर करता है बल्कि दूसरों के कार्यों पर भी निर्भर करता है।[1] अनुशासन मुख्य रूप से एक खेल में एक खिलाड़ी की कार्रवाई से संबंधित है जो अन्य खिलाड़ियों के व्यवहार या कार्यों को प्रभावित करता है। खेलों के कुछ उदाहरणों में शतरंज, पुल, पोकर, एकाधिकार, कूटनीति या युद्धपोत शामिल हैं।[2] एक खिलाड़ी की रणनीति खेल के किसी भी चरण में खिलाड़ी द्वारा की जाने वाली कार्रवाई का निर्धारण करेगी। गेम थ्योरी का अध्ययन करने में, अर्थशास्त्री विभिन्न विषयों में दो या दो से अधिक पार्टियों के निर्णयों के बीच संबंधों का विश्लेषण करते समय लिए गए मनोवैज्ञानिक या समाजशास्त्रीय दृष्टिकोणों के बजाय निर्णयों के विश्लेषण में अधिक तर्कसंगत लेंस लगाते हैं।

रणनीति अवधारणा कभी-कभी (गलत तरीके से) एक चाल के साथ भ्रमित होती है। एक चाल एक खेल के दौरान किसी बिंदु पर एक खिलाड़ी द्वारा की गई कार्रवाई है (उदाहरण के लिए, शतरंज में, सफेद के बिशप a2 को b3 पर ले जाना)। दूसरी ओर एक रणनीति खेल खेलने के लिए एक पूर्ण एल्गोरिथम है, जो एक खिलाड़ी को बताती है कि पूरे खेल में हर संभव स्थिति के लिए क्या करना है। दिशाओं की सूची के रूप में एक रणनीति के बारे में सोचना और दिशाओं की सूची पर एक मोड़ के रूप में एक चाल के बारे में सोचना सहायक होता है। यह रणनीति प्रत्येक क्रिया के भुगतान या परिणाम पर आधारित है। प्रत्येक एजेंट का लक्ष्य प्रतिस्पर्धी कार्रवाई के आधार पर उनके भुगतान पर विचार करना है। उदाहरण के लिए, प्रतियोगी ए मान सकता है कि प्रतिस्पर्धी बी बाजार में प्रवेश करता है। वहां से, प्रतियोगी ए प्रवेश करने और प्रवेश न करने पर मिलने वाले भुगतान की तुलना करता है। अगला कदम यह मान लेना है कि प्रतियोगी बी प्रवेश नहीं करता है और फिर विचार करें कि प्रतियोगी ए प्रवेश करने या न करने का विकल्प चुनता है या नहीं। यह तकनीक प्रमुख रणनीतियों की पहचान कर सकती है जहां एक खिलाड़ी एक ऐसी कार्रवाई की पहचान कर सकता है जो प्रतिस्पर्धी भुगतान करने और अधिकतम भुगतान करने के लिए कोई फर्क नहीं पड़ता। यह खिलाड़ियों को नैश संतुलन की पहचान करने में भी मदद करता है जिसकी चर्चा नीचे और अधिक विस्तार से की गई है।

एक रणनीति प्रोफ़ाइल (कभी-कभी रणनीति संयोजन कहा जाता है) सभी खिलाड़ियों के लिए रणनीतियों का एक सेट है जो गेम में सभी क्रियाओं को पूरी तरह से निर्दिष्ट करता है। एक रणनीति प्रोफ़ाइल में प्रत्येक खिलाड़ी के लिए एक और केवल एक रणनीति शामिल होनी चाहिए।

रणनीति सेट

एक खिलाड़ी का रणनीति सेट परिभाषित करता है कि उनके खेलने के लिए कौन सी रणनीतियां उपलब्ध हैं। एक रणनीति प्रोफ़ाइल रणनीति सेट की एक सूची है, जो सबसे कम से कम वांछनीय के क्रम में है।

एक खिलाड़ी के पास एक सीमित रणनीति निर्धारित होती है यदि उसके पास कई असतत रणनीतियाँ उपलब्ध हों। उदाहरण के लिए, रॉक पेपर सिजर्स के खेल में प्रत्येक खिलाड़ी की एक ही चाल होती है—और प्रत्येक खिलाड़ी की चाल दूसरे की जानकारी के बिना चलती है, प्रतिक्रिया के रूप में नहीं—इसलिए प्रत्येक खिलाड़ी के पास सीमित रणनीति सेट {रॉक पेपर कैंची} होती है।

एक रणनीति सेट अनंत है अन्यथा। उदाहरण के लिए फेयर डिवीजन के पास रणनीति सेट {कट कहीं भी शून्य प्रतिशत और केक के 100 प्रतिशत के बीच} में रणनीतियों का एक सीमित निरंतरता है।

एक गतिशील गेम में, गेम जो समय की एक श्रृंखला में खेले जाते हैं, रणनीति सेट में संभावित नियम होते हैं जो एक खिलाड़ी रोबोट या सॉफ़्टवेयर एजेंट को गेम खेलने के तरीके के बारे में दे सकता है। उदाहरण के लिए, अल्टीमेटम गेम में, दूसरे खिलाड़ी के लिए निर्धारित रणनीति में हर संभव नियम शामिल होगा जिसके लिए प्रस्ताव स्वीकार करना है और किसे अस्वीकार करना है।

बायेसियन गेम में, या ऐसे गेम जिनमें खिलाड़ियों के पास एक दूसरे के बारे में अधूरी जानकारी होती है, रणनीति सेट गतिशील गेम के समान होती है। इसमें किसी भी संभावित निजी जानकारी के लिए क्या कार्रवाई करनी है, इसके नियम शामिल हैं।

एक रणनीति सेट चुनना

एप्लाइड गेम थ्योरी में, रणनीति सेट की परिभाषा एक गेम को एक साथ हल करने योग्य और अर्थपूर्ण बनाने की कला का एक महत्वपूर्ण हिस्सा है। खेल सिद्धांतकार समग्र समस्या के ज्ञान का उपयोग कर सकता है, जो कि दो या दो से अधिक खिलाड़ियों के बीच घर्षण है, रणनीति के स्थान को सीमित करने और समाधान को आसान बनाने के लिए।

उदाहरण के लिए, अल्टीमेटम गेम में सख्ती से बोलते हुए एक खिलाड़ी के पास रणनीतियां हो सकती हैं जैसे: ($1, $3, $5, ..., $19) के प्रस्तावों को अस्वीकार करें, ($0, $2, $4, ..., $20) के प्रस्तावों को स्वीकार करें। . ऐसी सभी रणनीतियों को शामिल करना एक बहुत बड़ी रणनीति स्थान और कुछ हद तक कठिन समस्या है। एक खेल सिद्धांतकार इसके बजाय यह मान सकता है कि वे रणनीति सेट को इस तक सीमित कर सकते हैं: {किसी प्रस्ताव को अस्वीकार करें ≤ x, किसी भी प्रस्ताव को स्वीकार करें > x; x in ($0, $1, $2, ..., $20)} के लिए।

शुद्ध और मिश्रित रणनीतियाँ

एक शुद्ध रणनीति इस बात की पूरी परिभाषा प्रदान करती है कि कोई खिलाड़ी खेल कैसे खेलेगा। खेल के खेल के दौरान उनके द्वारा किए गए अवलोकनों के अधीन एक योजना विषय के रूप में शुद्ध रणनीति के बारे में सोचा जा सकता है। विशेष रूप से, यह निर्धारित करता है कि खिलाड़ी किसी भी स्थिति का सामना करने के लिए क्या कदम उठाएगा। एक खिलाड़ी का रणनीति सेट उस खिलाड़ी के लिए उपलब्ध शुद्ध रणनीतियों का सेट होता है।

एक मिश्रित रणनीति प्रत्येक शुद्ध रणनीति के लिए प्रायिकता का असाइनमेंट है। मिश्रित रणनीति को सूचीबद्ध करते समय, यह अक्सर इसलिए होता है क्योंकि खेल खेल के लिए एक शुद्ध रणनीति निर्दिष्ट करने में तर्कसंगत विवरण की अनुमति नहीं देता है। यह एक खिलाड़ी को बेतरतीब ढंग से शुद्ध रणनीति चुनने की अनुमति देता है। (एक उदाहरण के लिए निम्नलिखित अनुभाग देखें।) चूँकि संभावनाएँ निरंतर हैं, एक खिलाड़ी के लिए असीम रूप से कई मिश्रित रणनीतियाँ उपलब्ध हैं। चूंकि कुछ परिदृश्यों के भुगतान पर चर्चा करते समय किसी विशिष्ट खिलाड़ी के लिए रणनीतियों को संभावनाएं सौंपी जा रही हैं, भुगतान को अपेक्षित भुगतान के रूप में संदर्भित किया जाना चाहिए।

बेशक, एक शुद्ध रणनीति को एक मिश्रित रणनीति के पतित मामले के रूप में माना जा सकता है, जिसमें उस विशेष शुद्ध रणनीति को प्रायिकता 1 के साथ चुना जाता है और प्रायिकता 0 के साथ हर दूसरी रणनीति।

एक पूरी तरह से मिश्रित रणनीति एक मिश्रित रणनीति है जिसमें खिलाड़ी प्रत्येक शुद्ध रणनीति के लिए सख्ती से सकारात्मक संभावना प्रदान करता है। (संतुलन शोधन के लिए पूरी तरह से मिश्रित रणनीतियाँ महत्वपूर्ण हैं जैसे कांपना हाथ सही संतुलन।)

मिश्रित रणनीति

चित्रण

फ़ुटबॉल पेनल्टी किक में, किक करने वाले को यह चुनना होगा कि गोल के दाएं या बाएं ओर किक करना है, और साथ ही गोलकीपर को यह तय करना होगा कि इसे किस तरह से ब्लॉक करना है। इसके अलावा, किक करने वाले के पास एक दिशा होती है कि वे शूटिंग में सबसे अच्छे होते हैं, जो दाएं पैर वाले होने पर छोड़ दिया जाता है। सॉकर गेम के लिए मैट्रिक्स इस स्थिति को दिखाता है, चियापोरी, लेविट और ग्रोसेक्लोज़ (2002) द्वारा अध्ययन किए गए खेल का एक सरलीकृत रूप।[3] यह मानता है कि यदि गोलकीपर सही ढंग से अनुमान लगाता है, तो किक अवरुद्ध हो जाती है, जो दोनों खिलाड़ियों के लिए 0 के मूल भुगतान पर सेट होती है। यदि गोलकीपर गलत अनुमान लगाता है, तो किक अंदर जाने की अधिक संभावना है यदि यह बाईं ओर है (किकर के लिए +2 और गोलकीपर के लिए -2 का भुगतान) दाईं ओर होने की तुलना में (+1 से कम भुगतान) किकर और -1 गोलकीपर के लिए)।

Goalie
Lean Left Lean Right
Kicker Kick Left  0,  0 +2, -2
Kick Right +1, -1  0,  0
 Payoff for the Soccer Game (Kicker, Goalie)

इस गेम में कोई शुद्ध-रणनीति संतुलन नहीं है, क्योंकि एक खिलाड़ी या दूसरा किसी भी रणनीति के प्रोफाइल से विचलित होगा- उदाहरण के लिए, (बाएं, बाएं) एक संतुलन नहीं है क्योंकि किकर दाएं से विचलित हो जाएगा और 0 से 1 तक अपना भुगतान बढ़ा देगा .

किकर की मिश्रित-रणनीति संतुलन इस तथ्य से पाया जाता है कि वे यादृच्छिकता से विचलित होंगे जब तक कि लेफ्ट किक और राइट किक से उनकी अदायगी बिल्कुल बराबर न हो। यदि गोलकी प्रायिकता g के साथ बाईं ओर झुकता है, तो किक लेफ्ट से किक का अपेक्षित भुगतान g(0) + (1-g)(2) है, और किक राइट से g(1) + (1-g)(0) है। इन पैदावारों की बराबरी करने पर g= 2/3 प्राप्त होता है। इसी तरह, गोलकीपर केवल तभी रैंडमाइज करने के लिए तैयार होता है जब किकर मिश्रित रणनीति संभाव्यता k चुनता है जैसे कि लीन लेफ्ट का k(0) + (1-k)(-1) का भुगतान K(-2) + (1) के लीन राइट के भुगतान के बराबर होता है। -k)(0), इसलिए k = 1/3। इस प्रकार, मिश्रित-रणनीति संतुलन है (प्रोब (किक लेफ्ट) = 1/3, प्रोब (लीन लेफ्ट) = 2/3)।

ध्यान दें कि संतुलन में, किकर केवल 1/3 समय में अपनी सर्वश्रेष्ठ तरफ किक करता है। ऐसा इसलिए क्योंकि गोलकीपर उस तरफ ज्यादा पहरा दे रहा होता है। यह भी ध्यान दें कि संतुलन में, किकर उदासीन होता है कि वे किस तरह से लात मारते हैं, लेकिन इसके लिए एक संतुलन होने के लिए उन्हें 1/3 संभावना का चयन करना होगा।

चियापोरी, लेविट, और ग्रोसेक्लोज़ यह मापने की कोशिश करते हैं कि किकर के लिए अपने पसंदीदा पक्ष को किक करना कितना महत्वपूर्ण है, सेंटर किक आदि जोड़ें, और देखें कि पेशेवर खिलाड़ी वास्तव में कैसे व्यवहार करते हैं। वे पाते हैं कि वे बेतरतीब ढंग से करते हैं, और यह किकर 45% समय के लिए अपने पसंदीदा पक्ष को किक करते हैं और 57% समय गोलकीपर उस तरफ झुकते हैं। उनका लेख एक उदाहरण के रूप में प्रसिद्ध है कि वास्तविक जीवन में लोग मिश्रित रणनीतियों का उपयोग कैसे करते हैं।

महत्व

जॉन फ़ोर्ब्स नैश ने अपने प्रसिद्ध पत्र में यह सिद्ध किया कि प्रत्येक परिमित खेल के लिए नैश संतुलन होता है। नैश संतुलन को दो प्रकारों में विभाजित किया जा सकता है। शुद्ध रणनीति नैश संतुलन नैश संतुलन हैं जहां सभी खिलाड़ी शुद्ध रणनीतियां खेल रहे हैं। मिश्रित रणनीति नैश संतुलन संतुलन हैं जहां कम से कम एक खिलाड़ी मिश्रित रणनीति खेल रहा है। जबकि नैश ने साबित कर दिया कि प्रत्येक परिमित खेल में नैश संतुलन होता है, सभी के पास शुद्ध रणनीति नैश संतुलन नहीं होता है। ऐसे खेल के उदाहरण के लिए जिसमें शुद्ध रणनीतियों में नैश संतुलन नहीं है, मैचिंग पेनीज़ देखें। हालाँकि, कई खेलों में शुद्ध रणनीति नैश इक्विलिब्रिया होती है (उदाहरण के लिए समन्वय खेल, कैदी की दुविधा, स्टैग हंट)। इसके अलावा, खेलों में शुद्ध रणनीति और मिश्रित रणनीति संतुलन दोनों हो सकते हैं। एक आसान उदाहरण शुद्ध समन्वय खेल है, जहां शुद्ध रणनीतियों (ए, ए) और (बी, बी) के अलावा एक मिश्रित संतुलन मौजूद होता है जिसमें दोनों खिलाड़ी प्रायिकता 1/2 के साथ या तो रणनीति खेलते हैं।

मिश्रित रणनीतियों की व्याख्या

1980 के दशक के दौरान, मिश्रित रणनीतियों की अवधारणा सहज रूप से समस्याग्रस्त होने के कारण भारी आग में आ गई, क्योंकि वे कमजोर नैश संतुलन हैं, और एक खिलाड़ी इस बात के प्रति उदासीन है कि क्या उनकी संतुलन रणनीति संभावना का पालन करना है या किसी अन्य संभावना से विचलित होना है।[4] [5] खेल सिद्धांतकार एरियल रुबिनस्टीन अवधारणा को समझने के वैकल्पिक तरीकों का वर्णन करते हैं। पहला, हरसनी (1973) के कारण,[6] शुद्धिकरण प्रमेय कहा जाता है, और यह मानता है कि मिश्रित रणनीतियों की व्याख्या केवल खिलाड़ियों की जानकारी और निर्णय लेने की प्रक्रिया के बारे में हमारे ज्ञान की कमी को दर्शाती है। जाहिरा तौर पर यादृच्छिक विकल्प तब गैर-निर्दिष्ट, अदायगी-अप्रासंगिक बहिर्जात कारकों के परिणाम के रूप में देखे जाते हैं।[5]एक दूसरी व्याख्या एजेंटों की एक बड़ी आबादी के लिए खड़े खेल खिलाड़ियों की कल्पना करती है। प्रत्येक एजेंट एक शुद्ध रणनीति चुनता है, और अदायगी प्रत्येक रणनीति को चुनने वाले एजेंटों के अंश पर निर्भर करती है। मिश्रित रणनीति इसलिए प्रत्येक जनसंख्या द्वारा चुनी गई शुद्ध रणनीतियों के वितरण का प्रतिनिधित्व करती है। हालांकि, यह मामले के लिए कोई औचित्य प्रदान नहीं करता है जब खिलाड़ी व्यक्तिगत एजेंट होते हैं।

बाद में, ऑमन और ब्रैंडेनबर्गर (1995),[7] क्रियाओं के बजाय विश्वासों में संतुलन के रूप में नैश संतुलन की फिर से व्याख्या की। उदाहरण के लिए, रॉक पेपर कैंची में विश्वासों में एक संतुलन प्रत्येक खिलाड़ी को विश्वास होगा कि दूसरे को समान रूप से प्रत्येक रणनीति खेलने की संभावना है। यह व्याख्या नैश संतुलन की वर्णनात्मक शक्ति को कमजोर करती है, हालांकि, इस तरह के संतुलन में प्रत्येक खिलाड़ी के लिए वास्तव में खेल के प्रत्येक खेल में रॉक की शुद्ध रणनीति खेलना संभव है, भले ही समय के साथ मिश्रित रणनीति की संभावनाएं हों .

व्यवहार रणनीति

जबकि एक मिश्रित रणनीति शुद्ध रणनीतियों पर संभाव्यता वितरण प्रदान करती है, एक व्यवहार रणनीति प्रत्येक जानकारी पर संभावित कार्यों के सेट पर संभाव्यता वितरण सेट करती है। जबकि दो अवधारणाएँ सामान्य रूप के खेल के संदर्भ में बहुत निकट से संबंधित हैं, व्यापक रूप के खेल के लिए उनके बहुत भिन्न निहितार्थ हैं। मोटे तौर पर, एक मिश्रित रणनीति बेतरतीब ढंग से गेम ट्री के माध्यम से एक नियतात्मक पथ चुनती है, जबकि एक व्यवहार रणनीति को स्टोकेस्टिक पथ के रूप में देखा जा सकता है। मिश्रित और व्यवहार रणनीतियों के बीच संबंध कुह्न के प्रमेय का विषय है, पारंपरिक गेम-सैद्धांतिक परिकल्पनाओं पर एक व्यवहारिक दृष्टिकोण। परिणाम यह स्थापित करता है कि किसी भी खिलाड़ी और किसी भी मिश्रित रणनीति के लिए पूर्ण स्मरण के साथ किसी भी परिमित व्यापक रूप के खेल में, एक व्यवहार रणनीति मौजूद होती है, जो रणनीतियों के सभी प्रोफाइल (अन्य खिलाड़ियों के) के खिलाफ, टर्मिनल नोड्स पर समान वितरण को प्रेरित करती है। मिश्रित रणनीति करती है। इसका उलटा भी सच है।

तुल्यता के लिए पूर्ण स्मरण क्यों आवश्यक है, इसका एक प्रसिद्ध उदाहरण पिकसिओन और रुबिनस्टीन (1997) द्वारा दिया गया है।[full citation needed] उनके एब्सेंट-माइंडेड ड्राइवर गेम के साथ।

परिणाम तुल्यता

परिणाम तुल्यता खिलाड़ी i के प्रतिद्वंद्वी की शुद्ध रणनीति के संबंध में खिलाड़ी i की मिश्रित और व्यवहारिक रणनीति को जोड़ती है। आउटकम समतुल्यता को उस स्थिति के रूप में परिभाषित किया जाता है, जिसमें किसी भी मिश्रित और व्यवहारिक रणनीति के लिए, जो खिलाड़ी I लेता है, किसी भी शुद्ध रणनीति के जवाब में, जो कि खिलाड़ी I का प्रतिद्वंद्वी खेलता है, मिश्रित और व्यवहारिक रणनीति का परिणाम वितरण समान होना चाहिए। इस तुल्यता को निम्न सूत्र द्वारा वर्णित किया जा सकता है: (Q^(U(i), S(-i)))(z) = (Q^(β(i), S(-i)))(z), जहां U(i) खिलाड़ी i की मिश्रित रणनीति का वर्णन करता है, β(i) खिलाड़ी i की व्यवहारिक रणनीति का वर्णन करता है, और S(-i) प्रतिद्वंद्वी की रणनीति है।[8]


परफेक्ट रिकॉल के साथ रणनीति

परफेक्ट रिकॉल को खेल में प्रत्येक खिलाड़ी की क्षमता के रूप में परिभाषित किया जाता है ताकि खेल के भीतर सभी पिछले कार्यों को याद किया जा सके। तुल्यता के लिए पूर्ण स्मरण की आवश्यकता होती है, क्योंकि अपूर्ण स्मरण वाले परिमित खेलों में, खिलाड़ी I की मौजूदा मिश्रित रणनीतियाँ होंगी जिनमें कोई समान व्यवहार रणनीति नहीं है। यह Piccione और Rubinstein द्वारा तैयार किए गए एब्सेंट-माइंडेड ड्राइवर गेम में पूरी तरह से वर्णित है। संक्षेप में, यह गेम अपूर्ण याद रखने वाले ड्राइवर के निर्णय लेने पर आधारित है, जिसे घर पहुंचने के लिए हाईवे से दूसरा निकास लेने की आवश्यकता होती है, लेकिन यह याद नहीं रहता कि वे किस चौराहे पर पहुँचे हैं। चित्र [2] इस खेल का वर्णन करता है।

सही जानकारी के बिना (अर्थात् अपूर्ण जानकारी), खिलाड़ी प्रत्येक निर्णय नोड पर एक विकल्प बनाते हैं बिना उन निर्णयों के ज्ञान के जो इससे पहले हुए हैं। इसलिए, एक खिलाड़ी की मिश्रित रणनीति ऐसे परिणाम उत्पन्न कर सकती है जो उनकी व्यवहारिक रणनीति नहीं कर सकती है, और इसके विपरीत। एब्सेंट-माइंडेड ड्राइवर गेम में इसका प्रदर्शन किया गया है। सही याद और जानकारी के साथ, ड्राइवर के पास एक ही शुद्ध रणनीति है, जो [जारी रखें, बाहर निकलें] है, क्योंकि ड्राइवर को पता है कि वे किस चौराहे (या निर्णय नोड) पर हैं, जब वे उस पर पहुंचते हैं। दूसरी ओर, केवल योजना-इष्टतम चरण को देखते हुए, दोनों चौराहों पर जारी रखने से अधिकतम अदायगी प्राप्त की जाती है, पी = 2/3 (संदर्भ) पर अधिकतम। यह सरल एक खिलाड़ी गेम परिणाम समकक्षता के लिए सही रिकॉल के महत्व और सामान्य और विस्तारित फॉर्म गेम पर इसके प्रभाव को प्रदर्शित करता है।[9]


यह भी देखें

  • नैश संतुलन
  • हेवन (ग्राफ सिद्धांत)
  • क्रमिक रूप से स्थिर रणनीति


इस पेज में लापता आंतरिक लिंक की सूची

संदर्भ

  1. Ben Polak Game Theory: Lecture 1 Transcript ECON 159, 5 September 2007, Open Yale Courses.
  2. Aumann, R. (22 March 2017). खेल सिद्धांत। इन: पालग्रेव मैकमिलन. London: Palgrave Macmillan. ISBN 978-1-349-95121-5.
  3. Chiappori, P. -A.; Levitt, S.; Groseclose, T. (2002). "खिलाड़ियों के विषम होने पर मिश्रित-रणनीति संतुलन का परीक्षण: फ़ुटबॉल में पेनल्टी किक का मामला" (PDF). American Economic Review. 92 (4): 1138. CiteSeerX 10.1.1.178.1646. doi:10.1257/00028280260344678.
  4. Aumann, R. (1985). "What is Game Theory Trying to accomplish?" (PDF). In Arrow, K.; Honkapohja, S. (eds.). अर्थशास्त्र की सीमाएं. Oxford: Basil Blackwell. pp. 909–924.
  5. 5.0 5.1 Rubinstein, A. (1991). "गेम थ्योरी की व्याख्या पर टिप्पणियाँ". Econometrica. 59 (4): 909–924. doi:10.2307/2938166. JSTOR 2938166.
  6. Harsanyi, John (1973). "बेतरतीब ढंग से परेशान अदायगी वाले खेल: मिश्रित-रणनीति संतुलन बिंदुओं के लिए एक नया तर्क". Int. J. Game Theory. 2: 1–23. doi:10.1007/BF01737554. S2CID 154484458.
  7. Aumann, Robert; Brandenburger, Adam (1995). "नैश इक्विलिब्रियम के लिए महामारी की स्थिति". Econometrica. 63 (5): 1161–1180. CiteSeerX 10.1.1.122.5816. doi:10.2307/2171725. JSTOR 2171725.
  8. Shimoji, Makoto (2012-05-01). "स्व-पुष्टि संतुलन और नैश संतुलन का परिणाम-तुल्यता". Games and Economic Behavior. 75 (1): 441–447. doi:10.1016/j.geb.2011.09.010. ISSN 0899-8256.
  9. Kak, Subhash (2017). "एब्सेंट-माइंडेड ड्राइवर प्रॉब्लम रिडक्स". arXiv:1702.05778 [cs.AI].