दोष सहिष्णुता

From alpha
Jump to navigation Jump to search

दोष सहनशीलता वह संपत्ति है जो एक प्रणाली को इसके कुछ घटकों के भीतर एक या एक से अधिक दोषों की विफलता की स्थिति में ठीक से काम करना जारी रखने में सक्षम बनाती है। यदि इसकी परिचालन गुणवत्ता बिल्कुल भी कम हो जाती है, तो कमी विफलता की गंभीरता के समानुपाती होती है, जबकि एक भोली-भाली प्रणाली की तुलना में, जिसमें एक छोटी सी विफलता भी कुल खराबी का कारण बन सकती है। उच्च-उपलब्धता, महत्वपूर्ण मिशन /मिशन-क्रिटिकल, या यहां तक ​​कि जीवन-महत्वपूर्ण प्रणालियों में दोष सहनशीलता की विशेष रूप से मांग की जाती है। सिस्टम के कुछ हिस्सों के टूटने पर कार्यक्षमता बनाए रखने की क्षमता को ग्रेसफुल डिग्रेडेशन कहा जाता है।[1] एक दोष-सहिष्णु डिज़ाइन एक प्रणाली को अपने इच्छित संचालन को जारी रखने में सक्षम बनाता है, संभवतः कम स्तर पर, पूरी तरह से विफल होने के बजाय, जब सिस्टम का कुछ भाग विफल हो जाता है।[2] यह शब्द आमतौर पर कुछ आंशिक विफलता की स्थिति में THROUGHPUT में कमी या प्रतिक्रिया समय (प्रौद्योगिकी) में वृद्धि के साथ अधिक या कम पूरी तरह से चालू रखने के लिए डिज़ाइन किए गए कंप्यूटर प्रणाली का वर्णन करने के लिए उपयोग किया जाता है। अर्थात्, कंप्यूटर हार्डवेयर या सॉफ़्टवेयर में समस्याओं के कारण संपूर्ण रूप से सिस्टम बंद नहीं होता है। एक अन्य क्षेत्र में एक उदाहरण एक मोटर वाहन है जिसे डिज़ाइन किया गया है, यदि टायरों में से एक को पंचर कर दिया गया है, या एक संरचना जो थकान (सामग्री) जैसे कारणों से क्षति की उपस्थिति में अपनी अखंडता को बनाए रखने में सक्षम है, तो इसे चलाना जारी रहेगा। जंग, निर्माण दोष, या प्रभाव।

एक व्यक्तिगत प्रणाली के दायरे में, असाधारण स्थितियों की आशा करके और उनसे निपटने के लिए प्रणाली का निर्माण करके, और सामान्य रूप से, आत्म-स्थिरीकरण के लिए लक्ष्य बनाकर गलती सहनशीलता हासिल की जा सकती है ताकि सिस्टम एक त्रुटि मुक्त राज्य की ओर अभिसरण हो। हालांकि, यदि किसी प्रणाली की विफलता के परिणाम भयावह हैं, या इसे पर्याप्त रूप से विश्वसनीय बनाने की लागत बहुत अधिक है, तो कुछ प्रकार के दोहराव का उपयोग करना एक बेहतर समाधान हो सकता है। किसी भी मामले में, यदि सिस्टम की विफलता का परिणाम इतना भयावह है, तो सिस्टम सुरक्षित मोड में वापस आने के लिए रिवर्सन का उपयोग करने में सक्षम होना चाहिए। यह रोल-बैक रिकवरी के समान है लेकिन अगर इंसान लूप में मौजूद हैं तो यह एक मानवीय क्रिया हो सकती है।

इतिहास

पहला ज्ञात दोष-सहिष्णु कंप्यूटर SAPO (कंप्यूटर) था, जिसे 1951 में एंटोनिन स्वोबोडा (कंप्यूटर वैज्ञानिक) एंटोनिन स्वोबोडा द्वारा चेकोस्लोवाकिया में बनाया गया था।[3]: 155  इसका मूल डिजाइन ड्रम मेमोरी था जो राम समता डिटेक्शन (ट्रिपल मॉड्यूलर अतिरेक ) की वोटिंग विधि के साथ रिले के माध्यम से जुड़ा हुआ था। इस रेखा के साथ कई अन्य मशीनें विकसित की गईं, जो ज्यादातर सैन्य उपयोग के लिए थीं। आखिरकार, वे तीन अलग-अलग श्रेणियों में अलग हो गए: ऐसी मशीनें जो बिना किसी रखरखाव के लंबे समय तक चलेंगी, जैसे नासा अंतरिक्ष जांच और उपग्रहों पर इस्तेमाल की जाने वाली मशीनें; कंप्यूटर जो बहुत भरोसेमंद थे लेकिन निरंतर निगरानी की आवश्यकता थी, जैसे परमाणु ऊर्जा संयंत्रों या कोलाइडर प्रयोगों की निगरानी और नियंत्रण करने के लिए उपयोग किए जाने वाले कंप्यूटर; और अंत में, उच्च मात्रा में रनटाइम वाले कंप्यूटर जो भारी उपयोग के अधीन होंगे, जैसे कि बीमा कंपनियों द्वारा उनकी संभाव्यता निगरानी के लिए उपयोग किए जाने वाले कई सुपर कंप्यूटर।

तथाकथित एलएलएनएम (लॉन्ग लाइफ, नो मेंटेनेंस) कंप्यूटिंग में अधिकांश विकास 1960 के दशक के दौरान नासा द्वारा किया गया था,[4] प्रोजेक्ट अपोलो और अन्य शोध पहलुओं की तैयारी में। नासा की पहली मशीन एक अंतरिक्ष वेधशाला में गई, और उनका दूसरा प्रयास, JSTAR कंप्यूटर, वायेजर कार्यक्रम में इस्तेमाल किया गया। इस कंप्यूटर में मेमोरी रिकवरी विधियों का उपयोग करने के लिए मेमोरी एरे का बैकअप था और इस प्रकार इसे जेपीएल सेल्फ-टेस्टिंग-एंड-रिपेयरिंग कंप्यूटर कहा जाता था। यह अपनी त्रुटियों का पता लगा सकता है और उन्हें ठीक कर सकता है या आवश्यकतानुसार अनावश्यक मॉड्यूल ला सकता है। कंप्यूटर अभी भी काम कर रहा है, 2022 की शुरुआत तक।[5] हाइपर-भरोसेमंद कंप्यूटर ज्यादातर विमान निर्माताओं द्वारा अग्रणी थे,[3]: 210  परमाणु ऊर्जा कंपनियां, और संयुक्त राज्य अमेरिका में संयुक्त राज्य अमेरिका में रेल परिवहन। इन कंप्यूटरों को भारी मात्रा में अपटाइम की आवश्यकता थी जो इस तथ्य पर भरोसा करते हुए निरंतर संचालन की अनुमति देने के लिए एक दोष के साथ पर्याप्त विफलता होगी कि दोषों का पता लगाने के लिए कंप्यूटर आउटपुट की मनुष्यों द्वारा लगातार निगरानी की जाएगी। पुनः, IBM ने इस प्रकार का पहला कंप्यूटर NASA के लिए शनि वि रॉकेट के मार्गदर्शन के लिए विकसित किया, लेकिन बाद में BNSF, Unisys, और General Electric ने अपना स्वयं का कंप्यूटर बनाया।[3]: 223 

1970 के दशक में इस क्षेत्र में बहुत काम हुआ।[6][7][8] उदाहरण के लिए, F14 CADC में अंतर्निहित स्व-परीक्षण और अतिरेक था।[9] सामान्य तौर पर, दोष-सहिष्णु डिजाइनों के शुरुआती प्रयास मुख्य रूप से आंतरिक निदान पर केंद्रित थे, जहां एक गलती का संकेत होगा कि कुछ विफल हो रहा था और एक कार्यकर्ता इसे बदल सकता था। उदाहरण के लिए, SAPO के पास एक ऐसी विधि थी जिसके द्वारा दोषपूर्ण मेमोरी ड्रम विफल होने से पहले शोर का उत्सर्जन करते थे।[10] बाद के प्रयासों से पता चला कि पूरी तरह से प्रभावी होने के लिए, सिस्टम को स्व-मरम्मत और निदान करना था - एक गलती को अलग करना और फिर मरम्मत की आवश्यकता को सचेत करते हुए एक निरर्थक बैकअप को लागू करना। इसे एन-मॉडल अतिरेक के रूप में जाना जाता है, जहां दोष स्वत: विफल-सुरक्षित और ऑपरेटर के लिए चेतावनी का कारण बनते हैं, और यह आज भी उपयोग में आने वाले स्तर एक दोष-सहिष्णु डिजाइन का सबसे सामान्य रूप है।

वोटिंग एक और प्रारंभिक तरीका था, जैसा कि ऊपर चर्चा की गई है, जिसमें कई निरर्थक बैकअप लगातार काम कर रहे हैं और एक दूसरे के परिणामों की जांच कर रहे हैं, जिसके परिणामस्वरूप, उदाहरण के लिए, चार घटकों ने 5 के उत्तर की सूचना दी और एक घटक ने 6 के उत्तर की सूचना दी, अन्य चार मतदान करेंगे कि पांचवां घटक दोषपूर्ण था और इसे सेवा से बाहर कर दिया गया। इसे N बहुमत मतदान में से M कहा जाता है।

ऐतिहासिक रूप से, गति हमेशा एन-मॉडल से आगे और एन से अधिक एम से आगे बढ़ने की रही है, इस तथ्य के कारण कि सिस्टम की जटिलता और गलती-नकारात्मक से गलती-सकारात्मक तक सकर्मक स्थिति को सुनिश्चित करने में कठिनाई ने संचालन को बाधित नहीं किया। .

टंडेम कंप्यूटर, 1976 में[11] और स्ट्रैटस टेक्नोलॉजीज उन पहली कंपनियों में शामिल थीं, जिन्हें ऑनलाइन लेनदेन प्रसंस्करण के लिए फॉल्ट-टॉलरेंट कंप्यूटर सिस्टम के डिजाइन में विशेषज्ञता हासिल थी।

उदाहरण

M2 मोबाइल वेब, ट्विटर का मूल मोबाइल वेब फ्रंट एंड, बाद में दिसंबर 2020 तक जावास्क्रिप्ट समर्थन और/या असंगत ब्राउज़रों के बिना क्लाइंट (कंप्यूटिंग) के लिए फ़ॉलबैक लीगेसी संस्करण के रूप में कार्य किया।

हार्डवेयर दोष सहिष्णुता के लिए कभी-कभी आवश्यक होता है कि टूटे हुए पुर्जों को बाहर निकाला जाए और नए पुर्जों के साथ प्रतिस्थापित किया जाए, जबकि सिस्टम अभी भी चालू है (कंप्यूटिंग में जिसे गर्म अदला-बदली के रूप में जाना जाता है)। एकल बैकअप के साथ लागू की गई ऐसी प्रणाली को 'एकल बिंदु सहिष्णु' के रूप में जाना जाता है और अधिकांश दोष-सहिष्णु प्रणालियों का प्रतिनिधित्व करता है। ऐसी प्रणालियों में विफलताओं के बीच का औसत समय इतना लंबा होना चाहिए कि ऑपरेटरों के पास बैकअप के विफल होने से पहले टूटे हुए उपकरणों (औसत मरम्मत का समय) को ठीक करने के लिए पर्याप्त समय हो। यदि विफलताओं के बीच का समय यथासंभव लंबा हो तो यह मददगार होता है, लेकिन दोष-सहिष्णु प्रणाली में इसकी विशेष रूप से आवश्यकता नहीं होती है।

कंप्यूटर अनुप्रयोगों में दोष सहिष्णुता उल्लेखनीय रूप से सफल है। टेंडेम कंप्यूटर्स ने अपना पूरा व्यवसाय ऐसी मशीनों पर बनाया, जो वर्षों में मापे गए अपटाइम्स के साथ अपने नॉनस्टॉप (सर्वर कंप्यूटर) सिस्टम बनाने के लिए सिंगल-पॉइंट टॉलरेंस का उपयोग करती हैं।

विफल-सुरक्षित आर्किटेक्चर में कंप्यूटर सॉफ़्टवेयर भी शामिल हो सकता है, उदाहरण के लिए प्रक्रिया प्रतिकृति (कंप्यूटर विज्ञान) द्वारा।

डेटा स्वरूपों को भी इनायत से नीचा दिखाने के लिए डिज़ाइन किया जा सकता है। उदाहरण के लिए, HTML को अग्रेषित अनुकूलता के लिए डिज़ाइन किया गया है, जिससे वेब ब्राउज़र दस्तावेज़ को अनुपयोगी बनाए बिना नई और असमर्थित HTML संस्थाओं को अनदेखा कर सकते हैं। इसके अतिरिक्त, कुछ साइट्स, जिनमें ट्विटर (दिसंबर 2020 तक) जैसे लोकप्रिय प्लेटफॉर्म शामिल हैं, एक वैकल्पिक हल्का फ्रंट एंड प्रदान करते हैं जो जावास्क्रिप्ट पर निर्भर नहीं करता है और एक न्यूनतावाद (कंप्यूटिंग) लेआउट है, जो व्यापक कंप्यूटर पहुंच और आउटरीच सुनिश्चित करता है, जैसे कि गेम पर सीमित वेब ब्राउजिंग क्षमताओं के साथ कंसोल।[12][13]


शब्दावली

पारदर्शिता के साथ एक छवि में डिजाइन द्वारा सुंदर गिरावट का एक उदाहरण। शीर्ष दो छवियों में से प्रत्येक एक समग्र छवि को एक दर्शक में देखने का परिणाम है जो पारदर्शिता को पहचानता है। पारदर्शिता के लिए बिना किसी समर्थन के एक दर्शक के रूप में नीचे की दो छवियां परिणाम हैं। चूंकि पारदर्शिता मुखौटा (मध्य तल) हटा दिया गया है, केवल ओवरले (केंद्र शीर्ष) रहता है; बाईं ओर की छवि को शानदार ढंग से नीचा दिखाने के लिए डिज़ाइन किया गया है, इसलिए इसकी पारदर्शिता जानकारी के बिना अभी भी सार्थक है।

एक या अधिक घटकों के विफल होने के बावजूद एक अत्यधिक दोष-सहिष्णु प्रणाली प्रदर्शन के समान स्तर पर जारी रह सकती है। उदाहरण के लिए, एक बैकअप विद्युत जनरेटर वाला एक भवन दीवार आउटलेट्स को समान वोल्टेज प्रदान करेगा, भले ही ग्रिड पावर विफल हो जाए।

एक सिस्टम जिसे सुरक्षा कम होना, या फेल-सिक्योर, या शान से विफल होने के लिए डिज़ाइन किया गया है, चाहे वह कम स्तर पर कार्य करता हो या पूरी तरह से विफल हो, ऐसा वह इस तरह से करता है जो लोगों, संपत्ति, या डेटा को चोट, क्षति, घुसपैठ, या से बचाता है। प्रकटीकरण। कंप्यूटर में, एक त्रुटि का सामना करने के बाद डेटा भ्रष्टाचार को रोकने के लिए एक प्रोग्राम एक शानदार निकास (एक अनियंत्रित क्रैश के विपरीत) को निष्पादित करके विफल-सुरक्षित हो सकता है।[14] अच्छी तरह से असफल होने और बुरी तरह असफल होने के बीच एक समान अंतर किया जाता है।

एक सिस्टम जिसे ग्रेसफुल डिग्रेडेशन का अनुभव करने के लिए, या सॉफ्ट फेल करने के लिए डिज़ाइन किया गया है (कंप्यूटिंग में उपयोग किया जाता है, फेल सेफ के समान[15]) कुछ घटक विफलताओं के बाद प्रदर्शन के निम्न स्तर पर संचालित होता है। उदाहरण के लिए, लोगों को पूरी तरह से अंधेरे में फंसाने या पूरी शक्ति से काम करना जारी रखने के बजाय, अगर ग्रिड की शक्ति विफल हो जाती है, तो एक इमारत कम स्तरों पर रोशनी और कम गति पर लिफ्ट का संचालन कर सकती है। ग्रेसफुल डिग्रेडेशन का एक उदाहरण यह है कि यदि ऑनलाइन वीडियो स्ट्रीम करने के लिए अपर्याप्त नेटवर्क बैंडविड्थ उपलब्ध है, तो उच्च-रिज़ॉल्यूशन संस्करण के स्थान पर कम-रिज़ॉल्यूशन संस्करण स्ट्रीम किया जा सकता है। प्रगतिशील संवर्द्धन कंप्यूटिंग में एक उदाहरण है, जहां वेब पेज पुराने, छोटे-स्क्रीन, या सीमित-क्षमता वाले वेब ब्राउज़रों के लिए एक बुनियादी कार्यात्मक प्रारूप में उपलब्ध हैं, लेकिन अतिरिक्त तकनीकों को संभालने में सक्षम या बड़े प्रदर्शन वाले ब्राउज़रों के लिए उन्नत संस्करण में उपलब्ध हैं। उपलब्ध।

दोष-सहिष्णु कंप्यूटर सिस्टम में, रोबस्टनेस (कंप्यूटर विज्ञान) माने जाने वाले प्रोग्राम पूरी तरह से क्रैश होने के बजाय त्रुटि, अपवाद या अमान्य इनपुट के बावजूद संचालन जारी रखने के लिए डिज़ाइन किए गए हैं। सॉफ्टवेयर भंगुरता मजबूती के विपरीत है। लचीलापन (नेटवर्क) कुछ लिंक या नोड्स की विफलता के बावजूद डेटा संचारित करना जारी रखता है; लचीलेपन (इंजीनियरिंग और निर्माण) से भी भूकंप, बाढ़ या टकराव जैसी स्थितियों में पूर्ण विफलता को रोकने की अपेक्षा की जाती है।

उच्च विफलता पारदर्शिता वाली प्रणाली उपयोगकर्ताओं को सचेत करेगी कि एक घटक विफलता हुई है, भले ही यह पूर्ण प्रदर्शन के साथ काम करना जारी रखे, ताकि विफलता की मरम्मत की जा सके या आसन्न पूर्ण विफलता का अनुमान लगाया जा सके।[16] इसी तरह, डाउनस्ट्रीम घटकों को विफल करने और फिर रिपोर्ट उत्पन्न करने के बजाय, विफलता के पहले बिंदु पर रिपोर्ट करने के लिए एक विफल-तेज़ घटक को डिज़ाइन किया गया है। यह अंतर्निहित समस्या का आसान निदान करने की अनुमति देता है, और टूटी हुई स्थिति में अनुचित संचालन को रोक सकता है।

सिंगल फॉल्ट कंडीशन एक ऐसी स्थिति है जहां एक खतरे के खिलाफ सुरक्षा तंत्र के लिए एक साधन दोषपूर्ण है। यदि एक गलती की स्थिति अनिवार्य रूप से एक और गलती की स्थिति में परिणाम देती है, तो दो विफलताओं को एक ही गलती की स्थिति माना जाता है।[17] एक स्रोत निम्नलिखित उदाहरण प्रस्तुत करता है:

A single-fault condition is a condition when a single means for protection against hazard in equipment is defective or a single external abnormal condition is present, e.g. short circuit between the live parts and the applied part.[18]

मानदंड

प्रत्येक घटक के लिए दोष-सहिष्णु डिज़ाइन प्रदान करना सामान्य रूप से एक विकल्प नहीं है। संबंधित अतिरेक कई दंड लाता है: वजन, आकार, बिजली की खपत, लागत में वृद्धि, साथ ही डिजाइन, सत्यापन और परीक्षण के लिए समय। इसलिए, यह निर्धारित करने के लिए कि कौन से घटक दोष सहिष्णु होने चाहिए, कई विकल्पों की जांच की जानी चाहिए:[19]

  • घटक कितना महत्वपूर्ण है? एक कार में, रेडियो महत्वपूर्ण नहीं है, इसलिए इस घटक को दोष सहिष्णुता की कम आवश्यकता होती है।
  • घटक के विफल होने की कितनी संभावना है? कार में ड्राइव शाफ्ट जैसे कुछ घटकों के विफल होने की संभावना नहीं है, इसलिए किसी दोष सहिष्णुता की आवश्यकता नहीं है।
  • घटक दोष सहिष्णु बनाना कितना महंगा है? एक अनावश्यक कार इंजन की आवश्यकता, उदाहरण के लिए, आर्थिक रूप से और वजन और स्थान के मामले में बहुत महंगा होगा, पर विचार किया जाना चाहिए।

एक घटक का एक उदाहरण जो सभी परीक्षणों को पास करता है, एक कार का रहने वाला संयम प्रणाली है। जबकि हम आम तौर पर प्राथमिक निवासी संयम प्रणाली के बारे में नहीं सोचते हैं, यह गुरुत्वाकर्षण है। यदि वाहन लुढ़कता है या गंभीर जी-फोर्स से गुजरता है, तो रहने वाले संयम की यह प्राथमिक विधि विफल हो सकती है। ऐसी दुर्घटना के दौरान रहने वालों को रोकना सुरक्षा के लिए बिल्कुल महत्वपूर्ण है, इसलिए हम पहली परीक्षा पास करते हैं। सीट बेल्ट लगाने से पहले यात्री इजेक्शन के कारण दुर्घटनाएं काफी आम थीं, इसलिए हम दूसरी परीक्षा पास करते हैं। आर्थिक रूप से और वजन और स्थान दोनों के मामले में सीट बेल्ट जैसी अनावश्यक संयम विधि की लागत काफी कम है, इसलिए हम तीसरा परीक्षण पास करते हैं। इसलिए, सभी वाहनों में सीट बेल्ट लगाना एक उत्कृष्ट विचार है। अन्य पूरक संयम प्रणालियां, जैसे कि एयरबैग, अधिक महंगे हैं और इसलिए उस परीक्षा को एक छोटे अंतर से पास करते हैं।

इस सिद्धांत को व्यवहार में लाने का एक और उत्कृष्ट और दीर्घकालिक उदाहरण ब्रेकिंग सिस्टम है: जबकि वास्तविक ब्रेक तंत्र महत्वपूर्ण हैं, वे विशेष रूप से अचानक (प्रगतिशील के बजाय) विफलता के लिए प्रवण नहीं होते हैं, और किसी भी मामले में अनुमति देने के लिए आवश्यक रूप से दोहराए जाते हैं। सभी पहियों पर ब्रेक बल का सम और संतुलित अनुप्रयोग। मुख्य घटकों को और दोगुना करना निषेधात्मक रूप से महंगा होगा और वे काफी वजन बढ़ाएंगे। हालांकि, चालक नियंत्रण के तहत ब्रेक लगाने के लिए समान रूप से महत्वपूर्ण प्रणालियां स्वाभाविक रूप से कम मजबूत होती हैं, आम तौर पर एक केबल (जंग, खिंचाव, जाम, स्नैप) या हाइड्रोलिक तरल पदार्थ (रिसाव, उबाल और बुलबुले विकसित कर सकते हैं, पानी को अवशोषित कर सकते हैं और इस प्रकार प्रभावशीलता खो सकते हैं) ). इस प्रकार अधिकांश आधुनिक कारों में फुटब्रेक हाइड्रोलिक ब्रेक सर्किट को विफलता के दो छोटे बिंदु देने के लिए तिरछे विभाजित किया जाता है, या तो केवल ब्रेक पावर को 50% कम करने का नुकसान होता है और सीधे सामने-पीछे या बाएं-दाएं जितना खतरनाक ब्रेकफोर्स असंतुलन नहीं होता है। विभाजन, और हाइड्रोलिक सर्किट पूरी तरह से विफल होना चाहिए (अपेक्षाकृत बहुत दुर्लभ घटना), केबल-एक्ट्यूएटेड पार्किंग ब्रेक के रूप में एक विफलता है जो अन्यथा अपेक्षाकृत कमजोर रियर ब्रेक को संचालित करती है, लेकिन फिर भी वाहन को एक सुरक्षित पड़ाव पर ला सकती है। ट्रांसमिशन/इंजन ब्रेकिंग के संयोजन के साथ जब तक कि उस पर मांग सामान्य यातायात प्रवाह के अनुरूप हो। आपातकालीन स्थिति में कठोर ब्रेकिंग की आवश्यकता के साथ कुल फुट ब्रेक विफलता के संचयी रूप से असंभावित संयोजन के परिणामस्वरूप टक्कर हो सकती है, लेकिन फिर भी कम गति से अन्यथा मामला होता।

फुट पेडल सक्रिय सर्विस ब्रेक की तुलना में, पार्किंग ब्रेक अपने आप में एक कम महत्वपूर्ण वस्तु है, और जब तक इसे फुटब्रेक के लिए एक बार के बैकअप के रूप में उपयोग नहीं किया जा रहा है, तब तक यह तत्काल खतरे का कारण नहीं बनेगा यदि यह गैर-कार्यात्मक पाया जाता है। आवेदन का क्षण। इसलिए, इसमें कोई अतिरेक नहीं बनाया गया है (और यह आमतौर पर एक सस्ता, हल्का, लेकिन कम सख्त केबल एक्ट्यूएशन सिस्टम का उपयोग करता है), और यह पर्याप्त हो सकता है, अगर यह एक पहाड़ी पर होता है, तो वाहन को स्थिर रखने के लिए फुटब्रेक का उपयोग करने के लिए , गाड़ी चलाने से पहले सड़क का एक सपाट टुकड़ा खोजने के लिए जिस पर रुकना है। वैकल्पिक रूप से, उथले ग्रेडियेंट पर, ट्रांसमिशन को पार्क, रिवर्स या फर्स्ट गियर में स्थानांतरित किया जा सकता है, और ट्रांसमिशन लॉक/इंजन संपीड़न इसे स्थिर रखने के लिए उपयोग किया जाता है, क्योंकि पहले इसे रोकने के लिए परिष्कार को शामिल करने की कोई आवश्यकता नहीं है .

मोटरसाइकिलों पर, समान स्तर की विफलता-सुरक्षा सरल विधियों द्वारा प्रदान की जाती है; सबसे पहले, फ्रंट और रियर ब्रेक सिस्टम पूरे हैंसक्रियण की उनकी विधि (जो केबल, रॉड या हाइड्रोलिक हो सकती है) की परवाह किए बिना, पूरी तरह से अलग, दूसरे को अप्रभावित छोड़ते हुए पूरी तरह से विफल होने की अनुमति देता है। दूसरा, रियर ब्रेक अपने ऑटोमोटिव चचेरे भाई की तुलना में अपेक्षाकृत मजबूत है, कुछ स्पोर्ट्स मॉडल पर एक शक्तिशाली डिस्क होने के बावजूद, सामान्य मंशा फ्रंट सिस्टम के लिए ब्रेकिंग बल का विशाल बहुमत प्रदान करने के लिए है; चूंकि समग्र वाहन का वजन अधिक केंद्रीय होता है, पिछला टायर आम तौर पर बड़ा होता है और इसमें बेहतर कर्षण होता है, ताकि सवार उस पर अधिक वजन डालने के लिए पीछे झुक सके, इसलिए व्हील लॉक से पहले अधिक ब्रेक बल लगाने की अनुमति देता है। सस्ती, धीमी उपयोगिता-श्रेणी की मशीनों पर, भले ही फ्रंट व्हील को अतिरिक्त ब्रेक बल और आसान पैकेजिंग के लिए हाइड्रोलिक डिस्क का उपयोग करना चाहिए, रियर आमतौर पर एक आदिम, कुछ अकुशल, लेकिन असाधारण रूप से मजबूत रॉड-एक्ट्यूएटेड ड्रम होगा, आसानी के लिए धन्यवाद फुटपेडल को इस तरह से पहिया से जोड़ने और, इससे भी महत्वपूर्ण बात, विनाशकारी विफलता की निकट असंभवता, भले ही बाकी मशीन, जैसे कि उपयोग के पहले कुछ वर्षों के बाद बहुत कम कीमत वाली बाइक, के बिंदु पर है उपेक्षित रखरखाव से पतन।

आवश्यकताएँ

दोष सहिष्णुता की बुनियादी विशेषताओं की आवश्यकता है:

  1. विफलता का कोई एकल बिंदु नहीं - यदि कोई सिस्टम विफलता का अनुभव करता है, तो उसे मरम्मत प्रक्रिया के दौरान बिना किसी रुकावट के काम करना जारी रखना चाहिए।
  2. असफल घटक के लिए दोष अलगाव - जब कोई विफलता होती है, तो सिस्टम को आपत्तिजनक घटक की विफलता को अलग करने में सक्षम होना चाहिए। इसके लिए समर्पित विफलता का पता लगाने वाले तंत्रों को जोड़ने की आवश्यकता है जो केवल दोष अलगाव के उद्देश्य से मौजूद हैं। गलती की स्थिति से पुनर्प्राप्ति के लिए गलती या असफल घटक को वर्गीकृत करने की आवश्यकता होती है। राष्ट्रीय मानक और प्रौद्योगिकी संस्थान (एनआईएसटी) स्थानीयता, कारण, अवधि और प्रभाव के आधार पर दोषों को वर्गीकृत करता है।[where?][clarification needed]
  3. विफलता के प्रसार को रोकने के लिए दोष नियंत्रण - कुछ विफलता तंत्र विफलता को शेष प्रणाली में प्रचारित करके एक प्रणाली को विफल कर सकते हैं। इस तरह की विफलता का एक उदाहरण दुष्ट ट्रांसमीटर है जो सिस्टम में वैध संचार को स्वाहा कर सकता है और समग्र सिस्टम विफलता का कारण बन सकता है। फ़ायरवॉल (कंप्यूटिंग) या अन्य तंत्र जो सिस्टम की सुरक्षा के लिए एक दुष्ट ट्रांसमीटर या विफल घटक को अलग करते हैं, की आवश्यकता होती है।
  4. प्रत्यावर्तन की उपलब्धता (सॉफ्टवेयर विकास)[clarification needed]

इसके अलावा, नियोजित सेवा आउटेज और अनियोजित सेवा आउटेज दोनों के संदर्भ में दोष-सहिष्णु प्रणालियों की विशेषता है। इन्हें आमतौर पर एप्लिकेशन स्तर पर मापा जाता है न कि केवल हार्डवेयर स्तर पर। योग्यता के आंकड़े को उपलब्धता कहा जाता है और इसे प्रतिशत के रूप में व्यक्त किया जाता है। उदाहरण के लिए, 5 नाइन सिस्टम सांख्यिकीय रूप से 99.999% उपलब्धता प्रदान करेगा।

दोष-सहिष्णु प्रणालियाँ आमतौर पर अतिरेक की अवधारणा पर आधारित होती हैं।

दोष सहिष्णुता तकनीक

महत्वपूर्ण प्रणालियों के लिए आवश्यक सहिष्णुता के प्रकार में अनुसंधान में बड़ी मात्रा में अंतःविषय कार्य शामिल है। सिस्टम जितना जटिल होगा, उतनी ही सावधानी से सभी संभावित इंटरैक्शन पर विचार करना होगा और इसके लिए तैयार रहना होगा। परिवहन, सार्वजनिक उपयोगिताओं और सेना में उच्च-मूल्य प्रणालियों के महत्व को ध्यान में रखते हुए, अनुसंधान पर स्पर्श करने वाले विषयों का क्षेत्र बहुत व्यापक है: इसमें सॉफ्टवेयर मॉडलिंग और विश्वसनीयता, या हार्डवेयर डिजाइन जैसे रहस्यमय तत्वों जैसे स्पष्ट विषयों को शामिल किया जा सकता है। स्टोकेस्टिक मॉडल, ग्राफ सिद्धांत, औपचारिक या बहिष्करण तर्क, समानांतर कंप्यूटिंग, दूरस्थ डेटा संचरण, और बहुत कुछ।[20]


प्रतिकृति

अतिरिक्त घटक तीन तरीकों से दोष सहिष्णुता की पहली मूलभूत विशेषता को संबोधित करते हैं:

  • प्रतिकृति (कंप्यूटर विज्ञान): एक ही सिस्टम या सबसिस्टम के कई समान उदाहरण प्रदान करना, समानांतर कंप्यूटिंग में उन सभी को कार्य या अनुरोध निर्देशित करना और एक कोरम के आधार पर सही परिणाम चुनना;
  • अतिरेक (इंजीनियरिंग): एक ही प्रणाली के कई समान उदाहरण प्रदान करना और विफलता (विफलता) के मामले में शेष उदाहरणों में से एक पर स्विच करना;
  • विविधता: एक ही विनिर्देश के कई अलग-अलग कार्यान्वयन प्रदान करना, और एक विशिष्ट कार्यान्वयन में त्रुटियों से निपटने के लिए प्रतिकृति प्रणालियों की तरह उनका उपयोग करना।

RAID 0 को छोड़कर RAID, RAID के सभी कार्यान्वयन, दोष-सहिष्णु डेटा संग्रहण डिवाइस के उदाहरण हैं जो डेटा अतिरेक का उपयोग करता है।

एक लॉकस्टेप (कंप्यूटिंग) दोष-सहिष्णु मशीन समानांतर में काम करने वाले प्रतिकृति तत्वों का उपयोग करती है। किसी भी समय, प्रत्येक तत्व की सभी प्रतिकृति एक ही अवस्था में होनी चाहिए। प्रत्येक प्रतिकृति (कंप्यूटिंग) के लिए समान इनपुट प्रदान किए जाते हैं, और समान आउटपुट की अपेक्षा की जाती है। प्रतिकृति के आउटपुट की तुलना वोटिंग सर्किट का उपयोग करके की जाती है। प्रत्येक तत्व की दो प्रतिकृति वाली मशीन को दोहरी दोहरी मॉड्यूलर अतिरेकडीएमआर) कहा जाता है। मतदान सर्किट तब केवल एक बेमेल का पता लगा सकता है और पुनर्प्राप्ति अन्य तरीकों पर निर्भर करती है। प्रत्येक तत्व की तीन प्रतिकृति वाली मशीन को ट्रिपल मॉड्यूलर रिडंडेंसी (टीएमआर) कहा जाता है। वोटिंग सर्किट यह निर्धारित कर सकता है कि दो-से-एक वोट देखे जाने पर कौन सी प्रतिकृति त्रुटि में है। इस मामले में, मतदान सर्किट सही परिणाम का उत्पादन कर सकता है और गलत संस्करण को त्याग सकता है। इसके बाद, गलत प्रतिकृति की आंतरिक स्थिति को अन्य दो से भिन्न माना जाता है, और मतदान सर्किट डीएमआर मोड में स्विच कर सकता है। यह मॉडल किसी भी बड़ी संख्या में प्रतिकृति पर लागू किया जा सकता है।

लॉकस्टेप (कंप्यूटिंग) दोष-सहिष्णु मशीनें सबसे आसानी से पूरी तरह से सिंक्रोनाइज़ेशन (कंप्यूटर साइंस) बनाई जाती हैं, प्रत्येक प्रतिकृति के प्रत्येक गेट के साथ घड़ी के एक ही किनारे पर समान स्थिति संक्रमण होता है, और प्रतिकृति की घड़ियाँ बिल्कुल चरण में होती हैं। हालांकि, इस आवश्यकता के बिना लॉकस्टेप सिस्टम बनाना संभव है।

प्रतिकृति को समकालिकता में लाने के लिए उनके आंतरिक संग्रहीत राज्यों को समान बनाने की आवश्यकता होती है। उन्हें एक निश्चित प्रारंभिक स्थिति से शुरू किया जा सकता है, जैसे कि रीसेट स्थिति। वैकल्पिक रूप से, एक प्रतिकृति की आंतरिक स्थिति को दूसरी प्रतिकृति में कॉपी किया जा सकता है।

DMR का एक संस्करण 'पेयर-एंड-स्पेयर' है। दो प्रतिकृति तत्व एक जोड़ी के रूप में लॉकस्टेप में काम करते हैं, एक वोटिंग सर्किट के साथ जो उनके संचालन के बीच किसी भी बेमेल का पता लगाता है और एक संकेत देता है कि कोई त्रुटि है। एक और जोड़ी ठीक उसी तरह काम करती है। एक अंतिम सर्किट उस जोड़ी के आउटपुट का चयन करता है जो यह घोषणा नहीं करता है कि यह त्रुटि में है। जोड़ी और अतिरिक्त के लिए टीएमआर के तीन के बजाय चार प्रतिकृतियों की आवश्यकता होती है, लेकिन व्यावसायिक रूप से इसका इस्तेमाल किया गया है।

विफलता-बेखबर कंप्यूटिंग

विफलता-अनभिज्ञ कंप्यूटिंग एक ऐसी तकनीक है जो डेटा हानि के बावजूद कंप्यूटर प्रोग्राम को क्रियान्वित करने में सक्षम बनाती है।[21] तकनीक को विभिन्न संदर्भों में लागू किया जा सकता है। यह प्रोग्राम में निर्मित मान लौटाकर अमान्य मेमोरी रीड को संभाल सकता है,[22] जो बदले में, निर्मित मूल्य का उपयोग करता है और उस पूर्व स्मृति मान को अनदेखा करता है जिसे उसने एक्सेस करने का प्रयास किया था, यह RAM समता के विपरीत है, जो प्रोग्राम को त्रुटि के बारे में सूचित करता है या प्रोग्राम को रद्द कर देता है।

दृष्टिकोण में प्रदर्शन लागत होती है: क्योंकि तकनीक पता वैधता के लिए गतिशील जांच डालने के लिए कोड को फिर से लिखती है, निष्पादन समय 80% से 500% तक बढ़ जाएगा।[23]


रिकवरी शेफर्डिंग

रिकवरी शेफर्डिंग एक हल्की तकनीक है जो सॉफ़्टवेयर प्रोग्रामों को अन्यथा घातक त्रुटियों जैसे नल पॉइंटर डिरेफरेंस और शून्य से विभाजित करने से पुनर्प्राप्त करने में सक्षम बनाती है।[24] असफल बेखबर कंप्यूटिंग तकनीक की तुलना में, रिकवरी शेफर्डिंग सीधे संकलित प्रोग्राम बाइनरी पर काम करता है और प्रोग्राम को पुनः कंपाइल करने की आवश्यकता नहीं होती है।

यह समय-समय पर संकलन | जस्ट-इन-टाइम इंस्ट्रूमेंटेशन (कंप्यूटर प्रोग्रामिंग) फ्रेमवर्क पिन (कंप्यूटर प्रोग्राम) का उपयोग करता है। त्रुटि होने पर यह आवेदन प्रक्रिया से जुड़ जाता है, निष्पादन की मरम्मत करता है, निष्पादन जारी रहने पर मरम्मत प्रभावों को ट्रैक करता है, आवेदन प्रक्रिया के भीतर मरम्मत प्रभाव शामिल करता है, और प्रक्रिया की स्थिति से सभी मरम्मत प्रभावों को हटा दिए जाने के बाद प्रक्रिया से अलग हो जाता है। यह कार्यक्रम के सामान्य निष्पादन में हस्तक्षेप नहीं करता है और इसलिए नगण्य उपरिव्यय करता है।[24]18 में से 17 के लिए व्यवस्थित रूप से एकत्रित वास्तविक दुनिया अशक्त-विभेदन और विभाजित-दर-शून्य त्रुटियां, एक प्रोटोटाइप कार्यान्वयन एप्लिकेशन को त्रुटि-ट्रिगरिंग इनपुट पर अपने उपयोगकर्ताओं को स्वीकार्य आउटपुट और सेवा प्रदान करने के लिए निष्पादित करना जारी रखने में सक्षम बनाता है।[24]


सर्किट ब्रेकर

सर्किट ब्रेकर डिजाइन पैटर्न वितरित सिस्टम में विपत्तिपूर्ण विफलताओं से बचने की एक तकनीक है।

अतिरेक

रिडंडेंसी कार्यात्मक क्षमताओं का प्रावधान है जो दोष मुक्त वातावरण में अनावश्यक होगा।[25] इसमें बैकअप घटक शामिल हो सकते हैं जो एक घटक विफल होने पर स्वचालित रूप से चालू हो जाते हैं। उदाहरण के लिए, बड़े मालवाहक ट्रक बिना किसी बड़े परिणाम के टायर खो सकते हैं। उनके पास कई टायर हैं, और कोई भी टायर महत्वपूर्ण नहीं है (सामने के टायरों के अपवाद के साथ, जो चलाने के लिए उपयोग किए जाते हैं, लेकिन आम तौर पर कम भार उठाते हैं, प्रत्येक और कुल मिलाकर, अन्य चार से 16 की तुलना में, इसलिए असफल होने की संभावना कम होती है ). सिस्टम की विश्वसनीयता में सुधार के लिए अतिरेक को शामिल करने का विचार 1950 के दशक में जॉन वॉन न्यूमैन द्वारा पेश किया गया था।[26] अतिरेक के दो प्रकार संभव हैं:[27] अंतरिक्ष अतिरेक और समय अतिरेक। अंतरिक्ष अतिरेक अतिरिक्त घटक, कार्य या डेटा आइटम प्रदान करता है जो दोष मुक्त संचालन के लिए अनावश्यक हैं। सिस्टम में जोड़े गए अनावश्यक संसाधनों के प्रकार के आधार पर अंतरिक्ष अतिरेक को आगे हार्डवेयर, सॉफ्टवेयर और सूचना अतिरेक में वर्गीकृत किया गया है। समय अतिरेक में संगणना या डेटा संचरण दोहराया जाता है और परिणाम की तुलना पिछले परिणाम की संग्रहीत प्रति से की जाती है। इस तरह के परीक्षण के लिए वर्तमान शब्दावली को 'इन सर्विस फॉल्ट टॉलरेंस टेस्टिंग या संक्षेप में ISFTT' के रूप में संदर्भित किया जाता है।

नुकसान

दोष-सहिष्णु डिज़ाइन के लाभ स्पष्ट हैं, जबकि इसके कई नुकसान नहीं हैं:

  • एक ही घटक में दोष का पता लगाने के साथ हस्तक्षेप। उपरोक्त यात्री वाहन उदाहरण को जारी रखने के लिए, दोष-सहिष्णु प्रणालियों में से किसी एक के साथ टायर पंचर होने पर ड्राइवर को यह स्पष्ट नहीं हो सकता है। यह आमतौर पर एक अलग स्वचालित दोष-पहचान प्रणाली के साथ नियंत्रित किया जाता है। टायर के मामले में, एयर प्रेशर मॉनिटर दबाव के नुकसान का पता लगाता है और चालक को सूचित करता है। इसका विकल्प एक मैनुअल फॉल्ट-डिटेक्शन सिस्टम है, जैसे कि प्रत्येक स्टॉप पर मैन्युअल रूप से सभी टायरों का निरीक्षण करना।
  • किसी अन्य घटक में गलती का पता लगाने में हस्तक्षेप। इस समस्या की एक और विविधता है जब एक घटक में दोष सहनशीलता एक अलग घटक में दोष का पता लगाने से रोकता है। उदाहरण के लिए, यदि घटक बी घटक ए से आउटपुट के आधार पर कुछ ऑपरेशन करता है, तो बी में गलती सहनशीलता ए के साथ समस्या को छुपा सकती है। यदि घटक बी को बाद में बदल दिया जाता है (कम गलती-सहिष्णु डिजाइन में) सिस्टम अचानक विफल हो सकता है ऐसा प्रतीत होता है कि नया घटक B समस्या है। सिस्टम की सावधानीपूर्वक जांच के बाद ही यह स्पष्ट हो पाएगा कि मूल समस्या वास्तव में घटक ए के साथ है।
  • दोष सुधार की प्राथमिकता में कमी। भले ही ऑपरेटर को गलती के बारे में पता हो, गलती-सहिष्णु प्रणाली होने से गलती की मरम्मत के महत्व को कम करने की संभावना है। यदि दोषों को ठीक नहीं किया जाता है, तो यह अंततः सिस्टम की विफलता का कारण बनेगा, जब दोष-सहिष्णु घटक पूरी तरह से विफल हो जाते हैं या जब सभी अनावश्यक घटक भी विफल हो जाते हैं।
  • परीक्षण कठिनाई। कुछ महत्वपूर्ण दोष-सहिष्णु प्रणालियों के लिए, जैसे परमाणु रिएक्टर, यह सत्यापित करने का कोई आसान तरीका नहीं है कि बैकअप घटक कार्य कर रहे हैं। इसका सबसे कुख्यात उदाहरण चेरनोबिल आपदा है, जहां ऑपरेटरों ने प्राथमिक और द्वितीयक कूलिंग को अक्षम करके आपातकालीन बैकअप कूलिंग का परीक्षण किया। बैकअप विफल हो गया, जिसके परिणामस्वरूप एक कोर मेल्टडाउन और बड़े पैमाने पर विकिरण जारी हुआ।
  • लागत। दोनों दोष-सहिष्णु घटक और अनावश्यक घटक लागत में वृद्धि करते हैं। यह विशुद्ध रूप से आर्थिक लागत हो सकती है या इसमें वजन जैसे अन्य उपाय शामिल हो सकते हैं। मानव अंतरिक्ष उड़ान, उदाहरण के लिए, इतने सारे निरर्थक और दोष-सहिष्णु घटक हैं कि मानव रहित प्रणालियों पर उनका वजन नाटकीय रूप से बढ़ जाता है, जिसके लिए समान स्तर की सुरक्षा की आवश्यकता नहीं होती है।
  • अवर घटक। एक दोष-सहिष्णु डिज़ाइन घटिया घटकों के उपयोग की अनुमति दे सकता है, जो अन्यथा सिस्टम को निष्क्रिय बना देता। जबकि इस अभ्यास में लागत वृद्धि को कम करने की क्षमता है, कई अवर घटकों का उपयोग सिस्टम की विश्वसनीयता को एक समान स्तर तक कम कर सकता है, या एक तुलनीय गैर-दोष-सहिष्णु प्रणाली से भी बदतर हो सकता है।

संबंधित शर्तें

त्रुटि सहिष्णुता और उन प्रणालियों के बीच अंतर है जिनमें शायद ही कभी समस्या होती है। उदाहरण के लिए, पश्चिमी इलेक्ट्रिक क्रॉसबार स्विच सिस्टम में प्रति चालीस वर्षों में दो घंटे की विफलता दर थी, और इसलिए अत्यधिक दोष प्रतिरोधी थे। लेकिन जब कोई खराबी आती है तब भी वे पूरी तरह से काम करना बंद कर देते हैं, और इसलिए दोष सहिष्णु नहीं थे।

यह भी देखें

संदर्भ

  1. Adaptive Fault Tolerance and Graceful Degradation, Oscar González et al., 1997, University of Massachusetts - Amherst
  2. Johnson, B. W. (1984). "Fault-Tolerant Microprocessor-Based Systems", IEEE Micro, vol. 4, no. 6, pp. 6–21
  3. 3.0 3.1 3.2 Daniel P. Siewiorek; C. Gordon Bell; Allen Newell (1982). Computer Structures: Principles and Examples. McGraw-Hill. ISBN 0-07-057302-6.
  4. Algirdas Avižienis; George C. Gilley; Francis P. Mathur; David A. Rennels; John A. Rohr; David K. Rubin. "The STAR (Self-Testing And Repairing) Computer: An Investigation Of the Theory and Practice Of Fault-tolerant Computer Design" (PDF).
  5. "वायेजर मिशन राज्य (अक्सर कम से कम तीन महीने पुराने)". NASA. Retrieved 2022-04-01.
  6. Randell, Brian; Lee, P.A.; Treleaven, P. C. (June 1978). "कम्प्यूटिंग सिस्टम डिजाइन में विश्वसनीयता के मुद्दे". ACM Computing Surveys. 10 (2): 123–165. doi:10.1145/356725.356729. ISSN 0360-0300. S2CID 16909447.
  7. P. J. Denning (December 1976). "दोष सहिष्णु ऑपरेटिंग सिस्टम". ACM Computing Surveys. 8 (4): 359–389. doi:10.1145/356678.356680. ISSN 0360-0300. S2CID 207736773.
  8. Theodore A. Linden (December 1976). "सुरक्षा और विश्वसनीय सॉफ़्टवेयर का समर्थन करने के लिए ऑपरेटिंग सिस्टम संरचनाएँ". ACM Computing Surveys. 8 (4): 409–445. doi:10.1145/356678.356682. hdl:2027/mdp.39015086560037. ISSN 0360-0300. S2CID 16720589.
  9. Ray Holt. "The F14A Central Air Data Computer, and the LSI Technology State-of-the-Art in 1968".
  10. Fault tolerant computing in computer design Neilforoshan, M.R Journal of Computing Sciences in Colleges archive Volume 18, Issue 4 (April 2003) Pages: 213 – 220, ISSN 1937-4771
  11. "History of TANDEM COMPUTERS, INC. – FundingUniverse". www.fundinguniverse.com. Retrieved 2023-03-01.
  12. "आपकी वेबसाइट को जावास्क्रिप्ट के बिना क्यों काम करना चाहिए।". DEV Community. Retrieved 2021-05-16.
  13. Fairfax, Zackerie (2020-11-28). "Legacy Twitter Shutdown Means You Can't Tweet From The 3DS Anymore". ScreenRant. Retrieved 2021-07-01.{{cite web}}: CS1 maint: url-status (link)
  14. Hudak, J.J.; Suh, B.-H.; Siewiorek, D.P.; Segall, Z. (1993). "त्रुटि-सहिष्णु सॉफ़्टवेयर तकनीकों का मूल्यांकन और तुलना". IEEE Transactions on Reliability. 42 (2): 190–204. doi:10.1109/24.229487. ISSN 1558-1721.
  15. Stallings, W (2009): Operating Systems. Internals and Design Principles, sixth edition
  16. Thampi, Sabu M. (2009-11-23). "वितरित प्रणालियों का परिचय". arXiv:0911.4395 [cs.DC].
  17. "नियंत्रण". Grouper.ieee.org. Archived from the original on 1999-10-08. Retrieved 2016-04-06.
  18. Baha Al-Shaikh, Simon G. Stacey, Essentials of Equipment in Anaesthesia, Critical Care, and Peri-Operative Medicine (2017), p. 247.
  19. Dubrova, E. (2013). "Fault-Tolerant Design", Springer, 2013, ISBN 978-1-4614-2112-2
  20. कुछ दोष-सहिष्णु कंप्यूटर आर्किटेक्चर का विश्वसनीयता मूल्यांकन. Springer-Verlag. November 1980. ISBN 978-3-540-10274-8.
  21. Herzberg, Amir; Shulman, Haya (2012). "ओब्लिवियस एंड फेयर सर्वर-एडेड टू-पार्टी कंप्यूटेशन". 2012 Seventh International Conference on Availability, Reliability and Security. IEEE: 75–84. doi:10.1109/ares.2012.28. ISBN 978-1-4673-2244-7. S2CID 6579295.
  22. Rigger, Manuel; Pekarek, Daniel; Mössenböck, Hanspeter (2018), "Context-Aware Failure-Oblivious Computing as a Means of Preventing Buffer Overflows", Network and System Security, Cham: Springer International Publishing, pp. 376–390, arXiv:1806.09026, doi:10.1007/978-3-030-02744-5_28, ISBN 978-3-030-02743-8, retrieved 2020-10-07
  23. Keromytis, Angelos D. (2007), "Characterizing Software Self-Healing Systems", in Gorodetski, Vladimir I.; Kotenko, Igor; Skormin, Victor A. (eds.), Characterizing Software Self-Healing Systems, Computer network security: Fourth International Conference on Mathematical Methods, Models, and Architectures for Computer Network Security, Springer, ISBN 978-3-540-73985-2
  24. 24.0 24.1 24.2 Long, Fan; Sidiroglou-Douskos, Stelios; Rinard, Martin (2014). "Automatic Runtime Error Repair and Containment via Recovery Shepherding". Proceedings of the 35th ACM SIGPLAN Conference on Programming Language Design and Implementation. PLDI '14'. New York, NY, USA: ACM. pp. 227–238. doi:10.1145/2594291.2594337. ISBN 978-1-4503-2784-8. S2CID 6252501.
  25. Laprie, J. C. (1985). "Dependable Computing and Fault Tolerance: Concepts and Terminology", Proceedings of 15th International Symposium on Fault-Tolerant Computing (FTSC-15), pp. 2–11
  26. von Neumann, J. (1956). "Probabilistic Logics and Synthesis of Reliable Organisms from Unreliable Components", in Automata Studies, eds. C. Shannon and J. McCarthy, Princeton University Press, pp. 43–98
  27. Avizienis, A. (1976). "Fault-Tolerant Systems", IEEE Transactions on Computers, vol. 25, no. 12, pp. 1304–1312