Difference between revisions of "यूनिसिटी दूरी"

From alpha
Jump to navigation Jump to search
Line 11: Line 11:


==कुंजी आकार और संभावित सादेपाठ के साथ संबंध==
==कुंजी आकार और संभावित सादेपाठ के साथ संबंध==
सामान्य तौर पर, कुंजी के आकार और संभावित संदेशों की संख्या के बारे में विशेष धारणाओं को देखते हुए, एक औसत कूटलिखित आँकड़े लंबाई होती है जहां केवल एक कुंजी होती है (औसतन) जो एक पढ़ने योग्य संदेश उत्पन्न करेगी। उपरोक्त उदाप्रत्येक ण में हम केवल [[ अपरकेस ]] अंग्रेजी वर्ण देखते हैं, इसलिए यदि हम मान लें कि [[सादे पाठ]] का यह रूप है, तो स्ट्रिंग में प्रत्येक स्थिति के लिए 26 संभावित अक्षर हैं। इसी प्रकार यदि हम पाँच-वर्ण वाली अपर केस कुंजियाँ मान लें, तो K=26 हैं<sup>5</sup>संभावित कुंजियाँ, जिनमें से अधिकांश काम नहीं करेंगी।
सामान्यतः, कुंजी के आकार और संभावित संदेशों की संख्या के बारे में विशेष धारणाओं को देखते हुए, एक औसत सिफरटेक्स्ट लंबाई होती है जहां केवल एक कुंजी होती है (औसतन) जो एक पढ़ने योग्य संदेश उत्पन्न करती है। उपरोक्त उदाहरण में हम केवल [[ अपरकेस |अपरकेस]] अंग्रेजी वर्ण देखते हैं, इसलिए यदि हम मान लें कि [[सादे पाठ|प्लेनटेक्स्ट]] का यह रूप है, तो स्ट्रिंग में प्रत्येक स्थिति के लिए 26 संभावित अक्षर होते हैं। इसी तरह यदि हम पाँच-वर्ण वाली अपर केस कुंजियाँ मान लें, तो K=26<sup>5</sup> संभावित कुंजियाँ हैं, जिनमें से अधिकांश "काम" नहीं करती है।


संभावित संदेशों की एक जबरदस्त संख्या, एन, वर्णों के इस सीमित सेट का उपयोग करके भी उत्पन्न की जा सकती है: एन = 26<sup>L</sup>, जहां L संदेश की लंबाई है। हालाँकि, भाषा के नियमों के कारण उनमें से केवल एक छोटा सेट ही पठनीय है, शायद उनमें से एम, जहां एम एन की तुलना में बहुत छोटा होने की संभावना है। इसके अलावा, एम का संख्या के साथ एक-से-एक संबंध है काम करने वाली कुंजियों की संख्या, इसलिए K संभावित कुंजियाँ दी गई हैं, उनमें से केवल K × (M/N) ही काम करेगी। इनमें से एक सही कुंजी है, बाकी सब नकली हैं।
वर्णों के इस सीमित सेट का उपयोग करके भी भारी संख्या में संभावित संदेश, N, उत्पन्न किए जा सकते हैं: N = 26<sup>L</sup>, जहां L संदेश की लंबाई होती है। चूँकि, भाषा के नियमों के कारण उनमें से केवल एक छोटा सेट ही पठनीय होता है, संभवतः उनमें से M, जहां एम एन की तुलना में बहुत छोटा होने की संभावना है। इसके अलावा, एम का संख्या के साथ एक-से-एक संबंध है काम करने वाली कुंजियों की संख्या, इसलिए K संभावित कुंजियाँ दी गई हैं, उनमें से केवल K × (M/N) ही काम करेगी। इनमें से एक सही कुंजी है, बाकी सब नकली हैं।


चूंकि संदेश की लंबाई एल बढ़ने पर एम/एन मनमाने ढंग से छोटा हो जाता है, अंततः कुछ एल होता है जो इतना बड़ा होता है कि नकली कुंजियों की संख्या शून्य के बराबर हो जाती है। मोटे तौर पर कहें तो, यह वह L है जो KM/N=1 बनाता है। यह एल एकसिटी दूरी है।
चूंकि संदेश की लंबाई एल बढ़ने पर एम/एन मनमाने ढंग से छोटा हो जाता है, अंततः कुछ एल होता है जो इतना बड़ा होता है कि नकली कुंजियों की संख्या शून्य के बराबर हो जाती है। मोटे तौर पर कहें तो, यह वह L है जो KM/N=1 बनाता है। यह एल एकसिटी दूरी है।
Line 27: Line 27:
अब 32 अक्षरों की वर्णमाला में प्रति अक्षर 5 बिट जानकारी हो सकती है (जैसे 32 = 2)।<sup>5</sup>). सामान्यतः प्रति वर्ण सूचना के बिट्स की संख्या होती है  {{math|log<sub>2</sub>(N)}}, जहां N वर्णमाला में वर्णों की संख्या है और {{math|log<sub>2</sub>}} बाइनरी लघुगणक है. इसलिए अंग्रेजी के लिए प्रत्येक अक्षर संप्रेषित कर सकता है {{math|log<sub>2</sub>(26) {{=}} 4.7}} जानकारी के अंश।
अब 32 अक्षरों की वर्णमाला में प्रति अक्षर 5 बिट जानकारी हो सकती है (जैसे 32 = 2)।<sup>5</sup>). सामान्यतः प्रति वर्ण सूचना के बिट्स की संख्या होती है  {{math|log<sub>2</sub>(N)}}, जहां N वर्णमाला में वर्णों की संख्या है और {{math|log<sub>2</sub>}} बाइनरी लघुगणक है. इसलिए अंग्रेजी के लिए प्रत्येक अक्षर संप्रेषित कर सकता है {{math|log<sub>2</sub>(26) {{=}} 4.7}} जानकारी के अंश।


हालाँकि, सार्थक अंग्रेजी पाठ में प्रति वर्ण वास्तविक जानकारी की औसत मात्रा केवल 1.5 बिट प्रति वर्ण है। तो सादा पाठ अतिरेक D = 4.7 − 1.5 = 3.2 है।<ref name=hac />
चूँकि  , सार्थक अंग्रेजी पाठ में प्रति वर्ण वास्तविक जानकारी की औसत मात्रा केवल 1.5 बिट प्रति वर्ण है। तो सादा पाठ अतिरेक D = 4.7 − 1.5 = 3.2 है।<ref name=hac />


मूलतः एकसिटी की दूरी जितनी बड़ी होगी उतना बेहतर होगा। असीमित आकार के वन टाइम पैड के लिए, मुख्य स्थान की असीमित एन्ट्रॉपी को देखते हुए, हमारे पास है <math>U = \infty</math>, जो वन-टाइम पैड के अटूट होने के अनुरूप है।
मूलतः एकसिटी की दूरी जितनी बड़ी होगी उतना बेहतर होगा। असीमित आकार के वन टाइम पैड के लिए, मुख्य स्थान की असीमित एन्ट्रॉपी को देखते हुए, हमारे पास है <math>U = \infty</math>, जो वन-टाइम पैड के अटूट होने के अनुरूप है।

Revision as of 23:23, 10 August 2023

क्रिप्टोग्राफी में, यूनिसिटी दूरी एक मूल कूटलिखित आँकड़े की लंबाई होती है जो एक प्रवृति के आवेग में संभावित अवांछित कुंजियों की संख्या को शून्य तक कम करके कूटलेख को विभाजित करने की आवश्यकता होती है। अर्थात, प्रत्येक संभव कुंजी को प्रयास करने के बाद, केवल एक डिक्रिप्शन होना चाहिए जो समझ में आता है, अर्थात कुंजी को पूरी तरह से निर्धारित करने के लिए आवश्यक कूटलिखित आँकड़े की अपेक्षित मात्रा मे, यह धृष्ट रूप से अंतर्निहित संदेश में अतिरेक होता है।[1]

क्लाउड शैनन ने अपने 1949 के पेपर "कम्युनिकेशन थ्योरी ऑफ सीक्रेसी सिस्टम्स" में यूनिसिटी दूरी को परिभाषित किया था।

पांच अक्षर वाली कुंजी के साथ विगेनियर सिफर का उपयोग करके एन्क्रिप्टेड कूटलिखित आँकड़े स्ट्रिंग WNAIW हमले पर विचार करें। संभवतः, इस स्ट्रिंग को किसी अन्य स्ट्रिंग में समझा जा सकता है - नदी और पानी दोनों कुछ कुंजियों के लिए संभावनाएं होती हैं। यह क्रिप्टोएनालिसिस का एक सामान्य नियम है: जो बिना किसी अतिरिक्त जानकारी के इस संदेश को डिकोड करना असंभव होता है।

निःसंदेह, इस स्थिति में भी, अंग्रेजी शब्दों में केवल पांच अक्षर वाली कुंजियों की एक निश्चित संख्या ही परिणामित होती है। सभी संभावित कुंजियाँ प्रयास से हमें न केवल नदी और पानी मिलेगा, जबकि SXOOS और KHDOP भी मिलेंगे। "कार्यशील" कुंजियों की संख्या संभवतः सभी संभावित कुंजियों के सेट से बहुत कम होती है। समस्या यह जानने की है कि इनमें से कौन सी "कार्यशील" कुंजी सही है; बाकी सब नकली होते हैं।

कुंजी आकार और संभावित सादेपाठ के साथ संबंध

सामान्यतः, कुंजी के आकार और संभावित संदेशों की संख्या के बारे में विशेष धारणाओं को देखते हुए, एक औसत सिफरटेक्स्ट लंबाई होती है जहां केवल एक कुंजी होती है (औसतन) जो एक पढ़ने योग्य संदेश उत्पन्न करती है। उपरोक्त उदाहरण में हम केवल अपरकेस अंग्रेजी वर्ण देखते हैं, इसलिए यदि हम मान लें कि प्लेनटेक्स्ट का यह रूप है, तो स्ट्रिंग में प्रत्येक स्थिति के लिए 26 संभावित अक्षर होते हैं। इसी तरह यदि हम पाँच-वर्ण वाली अपर केस कुंजियाँ मान लें, तो K=265 संभावित कुंजियाँ हैं, जिनमें से अधिकांश "काम" नहीं करती है।

वर्णों के इस सीमित सेट का उपयोग करके भी भारी संख्या में संभावित संदेश, N, उत्पन्न किए जा सकते हैं: N = 26L, जहां L संदेश की लंबाई होती है। चूँकि, भाषा के नियमों के कारण उनमें से केवल एक छोटा सेट ही पठनीय होता है, संभवतः उनमें से M, जहां एम एन की तुलना में बहुत छोटा होने की संभावना है। इसके अलावा, एम का संख्या के साथ एक-से-एक संबंध है काम करने वाली कुंजियों की संख्या, इसलिए K संभावित कुंजियाँ दी गई हैं, उनमें से केवल K × (M/N) ही काम करेगी। इनमें से एक सही कुंजी है, बाकी सब नकली हैं।

चूंकि संदेश की लंबाई एल बढ़ने पर एम/एन मनमाने ढंग से छोटा हो जाता है, अंततः कुछ एल होता है जो इतना बड़ा होता है कि नकली कुंजियों की संख्या शून्य के बराबर हो जाती है। मोटे तौर पर कहें तो, यह वह L है जो KM/N=1 बनाता है। यह एल एकसिटी दूरी है।

कुंजी एन्ट्रापी और प्लेनटेक्स्ट अतिरेक के साथ संबंध

यूनिसिटी दूरी को समान रूप से अद्वितीय एन्क्रिप्शन कुंजी को पुनर्प्राप्त करने के लिए कम्प्यूटेशनल रूप से असीमित प्रतिद्वंद्वी को अनुमति देने के लिए आवश्यक कूटलिखित आँकड़े की न्यूनतम मात्रा के रूप में परिभाषित किया जा सकता है।[1]

तब अपेक्षित एकत्व दूरी को इस प्रकार दिखाया जा सकता है:[1]

जहां यू एकसिटी दूरी है, एच(के) मुख्य स्थान की एन्ट्रापी है (उदाप्रत्येक ण के लिए 2 के लिए 128)128 समसंभाव्य कुंजियाँ, बल्कि कम यदि कुंजी एक याद किया गया पास-वाक्यांश है)। डी को प्रति वर्ण बिट्स में प्लेनटेक्स्ट रिडंडेंसी के रूप में परिभाषित किया गया है।

अब 32 अक्षरों की वर्णमाला में प्रति अक्षर 5 बिट जानकारी हो सकती है (जैसे 32 = 2)।5). सामान्यतः प्रति वर्ण सूचना के बिट्स की संख्या होती है log2(N), जहां N वर्णमाला में वर्णों की संख्या है और log2 बाइनरी लघुगणक है. इसलिए अंग्रेजी के लिए प्रत्येक अक्षर संप्रेषित कर सकता है log2(26) = 4.7 जानकारी के अंश।

चूँकि , सार्थक अंग्रेजी पाठ में प्रति वर्ण वास्तविक जानकारी की औसत मात्रा केवल 1.5 बिट प्रति वर्ण है। तो सादा पाठ अतिरेक D = 4.7 − 1.5 = 3.2 है।[1]

मूलतः एकसिटी की दूरी जितनी बड़ी होगी उतना बेहतर होगा। असीमित आकार के वन टाइम पैड के लिए, मुख्य स्थान की असीमित एन्ट्रॉपी को देखते हुए, हमारे पास है , जो वन-टाइम पैड के अटूट होने के अनुरूप है।

प्रतिस्थापन सिफर की एकसिटी दूरी

एक साधारण प्रतिस्थापन सिफर के लिए, संभावित कुंजियों की संख्या है 26! = 4.0329 × 1026 = 288.4, उन तरीकों की संख्या जिनसे वर्णमाला को क्रमबद्ध किया जा सकता है। यह मानते हुए कि सभी कुंजियाँ समान रूप से संभावित हैं, H(k) = log2(26!) = 88.4 बिट्स. अंग्रेजी पाठ के लिए D = 3.2, इस प्रकार U = 88.4/3.2 = 28.

इसलिए कूटलिखित आँकड़े के 28 अक्षरों को देखते हुए एक अंग्रेजी प्लेनटेक्स्ट और इसलिए कुंजी पर काम करना सैद्धांतिक रूप से संभव होना चाहिए।

व्यावहारिक अनुप्रयोग

यूनिसिटी दूरी एक उपयोगी सैद्धांतिक माप है, लेकिन वास्तविक दुनिया (सीमित) संसाधनों वाले किसी प्रतिद्वंद्वी द्वारा हमला किए जाने पर यह ब्लॉक सिफर की सुरक्षा के बारे में बहुत कुछ नहीं कहता है। तीन कूटलिखित आँकड़े ब्लॉकों की यूनिसिटी दूरी वाले एक ब्लॉक सिफर पर विचार करें। यद्यपि सही कुंजी (सरल विस्तृत खोज) खोजने के लिए कम्प्यूटेशनल रूप से असीमित प्रतिद्वंद्वी के लिए स्पष्ट रूप से पर्याप्त जानकारी है, यह व्यवहार में कम्प्यूटेशनल रूप से असंभव हो सकता है।

प्लेनटेक्स्ट अतिरेक को कम करके यूनिसिटी दूरी को बढ़ाया जा सकता है। ऐसा करने का एक तरीका एन्क्रिप्शन से पहले डेटा संपीड़न तकनीकों को तैनात करना है, उदाप्रत्येक ण के लिए पठनीयता बनाए रखते हुए अनावश्यक स्वरों को हटाकर। वैसे भी यह एक अच्छा विचार है, क्योंकि यह एन्क्रिप्ट किए जाने वाले डेटा की मात्रा को कम कर देता है।

यूनिसिटी दूरी से अधिक कूटलिखित आँकड़े को केवल एक सार्थक डिक्रिप्शन माना जा सकता है। यूनिसिटी दूरी से छोटे कूटलिखित आँकड़े में कई प्रशंसनीय डिक्रिप्शन हो सकते हैं। यूनिसिटी दूरी इस बात का माप नहीं है कि क्रिप्टोएनालिसिस के लिए कितना कूटलिखित आँकड़े आवश्यक है,[why?] लेकिन क्रिप्टोएनालिसिस के लिए केवल एक उचित समाधान होने के लिए कितने कूटलिखित आँकड़े की आवश्यकता है।

संदर्भ

  1. 1.0 1.1 1.2 1.3 Alfred J. Menezes, Paul C. van Oorschot, Scott A. Vanstone. "Chapter 7 - Block Ciphers" (PDF). एप्लाइड क्रिप्टोग्राफी की हैंडबुक. p. 246.{{cite book}}: CS1 maint: uses authors parameter (link)


बाप्रत्येक ी संबंध