वर्णमाला (औपचारिक भाषाएँ)

From alpha
Jump to navigation Jump to search

औपचारिक भाषा सिद्धांत में, वर्णमाला प्रतीक (प्रोग्रामिंग)/ग्लिफ़ का एक गैर-रिक्त सेट है, जिसे आमतौर पर अक्षरों, वर्णों या अंकों का प्रतिनिधित्व करने वाला माना जाता है।[1] लेकिन अन्य संभावनाओं के अलावा प्रतीक स्वनिम (ध्वनि इकाइयों) का एक सेट भी हो सकते हैं। सेट के इस तकनीकी अर्थ में वर्णमाला का उपयोग तर्क, गणित, कंप्यूटर विज्ञान और भाषा विज्ञान सहित विविध क्षेत्रों में किया जाता है। किसी वर्णमाला में कोई भी प्रमुखता (आकार) हो सकती है और इसके उद्देश्य के आधार पर यह परिमित सेट हो सकता है (उदाहरण के लिए, ए से ज़ेड तक अक्षरों की वर्णमाला), गणनीय (उदाहरण के लिए, ), या यहां तक ​​कि बेशुमार (उदाहरण के लिए, ).

स्ट्रिंग (कंप्यूटर विज्ञान), जिसे शब्दों के रूप में भी जाना जाता है, एक वर्णमाला पर वर्णमाला सेट से प्रतीकों के अनुक्रम के रूप में परिभाषित किया गया है।[2] उदाहरण के लिए, a से z तक के छोटे अक्षरों की वर्णमाला का उपयोग आइसबर्ग जैसे अंग्रेजी शब्द बनाने के लिए किया जा सकता है, जबकि बड़े और छोटे दोनों अक्षरों की वर्णमाला का उपयोग विकिपीडिया जैसे उचित नाम बनाने के लिए भी किया जा सकता है। एक सामान्य वर्णमाला {0,1} है, बाइनरी वर्णमाला, और 00101111 बाइनरी स्ट्रिंग का एक उदाहरण है। अनंत अनंत अनुक्रम#प्रतीकों के सैद्धांतिक कंप्यूटर विज्ञान में अनंत अनुक्रमों पर भी विचार किया जा सकता है (ओमेगा भाषा देखें)।

व्यावहारिक उद्देश्यों के लिए वर्णमाला में प्रतीकों को सीमित करना अक्सर आवश्यक होता है ताकि व्याख्या करते समय वे स्पष्ट हों। उदाहरण के लिए, यदि दो-सदस्यीय वर्णमाला {00,0} है, तो कागज पर 000 के रूप में लिखी गई एक स्ट्रिंग अस्पष्ट है क्योंकि यह स्पष्ट नहीं है कि यह तीन 0 प्रतीकों का अनुक्रम है, 00 के बाद 0 है, या 0 के बाद 0 है। 00 से.

नोटेशन

यदि L एक औपचारिक भाषा है, यानी परिमित लंबाई वाली स्ट्रिंग्स का एक (संभवतः अनंत) सेट, तो 'L की वर्णमाला' उन सभी प्रतीकों का सेट है जो L में किसी भी स्ट्रिंग में हो सकते हैं। उदाहरण के लिए, यदि L प्रोग्रामिंग भाषा C (प्रोग्रामिंग भाषा) में कंप्यूटर भाषाओं में सभी पहचानकर्ताओं का सेट है, तो L का वर्णमाला सेट { a, b, c, ..., x, y, z, A, B है। , सी, ..., एक्स, वाई, जेड, 0, 1, 2, ..., 7, 8, 9, _ }।

एक वर्णमाला दी गई , लंबाई के सभी तारों का सेट वर्णमाला के ऊपर द्वारा दर्शाया गया है . सेट सभी परिमित स्ट्रिंग्स (उनकी लंबाई की परवाह किए बिना) को क्लेन स्टार ऑपरेटर द्वारा दर्शाया गया है , और इसे क्लेन क्लोजर भी कहा जाता है . संकेतन वर्णमाला के सभी अनंत अनुक्रमों के समुच्चय को इंगित करता है , और सेट को इंगित करता है सभी परिमित या अनंत अनुक्रमों का।

उदाहरण के लिए, बाइनरी वर्णमाला {0,1} का उपयोग करते हुए, स्ट्रिंग्स ε, 0, 1, 00, 01, 10, 11, 000, आदि सभी वर्णमाला के क्लेन क्लोजर में हैं (जहां ε खाली स्ट्रिंग का प्रतिनिधित्व करता है) .

अनुप्रयोग

औपचारिक भाषाओं, ऑटोमेटा सिद्धांत और सेमीऑटोमेटन के उपयोग में अक्षर महत्वपूर्ण हैं। ज्यादातर मामलों में, ऑटोमेटा के उदाहरणों को परिभाषित करने के लिए, जैसे कि नियतात्मक परिमित ऑटोमेटन (डीएफए), एक वर्णमाला निर्दिष्ट करना आवश्यक है जिससे ऑटोमेटन के लिए इनपुट स्ट्रिंग बनाई जाती हैं। इन अनुप्रयोगों में, वर्णमाला को आमतौर पर एक सीमित सेट होना आवश्यक है, लेकिन अन्यथा प्रतिबंधित नहीं है।

स्ट्रिंग-प्रोसेसिंग कलन विधि के भाग के रूप में ऑटोमेटा, नियमित अभिव्यक्ति या औपचारिक व्याकरण का उपयोग करते समय, वर्णमाला को इन एल्गोरिदम द्वारा संसाधित किए जाने वाले पाठ का वर्ण सेट, या वर्ण सेट से स्वीकार्य वर्णों का एक उपसमूह माना जा सकता है।

यह भी देखें

संदर्भ

  1. Ebbinghaus, H.-D.; Flum, J.; Thomas, W. (1994). गणितीय तर्क (2nd ed.). New York: Springer. p. 11. ISBN 0-387-94258-0. By an alphabet we mean a nonempty set of symbols.
  2. Rautenberg, Wolfgang (2010). गणितीय तर्क का संक्षिप्त परिचय (PDF) (Third ed.). Springer. p. xx. ISBN 978-1-4419-1220-6. If 𝗔 is an alphabet, i.e., if the elements 𝐬 ∈ 𝗔 are symbols or at least named symbols, then the sequence (𝐬1,...,𝐬n)∈𝗔n is written as 𝐬1···𝐬n and called a string or a word over 𝗔.


साहित्य

  • जॉन ई. होपक्रॉफ्ट और जेफ़री डी. उलमैन, ऑटोमेटा थ्योरी, भाषाएँ और संगणना का परिचय, एडिसन-वेस्ले प्रकाशन, रीडिंग मैसाचुसेट्स, 1979। ISBN 0-201-02988-X.


श्रेणी:औपचारिक भाषाएँ श्रेणी:शब्दों पर संयोजकता