एमआईके (वर्ण सेट)

From alpha
Jump to navigation Jump to search

MIK (МИК) एक 8-बिट सिरिलिक लिपि कोड पेज है जिसका उपयोग DOS के साथ किया जाता है। यह बल्गेरियाई दिशा 16 में प्रयुक्त चरित्र सेट पर आधारित है[1]आईबीएम पीसी संगत प्रणाली। केर्मिट (प्रोटोकॉल) इस कैरेक्टर सेट को बुल्गारिया-पीसी / बुल्गारिया-पीसी कहता है।[2][3][4]बुल्गारिया में, इसे कभी-कभी गलत तरीके से कोड पेज 856 के रूप में संदर्भित किया जाता था (जो हिब्रू कोड पृष्ठ 856 लिए आईबीएम की परिभाषा से टकराता है)। इस कोड पृष्ठ को FreeDOS द्वारा कोड पृष्ठ 3021 के रूप में जाना जाता है।

यह कोड पृष्ठ 808|सीपी 808, कोड पृष्ठ 855|सीपी 855, कोड पृष्ठ 866|सीपी 866 या कोड पृष्ठ 872|सीपी 872 के बजाय बुल्गारिया में उपयोग किया जाने वाला सबसे व्यापक डॉस/मूल उपकरण निर्माता कोड पृष्ठ है।

बुल्गारिया में बनाया गया लगभग हर DOS प्रोग्राम, जिसमें बल्गेरियाई तार हैं, एन्कोडिंग के रूप में MIK का उपयोग कर रहा था, और ऐसे कई प्रोग्राम अभी भी उपयोग में हैं।

अक्षर सेट

प्रत्येक वर्ण को उसके समकक्ष यूनिकोड कोड बिंदु और उसके दशमलव कोड बिंदु के साथ दिखाया गया है। तालिका का केवल दूसरा भाग (कोड बिंदु 128-255) दिखाया गया है, पहला भाग (कोड बिंदु 0-127) ASCII के समान है।

MIK[5][6][4]
0 1 2 3 4 5 6 7 8 9 A B C D E F
8x А Б В Г Д Е Ж З И Й К Л М Н О П
9x Р С Т У Ф Х Ц Ч Ш Щ Ъ Ы Ь Э Ю Я
Ax а б в г д е ж з и й к л м н о п
Bx р с т у ф х ц ч ш щ ъ ы ь э ю я
Cx
Dx §
Ex α ß[nb 1] Γ π Σ[nb 2] σ µ[nb 3] τ Φ Θ Ω[nb 4] δ φ ε[nb 5]
Fx ± ÷ ° · ² NBSP


यूनिकोड में तालिकाओं की मैपिंग के कार्यान्वयनकर्ताओं के लिए नोट्स

यूनिकोड में तालिकाओं को मैप करने के कार्यान्वयनकर्ताओं को ध्यान देना चाहिए कि एमआईके कोड पृष्ठ कुछ वर्णों को एकीकृत करता है:

  1. 0xE1 is both the German sharp S (U+00DF, ß) and the Greek lowercase beta (U+03B2, β);
  2. 0xE4 is both the n-ary summation sign (U+2211, ∑) and the Greek uppercase sigma (U+03A3, Σ);
  3. 0xE6 is both the micro sign (U+00B5, µ) and the Greek lowercase mu (U+03BC, μ);
  4. 0xEA is both the Ohm sign (U+2126, Ω) and the Greek uppercase omega (U+03A9, Ω);
  5. 0xEE is both the element-of sign (U+2208, ∈) and the Greek lowercase epsilon (U+03B5, ε)!


बाइनरी कैरेक्टर जोड़-तोड़

MIK कोड पृष्ठ सभी सिरिलिक अक्षरों को वर्णानुक्रम में बनाए रखता है जो बाइनरी रूप में बहुत आसान चरित्र हेरफेर को सक्षम बनाता है:

10xx xxxx - एक सिरिलिक अक्षर है

100x xxxx - एक अपरकेस सिरिलिक अक्षर है

101x xxxx - एक लोअर-केस सिरिलिक अक्षर है

ऐसे मामले में परीक्षण और चरित्र हेरफेर कार्य इस प्रकार हैं:

IsAlpha(), IsUpper(), IsLower(), ToUpper() और ToLower(),

बिट ऑपरेशंस हैं और सॉर्टिंग वर्ण मानों की सरल तुलना द्वारा होती है।

यह भी देखें

संदर्भ

  1. "Pravetz 16". Archived from the original on 2016-12-06. Retrieved 2016-12-06.
  2. da Cruz, Frank (2010-04-02). "Kermit and MIME Character-Set Names". The Kermit Project. Columbia University, New York, USA. Archived from the original on 2016-12-03. Retrieved 2016-12-02.
  3. "Kermit 95 - Cyrillic Character Sets".
  4. 4.0 4.1 http://www.columbia.edu/kermit/ftp/charsets/cp856.txt[bare URL plain text file]
  5. Czyborra, Roman (1998-11-30) [1998-05-25]. "The Cyrillic Charset Soup". Archived from the original on 2016-12-03. Retrieved 2016-12-03. [1] [2]
  6. Hohlov, Yu. E. "Cyrillic Information Representation in Electronic Form - Character Set (Code Page) Tables". Archived from the original on 2016-12-05. Retrieved 2016-12-05.


बाहरी संबंध