एमआईके (वर्ण सेट)
MIK (МИК) एक 8-बिट सिरिलिक लिपि कोड पेज है जिसका उपयोग DOS के साथ किया जाता है। यह बल्गेरियाई दिशा 16 में प्रयुक्त चरित्र सेट पर आधारित है[1]आईबीएम पीसी संगत प्रणाली। केर्मिट (प्रोटोकॉल) इस कैरेक्टर सेट को बुल्गारिया-पीसी / बुल्गारिया-पीसी कहता है।[2][3][4]बुल्गारिया में, इसे कभी-कभी गलत तरीके से कोड पेज 856 के रूप में संदर्भित किया जाता था (जो हिब्रू कोड पृष्ठ 856 लिए आईबीएम की परिभाषा से टकराता है)। इस कोड पृष्ठ को FreeDOS द्वारा कोड पृष्ठ 3021 के रूप में जाना जाता है।
यह कोड पृष्ठ 808|सीपी 808, कोड पृष्ठ 855|सीपी 855, कोड पृष्ठ 866|सीपी 866 या कोड पृष्ठ 872|सीपी 872 के बजाय बुल्गारिया में उपयोग किया जाने वाला सबसे व्यापक डॉस/मूल उपकरण निर्माता कोड पृष्ठ है।
बुल्गारिया में बनाया गया लगभग हर DOS प्रोग्राम, जिसमें बल्गेरियाई तार हैं, एन्कोडिंग के रूप में MIK का उपयोग कर रहा था, और ऐसे कई प्रोग्राम अभी भी उपयोग में हैं।
अक्षर सेट
प्रत्येक वर्ण को उसके समकक्ष यूनिकोड कोड बिंदु और उसके दशमलव कोड बिंदु के साथ दिखाया गया है। तालिका का केवल दूसरा भाग (कोड बिंदु 128-255) दिखाया गया है, पहला भाग (कोड बिंदु 0-127) ASCII के समान है।
MIK[5][6][4] | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
8x | А | Б | В | Г | Д | Е | Ж | З | И | Й | К | Л | М | Н | О | П |
9x | Р | С | Т | У | Ф | Х | Ц | Ч | Ш | Щ | Ъ | Ы | Ь | Э | Ю | Я |
Ax | а | б | в | г | д | е | ж | з | и | й | к | л | м | н | о | п |
Bx | р | с | т | у | ф | х | ц | ч | ш | щ | ъ | ы | ь | э | ю | я |
Cx | └ | ┴ | ┬ | ├ | ─ | ┼ | ╣ | ║ | ╚ | ╔ | ╩ | ╦ | ╠ | ═ | ╬ | ┐ |
Dx | ░ | ▒ | ▓ | │ | ┤ | № | § | ╗ | ╝ | ┘ | ┌ | █ | ▄ | ▌ | ▐ | ▀ |
Ex | α | ß[nb 1] | Γ | π | Σ[nb 2] | σ | µ[nb 3] | τ | Φ | Θ | Ω[nb 4] | δ | ∞ | φ | ε[nb 5] | ∩ |
Fx | ≡ | ± | ≥ | ≤ | ⌠ | ⌡ | ÷ | ≈ | ° | ∙ | · | √ | ⁿ | ² | ■ | NBSP |
यूनिकोड में तालिकाओं की मैपिंग के कार्यान्वयनकर्ताओं के लिए नोट्स
यूनिकोड में तालिकाओं को मैप करने के कार्यान्वयनकर्ताओं को ध्यान देना चाहिए कि एमआईके कोड पृष्ठ कुछ वर्णों को एकीकृत करता है:
- ↑ 0xE1 is both the German sharp S (U+00DF, ß) and the Greek lowercase beta (U+03B2, β);
- ↑ 0xE4 is both the n-ary summation sign (U+2211, ∑) and the Greek uppercase sigma (U+03A3, Σ);
- ↑ 0xE6 is both the micro sign (U+00B5, µ) and the Greek lowercase mu (U+03BC, μ);
- ↑ 0xEA is both the Ohm sign (U+2126, Ω) and the Greek uppercase omega (U+03A9, Ω);
- ↑ 0xEE is both the element-of sign (U+2208, ∈) and the Greek lowercase epsilon (U+03B5, ε)!
बाइनरी कैरेक्टर जोड़-तोड़
MIK कोड पृष्ठ सभी सिरिलिक अक्षरों को वर्णानुक्रम में बनाए रखता है जो बाइनरी रूप में बहुत आसान चरित्र हेरफेर को सक्षम बनाता है:
10xx xxxx - एक सिरिलिक अक्षर है
100x xxxx - एक अपरकेस सिरिलिक अक्षर है
101x xxxx - एक लोअर-केस सिरिलिक अक्षर है
ऐसे मामले में परीक्षण और चरित्र हेरफेर कार्य इस प्रकार हैं:
IsAlpha(), IsUpper(), IsLower(), ToUpper() और ToLower(),
बिट ऑपरेशंस हैं और सॉर्टिंग वर्ण मानों की सरल तुलना द्वारा होती है।
यह भी देखें
संदर्भ
- ↑ "Pravetz 16". Archived from the original on 2016-12-06. Retrieved 2016-12-06.
- ↑ da Cruz, Frank (2010-04-02). "Kermit and MIME Character-Set Names". The Kermit Project. Columbia University, New York, USA. Archived from the original on 2016-12-03. Retrieved 2016-12-02.
- ↑ "Kermit 95 - Cyrillic Character Sets".
- ↑ 4.0 4.1 http://www.columbia.edu/kermit/ftp/charsets/cp856.txt[bare URL plain text file]
- ↑ Czyborra, Roman (1998-11-30) [1998-05-25]. "The Cyrillic Charset Soup". Archived from the original on 2016-12-03. Retrieved 2016-12-03. [1] [2]
- ↑ Hohlov, Yu. E. "Cyrillic Information Representation in Electronic Form - Character Set (Code Page) Tables". Archived from the original on 2016-12-05. Retrieved 2016-12-05.
बाहरी संबंध
- https://www.unicode.org/Public/MAPPINGS/VENDORS/IBM/IBM_conversions.html Unicode Consortium's mappings between IBM's code pages and Unicode
- http://www.cl.cam.ac.uk/~mgk25/unicode.html#conv UTF-8 and Unicode FAQ for Unix/Linux by Markus Kuhn
- All articles with bare URLs for citations
- Articles with bare URLs for citations from March 2022
- Articles with plain text file bare URLs for citations
- Collapse templates
- Navigational boxes
- Navigational boxes without horizontal lists
- Sidebars with styles needing conversion
- Templates generating microformats
- Templates that are not mobile friendly
- Wikipedia metatemplates
- दो कोड पेज
- अक्षरों को सांकेतिक अक्षरों में बदलना
- Machine Translated Page
- Created On 12/10/2023