छवि संपीड़न

From alpha
Jump to navigation Jump to search

छवि संपीड़न डिजिटल छवियों पर लागू एक प्रकार का डेटा संपीड़न है, जो कंप्यूटर आंकड़ा भंडारण या डेटा ट्रांसमिशन के लिए उनकी लागत को कम करने के लिए है।एल्गोरिदम दृश्य धारणा और छवि डेटा के सांख्यिकीय गुणों का लाभ उठा सकते हैं ताकि जेनेरिक डेटा संपीड़न विधियों की तुलना में बेहतर परिणाम प्रदान किया जा सके जो अन्य डिजिटल डेटा के लिए उपयोग किए जाते हैं।[1]

अलग -अलग गुणवत्ता के स्तर पर और वेब के लिए सहेजने के साथ या उसके बिना एडोब फ़ोटोशॉप द्वारा सहेजे गए JPEG छवियों की तुलना


हानिक और दोषरहित छवि संपीड़न

छवि संपीड़न हानिपूर्ण संपीड़न या दोषरहित संपीड़न हो सकता है।अभिलेखीय उद्देश्यों के लिए और अक्सर मेडिकल इमेजिंग, तकनीकी चित्र, क्लिप आर्ट या कॉमिक्स के लिए दोषरहित संपीड़न पसंद किया जाता है।हानिपूर्ण संपीड़न विधियाँ, विशेष रूप से जब कम बिट दर ों पर उपयोग की जाती है, तो संपीड़न कलाकृतियों का परिचय दें।हानिपूर्ण तरीके विशेष रूप से प्राकृतिक छवियों के लिए उपयुक्त हैं जैसे कि अनुप्रयोगों में तस्वीरें जहां मामूली (कभी -कभी अगोचर) निष्ठा की हानि बिट दर में पर्याप्त कमी प्राप्त करने के लिए स्वीकार्य है।नगण्य अंतर पैदा करने वाले हानि संपीड़न को नेत्रहीन दोषरहित कहा जा सकता है।

हानिपूर्ण संपीड़न के लिए तरीके:

  • कोडिंग को बदलना - यह सबसे अधिक इस्तेमाल की जाने वाली विधि है।
    • असतत कोसाइन परिवर्तन (डीसीटी) - हानिक संपीड़न का सबसे व्यापक रूप से इस्तेमाल किया जाने वाला रूप।यह फूरियर-संबंधित रूपांतरणों की एक प्रकार की सूची है।[2] DCT को कभी-कभी असतत कोसाइन परिवर्तन के परिवार के संदर्भ में DCT-II के रूप में संदर्भित किया जाता है (असतत कोसाइन ट्रांसफॉर्म देखें)। यह आम तौर पर छवि संपीड़न का सबसे कुशल रूप है।
      • DCT का उपयोग JPEG में किया जाता है, जो सबसे लोकप्रिय हानि प्रारूप है, और हाल ही में HEIF है।
    • हाल ही में विकसित तरंगिका परिवर्तन का भी बड़े पैमाने पर उपयोग किया जाता है, इसके बाद परिमाणीकरण (छवि प्रसंस्करण) और एन्ट्रॉपी कोडन
  • रंग परिमाणीकरण - छवि में कुछ प्रतिनिधि रंगों के लिए रंग स्थान एन्कोडिंग को कम करना। चयनित रंग संपीड़ित छवि के हेडर में रंग पैलेट (कम्प्यूटिंग) में निर्दिष्ट किए जाते हैं। प्रत्येक पिक्सेल सिर्फ रंग पैलेट में एक रंग के सूचकांक का संदर्भ देता है। इस विधि को पोस्टरकरण से बचने के लिए डाइथिंग के साथ जोड़ा जा सकता है।
    • संपूर्ण-छवि पैलेट, आमतौर पर 256 रंग, GIF और PNG फ़ाइल प्रारूपों में उपयोग किए जाते हैं।
    • ब्लॉक पैलेट, आमतौर पर 4x4 पिक्सेल के प्रत्येक ब्लॉक के लिए 2 या 4 रंग, ब्लॉक ट्रंकेशन कोडिंग, रंग सेल संपीड़न, S2TC और S3 बनावट संपीड़न में उपयोग किए जाते हैं।
  • क्रोमा सब्सक्रिप्लिंग । यह इस तथ्य का लाभ उठाता है कि मानव आंख छवि में कुछ क्रोमिनेंस जानकारी को औसत या गिराकर, रंग की तुलना में चमक के स्थानिक परिवर्तनों को अधिक तेजी से मानती है।
  • फ्रैक्टल संपीड़न

दोषरहित संपीड़न के लिए तरीके:

अन्य गुण

किसी दिए गए संपीड़न दर (या बिट दर) पर सबसे अच्छी छवि गुणवत्ता छवि संपीड़न का मुख्य लक्ष्य है, हालांकि, छवि संपीड़न योजनाओं के अन्य महत्वपूर्ण गुण हैं:

स्केलेबिलिटी आम तौर पर बिटस्ट्रीम या फ़ाइल (विघटन और पुन: संपीड़न के बिना) के हेरफेर द्वारा प्राप्त गुणवत्ता में कमी को संदर्भित करती है।स्केलेबिलिटी के लिए अन्य नाम प्रोग्रेसिव कोडिंग या एम्बेडेड बिटस्ट्रीम हैं।इसकी विपरीत प्रकृति के बावजूद, स्केलेबिलिटी भी दोषरहित कोडेक में पाई जा सकती है, आमतौर पर मोटे-से-फाइन पिक्सेल स्कैन के रूप में।स्केलेबिलिटी विशेष रूप से उन्हें डाउनलोड करते समय छवियों का पूर्वावलोकन करने के लिए उपयोगी है (जैसे, एक वेब ब्राउज़र में) या जैसे, डेटाबेस के लिए चर गुणवत्ता पहुंच प्रदान करने के लिए।कई प्रकार के स्केलेबिलिटी हैं:

  • गुणवत्ता प्रगतिशील या परत प्रगतिशील: बिटस्ट्रीम क्रमिक रूप से पुनर्निर्मित छवि को परिष्कृत करता है।
  • संकल्प प्रगतिशील: पहले एक कम छवि संकल्प को एनकोड करें;फिर उच्च संकल्पों में अंतर को एनकोड करें।[3][4]
  • घटक प्रगतिशील: पहला एनकोड ग्रे-स्केल संस्करण; फिर पूरा रंग जोड़ना।

ब्याज कोडिंग का क्षेत्र। छवि के कुछ हिस्सों को दूसरों की तुलना में उच्च गुणवत्ता के साथ एन्कोड किया गया है। यह स्केलेबिलिटी के साथ जोड़ा जा सकता है (पहले इन भागों को एनकोड करें, दूसरों को बाद में)।

मेटा जानकारी। संपीड़ित डेटा में छवि के बारे में जानकारी हो सकती है जिसका उपयोग छवियों को वर्गीकृत, खोज या ब्राउज़ करने के लिए किया जा सकता है। इस तरह की जानकारी में रंग और बनावट के आँकड़े, छोटे पूर्वावलोकन (कंप्यूटिंग) चित्र, और लेखक या कॉपीराइट जानकारी शामिल हो सकती हैं।

प्रसंस्करण शक्ति । संपीड़न एल्गोरिदम को एनकोड और डिकोड करने के लिए विभिन्न मात्रा में प्रसंस्करण शक्ति की आवश्यकता होती है। कुछ उच्च संपीड़न एल्गोरिदम को उच्च प्रसंस्करण शक्ति की आवश्यकता होती है।

एक संपीड़न विधि की गुणवत्ता को अक्सर पीक सिग्नल-टू-शोर अनुपात द्वारा मापा जाता है। यह छवि के एक हानिपूर्ण संपीड़न के माध्यम से पेश किए गए शोर की मात्रा को मापता है, हालांकि, दर्शक के व्यक्तिपरक निर्णय को भी एक महत्वपूर्ण उपाय माना जाता है, शायद, सबसे महत्वपूर्ण उपाय है।

इतिहास

1940 के दशक में शैनन -फानो कोडिंग की शुरुआत के साथ एन्ट्रापी कोडिंग शुरू हुई,[5] हफमैन कोडिंग का आधार जो 1950 में विकसित किया गया था।[6] 1960 के दशक के उत्तरार्ध में ट्रांसफॉर्म कोडिंग की तारीखें, 1968 में फास्ट फूरियर ट्रांसफॉर्म (एफएफटी) कोडिंग और 1969 में हदामार्ड ट्रांसफॉर्म की शुरूआत के साथ।[7] छवि डेटा संपीड़न में एक महत्वपूर्ण विकास असतत कोसाइन ट्रांसफॉर्म (डीसीटी) था, जो 1972 में एन। अहमद द्वारा प्रस्तावित एक हानिपूर्ण संपीड़न तकनीक थी।[8] डीसीटी संपीड़न जेपीईजी के लिए आधार बन गया, जिसे 1992 में संयुक्त फ़ोटोग्राफ़ी संबंधी विशेषज्ञों का संयुक्त समूह जेपीईजी) द्वारा पेश किया गया था।[9] JPEG छवियों को बहुत छोटे फ़ाइल आकारों में संकुचित करता है, और सबसे व्यापक रूप से उपयोग की जाने वाली छवि फ़ाइल प्रारूप बन गया है।[10] इसका अत्यधिक कुशल डीसीटी संपीड़न एल्गोरिथ्म डिजिटल छवियों और डिजिटल तस्वीरों के व्यापक प्रसार के लिए काफी हद तक जिम्मेदार था,[11] कई बिलियन जेपीईजी छवियों के साथ 2015 के अनुसार हर दिन उत्पादित किया गया।[12] Lempel -Ziv -Welch (LZW) 1984 में अब्राहम लेम्पेल , जैकब ज़िव और टेरी वेल्च द्वारा विकसित एक दोषरहित संपीड़न एल्गोरिथ्म है। इसका उपयोग GIF प्रारूप में किया जाता है, जिसे 1987 में पेश किया गया था।[13] Deflate, फिल काट्ज ़ द्वारा विकसित एक दोषरहित संपीड़न एल्गोरिथ्म और 1996 में निर्दिष्ट, पोर्टेबल नेटवर्क ग्राफिक्स (PNG) प्रारूप में उपयोग किया जाता है।[14] छोटा लहर कोडिंग, छवि संपीड़न में तरंगिका का उपयोग बदल जाता है, डीसीटी कोडिंग के विकास के बाद शुरू हुआ।[15] डीसीटी की शुरूआत ने वेवलेट कोडिंग के विकास का नेतृत्व किया, डीसीटी कोडिंग का एक संस्करण जो डीसीटी के ब्लॉक-आधारित एल्गोरिथ्म के बजाय तरंगों का उपयोग करता है।[15]JPEG 2000 मानक 1997 से 2000 तक Touradj Ebrahimi (बाद में JPEG अध्यक्ष) की अध्यक्षता में एक JPEG समिति द्वारा विकसित किया गया था।[16] मूल JPEG प्रारूप द्वारा उपयोग किए जाने वाले DCT एल्गोरिथ्म के विपरीत, JPEG 2000 इसके बजाय असतत तरंग रूपांतरण (DWT) एल्गोरिदम का उपयोग करता है।यह कोहेन-ड्यूबेकिस-फ्यूव्यू वेवलेट 9/7 वेवलेट ट्रांसफॉर्म (1992 में इंग्रिड डबेकिस द्वारा विकसित) का उपयोग करता है, इसके हानि संपीड़न एल्गोरिथ्म के लिए,[17] और ले गैल -ताबताबाई (एलजीटी) 5/3 वेवलेट ट्रांसफॉर्म[18][19] (1988 में डिडिएर ले गैल और अली जे। तबताबाई द्वारा विकसित)[20] इसके दोषरहित संपीड़न एल्गोरिथ्म के लिए।[17]JPEG 2000 तकनीक, जिसमें मोशन JPEG 2000 एक्सटेंशन शामिल है, को 2004 में अंकीय सिनेमा के लिए वीडियो कोडिंग मानक के रूप में चुना गया था।[21]


नोट्स और संदर्भ

  1. "Image Data Compression".
  2. Nasir Ahmed, T. Natarajan and K. R. Rao, "Discrete Cosine Transform," IEEE Trans. Computers, 90–93, Jan. 1974.
  3. Burt, P.; Adelson, E. (1 April 1983). "The Laplacian Pyramid as a Compact Image Code". IEEE Transactions on Communications. 31 (4): 532–540. CiteSeerX 10.1.1.54.299. doi:10.1109/TCOM.1983.1095851.
  4. Shao, Dan; Kropatsch, Walter G. (February 3–5, 2010). Špaček, Libor; Franc, Vojtěch (eds.). "Irregular Laplacian Graph Pyramid" (PDF). Computer Vision Winter Workshop 2010. Nové Hrady, Czech Republic: Czech Pattern Recognition Society.
  5. Claude Elwood Shannon (1948). Alcatel-Lucent (ed.). "A Mathematical Theory of Communication" (PDF). Bell System Technical Journal. 27 (3–4): 379–423, 623–656. doi:10.1002/j.1538-7305.1948.tb01338.x. hdl:11858/00-001M-0000-002C-4314-2. Retrieved 2019-04-21.
  6. David Albert Huffman (September 1952), "A method for the construction of minimum-redundancy codes" (PDF), Proceedings of the IRE, vol. 40, no. 9, pp. 1098–1101, doi:10.1109/JRPROC.1952.273898
  7. William K. Pratt, Julius Kane, Harry C. Andrews: "Hadamard transform image coding", in Proceedings of the IEEE 57.1 (1969): Seiten 58–68
  8. Ahmed, Nasir (January 1991). "How I Came Up With the Discrete Cosine Transform". Digital Signal Processing. 1 (1): 4–5. doi:10.1016/1051-2004(91)90086-Z.
  9. "T.81 – DIGITAL COMPRESSION AND CODING OF CONTINUOUS-TONE STILL IMAGES – REQUIREMENTS AND GUIDELINES" (PDF). CCITT. September 1992. Retrieved 12 July 2019.
  10. "The JPEG image format explained". BT.com. BT Group. 31 May 2018. Retrieved 5 August 2019.
  11. "What Is a JPEG? The Invisible Object You See Every Day". The Atlantic. 24 September 2013. Retrieved 13 September 2019.
  12. Baraniuk, Chris (15 October 2015). "Copy protections could come to JPEGs". BBC News. BBC. Retrieved 13 September 2019.
  13. "The GIF Controversy: A Software Developer's Perspective". Retrieved 26 May 2015.
  14. L. Peter Deutsch (May 1996). DEFLATE Compressed Data Format Specification version 1.3. IETF. p. 1. sec. Abstract. doi:10.17487/RFC1951. RFC 1951. Retrieved 2014-04-23.
  15. 15.0 15.1 Hoffman, Roy (2012). Data Compression in Digital Systems. Springer Science & Business Media. p. 124. ISBN 9781461560319. Basically, wavelet coding is a variant on DCT-based transform coding that reduces or eliminates some of its limitations. (...) Another advantage is that rather than working with 8 × 8 blocks of pixels, as do JPEG and other block-based DCT techniques, wavelet coding can simultaneously compress the entire image.
  16. Taubman, David; Marcellin, Michael (2012). JPEG2000 Image Compression Fundamentals, Standards and Practice: Image Compression Fundamentals, Standards and Practice. Springer Science & Business Media. ISBN 9781461507994.
  17. 17.0 17.1 Unser, M.; Blu, T. (2003). "Mathematical properties of the JPEG2000 wavelet filters" (PDF). IEEE Transactions on Image Processing. 12 (9): 1080–1090. Bibcode:2003ITIP...12.1080U. doi:10.1109/TIP.2003.812329. PMID 18237979. S2CID 2765169. Archived from the original (PDF) on 2019-10-13.
  18. Sullivan, Gary (8–12 December 2003). "General characteristics and design considerations for temporal subband video coding". ITU-T. Video Coding Experts Group. Retrieved 13 September 2019.
  19. Bovik, Alan C. (2009). The Essential Guide to Video Processing. Academic Press. p. 355. ISBN 9780080922508.
  20. Le Gall, Didier; Tabatabai, Ali J. (1988). "Sub-band coding of digital images using symmetric short kernel filters and arithmetic coding techniques". ICASSP-88., International Conference on Acoustics, Speech, and Signal Processing: 761–764 vol.2. doi:10.1109/ICASSP.1988.196696. S2CID 109186495.
  21. Swartz, Charles S. (2005). Understanding Digital Cinema: A Professional Handbook. Taylor & Francis. p. 147. ISBN 9780240806174.


बाहरी संबंध