आंकड़ों का विस्थापन

From alpha
Jump to navigation Jump to search

आंकड़े माइग्रेशन डेटा को चुनने, तैयार करने, निकालने और बदलने की प्रक्रिया है और स्थायी रूप से डेटा को एक कंप्यूटर डेटा भंडारण सिस्टम से दूसरे कंप्यूटर में स्थानांतरित कर देता है। इसके अतिरिक्त, पूर्णता के लिए माइग्रेट किए गए डेटा का सत्यापन और लीगेसी डेटा संग्रहण को बंद करना संपूर्ण डेटा माइग्रेशन प्रक्रिया का हिस्सा माना जाता है।[1][2] किसी भी प्रणाली के कार्यान्वयन, उन्नयन, या समेकन के लिए डेटा माइग्रेशन एक महत्वपूर्ण विचार है, और यह आम तौर पर इस तरह से किया जाता है कि यह जितना संभव हो उतना स्वचालित हो, मानव संसाधनों को थकाऊ कार्यों से मुक्त करता है। सर्वर या भंडारण उपकरण प्रतिस्थापन, रखरखाव या उन्नयन, सॉफ्टवेयर आधुनिकीकरण, वेबसाइट समेकन, आपदा पुनर्प्राप्ति और डेटा केंद्र स्थानांतरण सहित कई कारणों से डेटा माइग्रेशन होता है।[2]


मानक चरण

As of 2011, लगभग 40 प्रतिशत डेटा माइग्रेशन प्रोजेक्ट समय के साथ, बजट से अधिक थे, या पूरी तरह से विफल रहे।[1][3] इसलिए, एक प्रभावी डेटा माइग्रेशन प्राप्त करने के लिए उचित योजना महत्वपूर्ण है। जबकि एक डेटा माइग्रेशन योजना की बारीकियाँ अलग-अलग हो सकती हैं - कभी-कभी महत्वपूर्ण रूप से - प्रोजेक्ट से प्रोजेक्ट तक, कंप्यूटिंग कंपनी IBM का सुझाव है कि किसी भी डेटा माइग्रेशन प्रोजेक्ट के लिए तीन मुख्य चरण होते हैं: प्लानिंग, माइग्रेशन और पोस्ट-माइग्रेशन।[2]उनमें से प्रत्येक चरण के अपने कदम हैं। नियोजन के दौरान, निर्भरता और आवश्यकताओं का विश्लेषण किया जाता है, प्रवासन परिदृश्य विकसित और परीक्षण किए जाते हैं, और एक परियोजना योजना बनाई जाती है जिसमें पूर्व सूचना शामिल होती है। माइग्रेशन चरण के दौरान, योजना को अधिनियमित किया जाता है, और माइग्रेशन के बाद के दौरान, माइग्रेशन की पूर्णता और संपूर्णता को मान्य, प्रलेखित, बंद कर दिया जाता है, जिसमें विरासत प्रणालियों के किसी भी आवश्यक डिकमीशनिंग को शामिल किया जाता है।[2]मध्यम से उच्च जटिलता के अनुप्रयोगों के लिए, नई प्रणाली को पूरी तरह से मान्य और तैनात करने से पहले इन डेटा माइग्रेशन चरणों को कई बार दोहराया जा सकता है।

नियोजन: माइग्रेट किए जाने वाले डेटा, एप्लिकेशन आदि का चयन व्यवसाय, परियोजना और तकनीकी आवश्यकताओं और निर्भरताओं के आधार पर किया जाता है। हार्डवेयर और बैंडविड्थ आवश्यकताओं का विश्लेषण किया जाता है। व्यवहार्य प्रवासन और बैक-आउट परिदृश्य विकसित किए गए हैं, साथ ही संबंधित परीक्षण, स्वचालन स्क्रिप्ट, डेटा मैपिंग और प्रक्रियाएं। डेटा गुणवत्ता में सुधार करने और डेटा दोहराव या अप्रचलित जानकारी को खत्म करने के लिए फ़ाइल प्रारूप के लिए डेटा सफाई और परिवर्तन आवश्यकताओं का भी आकलन किया जाता है। माइग्रेशन आर्किटेक्चर पर निर्णय लिया जाता है और विकसित किया जाता है, सभी आवश्यक सॉफ़्टवेयर लाइसेंस प्राप्त किए जाते हैं, और परिवर्तन प्रबंधन प्रक्रियाएँ शुरू की जाती हैं।[1][2]

प्रवासन: हार्डवेयर और सॉफ्टवेयर आवश्यकताओं को मान्य किया जाता है, और प्रवासन प्रक्रियाओं को आवश्यकतानुसार अनुकूलित किया जाता है। कुछ प्रकार के पूर्व-सत्यापन परीक्षण भी हो सकते हैं ताकि यह सुनिश्चित किया जा सके कि आवश्यकताएं और अनुकूलित सेटिंग्स अपेक्षित रूप से काम करती हैं। यदि सब कुछ अच्छी तरह से समझ लिया जाता है, तो माइग्रेशन शुरू हो जाता है, जिसमें डेटा निष्कर्षण के प्राथमिक कार्य शामिल हैं, जहां पुराने सिस्टम से डेटा पढ़ा जाता है, और डेटा लोड हो रहा है, जहां डेटा को नई प्रणाली में लिखा जाता है। अतिरिक्त सत्यापन कदम सुनिश्चित करते हैं कि विकसित प्रवासन योजना पूर्ण रूप से लागू की गई थी।[1][2]

पोस्ट-माइग्रेशन: डेटा माइग्रेशन के बाद, परिणाम यह निर्धारित करने के लिए डेटा सत्यापन के अधीन होते हैं कि क्या डेटा का सही अनुवाद किया गया था, पूर्ण है, और नई प्रणाली में प्रक्रियाओं का समर्थन करता है। सत्यापन के दौरान, असमानता के क्षेत्रों की पहचान करने और गलत डेटा हानि को रोकने के लिए दोनों प्रणालियों के समानांतर संचालन की आवश्यकता हो सकती है। माइग्रेशन प्रोजेक्ट के अतिरिक्त दस्तावेज़ीकरण और रिपोर्टिंग का संचालन किया जाता है, और एक बार माइग्रेशन पूर्ण होने की पुष्टि हो जाने के बाद, लीगेसी सिस्टम को भी डीकमीशन किया जा सकता है। माइग्रेशन क्लोज-आउट बैठकें आधिकारिक तौर पर माइग्रेशन प्रक्रिया को समाप्त कर देंगी।[1][2]


परियोजना बनाम प्रक्रिया

डेटा माइग्रेशन और डेटा एकीकरण गतिविधियों में अंतर है। डेटा माइग्रेशन एक ऐसी परियोजना है जिसके माध्यम से डेटा को एक वातावरण से दूसरे वातावरण में ले जाया या कॉपी किया जाता है, और स्रोत में हटा दिया जाता है या हटा दिया जाता है। माइग्रेशन के दौरान (जो महीनों या वर्षों तक हो सकता है), डेटा कई दिशाओं में प्रवाहित हो सकता है, और एक साथ कई माइग्रेशन हो सकते हैं। ETL (एक्सट्रैक्ट, ट्रांसफ़ॉर्म, लोड) क्रियाएं आवश्यक होंगी, हालाँकि इन्हें प्राप्त करने के साधन वे नहीं हो सकते हैं जो परंपरागत रूप से ETL संक्षिप्त नाम से जुड़े हैं।

डेटा एकीकरण, इसके विपरीत, सूचना प्रौद्योगिकी वास्तुकला का एक स्थायी हिस्सा है, और विभिन्न अनुप्रयोगों और डेटा स्टोर के बीच डेटा प्रवाह के तरीके के लिए जिम्मेदार है- और यह एक परियोजना गतिविधि के बजाय एक प्रक्रिया है। ऑपरेशनल सिस्टम से डेटा वेयरहाउस में डेटा की आपूर्ति करने के लिए डिज़ाइन की गई मानक ETL प्रौद्योगिकियाँ बाद की श्रेणी में फिट होंगी।[4]


श्रेणियां

कम्प्यूटर फाइल या डेटाबेस में विभिन्न मीडिया पर डेटा संग्रहीत किया जाता है, और सॉफ्टवेयर अनुप्रयोगों द्वारा उत्पन्न और उपभोग किया जाता है, जो बदले में व्यावसायिक प्रक्रियाओं का समर्थन करते हैं। डेटा को स्थानांतरित करने और परिवर्तित करने की आवश्यकता को कई व्यावसायिक आवश्यकताओं द्वारा संचालित किया जा सकता है, और माइग्रेशन के लिए लिया गया दृष्टिकोण उन आवश्यकताओं पर निर्भर करता है। इस आधार पर चार प्रमुख प्रवासन श्रेणियां प्रस्तावित हैं।

स्टोरेज माइग्रेशन

अधिक कुशल भंडारण तकनीकों का लाभ उठाने के लिए एक व्यवसाय भौतिक मीडिया को युक्तिसंगत बनाने का विकल्प चुन सकता है।[2]इसके परिणामस्वरूप डेटा के भौतिक ब्लॉक को एक टेप या डिस्क से दूसरे में स्थानांतरित करना होगा, अक्सर भंडारण वर्चुअलाइजेशन तकनीकों का उपयोग करना। डेटा प्रारूप और सामग्री को आमतौर पर प्रक्रिया में नहीं बदला जाएगा और सामान्य रूप से ऊपर की परतों पर न्यूनतम या कोई प्रभाव नहीं डाला जा सकता है।[5]


डेटाबेस माइग्रेशन

इसी तरह, एक डेटाबेस वेंडर से दूसरे में जाना या उपयोग किए जा रहे डेटाबेस सॉफ़्टवेयर के संस्करण को अपग्रेड करना आवश्यक हो सकता है। बाद वाले मामले में भौतिक डेटा माइग्रेशन की आवश्यकता कम होती है, लेकिन बड़े अपग्रेड के साथ ऐसा हो सकता है। इन मामलों में एक भौतिक परिवर्तन प्रक्रिया की आवश्यकता हो सकती है क्योंकि अंतर्निहित डेटा प्रारूप महत्वपूर्ण रूप से बदल सकता है। यह अनुप्रयोग परत में व्यवहार को प्रभावित कर सकता है या नहीं भी कर सकता है, यह काफी हद तक इस बात पर निर्भर करता है कि डेटा हेरफेर भाषा या प्रोटोकॉल बदल गया है या नहीं।[6] हालांकि, कुछ आधुनिक अनुप्रयोगों को डेटाबेस प्रौद्योगिकी के लिए लगभग पूरी तरह अज्ञेयवादी लिखा जाता है,[7] इसलिए Sybase, MySQL, IBM Db2 या Microsoft SQL सर्वर से Oracle डेटाबेस में परिवर्तन के लिए केवल एक परीक्षण चक्र की आवश्यकता होनी चाहिए ताकि यह सुनिश्चित हो सके कि कार्यात्मक और गैर-कार्यात्मक प्रदर्शन दोनों पर प्रतिकूल प्रभाव नहीं पड़ा है।

एप्लिकेशन माइग्रेशन

एप्लिकेशन विक्रेता बदलना - उदाहरण के लिए एक नया ग्राहक संबंध प्रबंधन या उद्यम संसाधन योजना प्लेटफ़ॉर्म - अनिवार्य रूप से पर्याप्त परिवर्तन शामिल होगा क्योंकि लगभग हर एप्लिकेशन या सूट अपने स्वयं के विशिष्ट डेटा मॉडल पर काम करता है और उद्यम अनुप्रयोग एकीकरण वातावरण के भीतर अन्य एप्लिकेशन और सिस्टम के साथ इंटरैक्ट भी करता है।[8] इसके अलावा, एप्लिकेशन को व्यापक संभव बाजार में बेचने की अनुमति देने के लिए, वाणिज्यिक ऑफ-द-शेल्फ पैकेज आम तौर पर मेटा डेटा का उपयोग करके प्रत्येक ग्राहक के लिए कॉन्फ़िगर किए जाते हैं। एप्लिकेशन प्रोग्रामिंग इंटरफेस (एपीआई) की आपूर्ति विक्रेताओं द्वारा डेटा अखंडता की रक्षा के लिए की जा सकती है जिसे उन्हें संभालना है।

बिजनेस प्रोसेस माइग्रेशन

व्यावसायिक प्रक्रियाएँ मानव और एप्लिकेशन सिस्टम क्रियाओं के संयोजन के माध्यम से संचालित होती हैं, जो अक्सर व्यवसाय प्रक्रिया प्रबंधन उपकरणों द्वारा व्यवस्थित होती हैं। जब ये परिवर्तन होते हैं, तो उन्हें संगठन में परिवर्तन और ग्राहकों, उत्पादों और संचालन के बारे में जानकारी को प्रतिबिंबित करने के लिए एक स्टोर, डेटाबेस या एप्लिकेशन से डेटा की आवाजाही की आवश्यकता हो सकती है। ऐसे माइग्रेशन ड्राइवरों के उदाहरण विलय और अधिग्रहण, व्यवसाय अनुकूलन और नए बाजारों पर हमला करने या प्रतिस्पर्धी खतरे का जवाब देने के लिए पुनर्गठन हैं।[9] माइग्रेशन की पहली दो श्रेणियां आमतौर पर नियमित परिचालन गतिविधियां होती हैं, जिनका आईटी विभाग बाकी के कारोबार में शामिल हुए बिना ध्यान रखता है। अंतिम दो श्रेणियां प्रक्रियाओं और अनुप्रयोगों के परिचालन उपयोगकर्ताओं को सीधे प्रभावित करती हैं, आवश्यक रूप से जटिल हैं, और महत्वपूर्ण व्यावसायिक डाउनटाइम के बिना उन्हें वितरित करना चुनौतीपूर्ण हो सकता है। परियोजना प्रबंधन कार्यालय या डेटा गवर्नेंस टीम के माध्यम से एक उच्च अनुकूली दृष्टिकोण, समवर्ती तुल्यकालन, एक व्यवसाय-उन्मुख ऑडिट क्षमता, और हितधारकों के लिए प्रवासन की स्पष्ट दृश्यता- ऐसे प्रवासन में प्रमुख आवश्यकताएं होने की संभावना है।[9]


डिजिटल संरक्षण के रूप में प्रवास

प्रवासन, जो स्वयं डिजिटल वस्तु पर ध्यान केंद्रित करता है, पुराने माध्यम से वर्तमान माध्यम में डेटा को स्थानांतरित करने या फिर से लिखने का कार्य है और कई वर्षों से डिजिटल वस्तुओं के दीर्घकालिक संरक्षण के लिए एकमात्र व्यवहार्य दृष्टिकोण माना जाता है। .[10] भंगुर समाचार पत्रों को माइक्रोफॉर्म पर पुन: प्रस्तुत करना इस तरह के प्रवास का एक उदाहरण है।

नुकसान

  • प्रवासन डेटा वाहक के संभावित अप्रचलन को संबोधित करता है, लेकिन इस तथ्य को संबोधित नहीं करता है कि डेटा चलाने वाली कुछ तकनीकों को पूरी तरह से छोड़ दिया जा सकता है, जिससे प्रवासन बेकार हो जाता है।
  • समय लेने वाली - माइग्रेशन एक निरंतर प्रक्रिया है, जिसे एक निश्चित मीडिया पर संग्रहीत सभी डेटा ऑब्जेक्ट्स के लिए हर बार एक माध्यम अप्रचलन तक पहुंचने पर दोहराया जाना चाहिए।
  • महँगा - एक संस्थान को प्रत्येक माइग्रेशन पर अतिरिक्त डेटा स्टोरेज मीडिया खरीदना चाहिए।[11]


यह भी देखें

संदर्भ

  1. 1.0 1.1 1.2 1.3 1.4 Morris, J. (2012). "Chapter 1: Data Migration: What's All the Fuss?". प्रैक्टिकल डेटा माइग्रेशन (2nd ed.). BCS Learning & Development Ltd. pp. 7–15. ISBN 9781906124847.
  2. 2.0 2.1 2.2 2.3 2.4 2.5 2.6 2.7 {{cite book |url=https://books.google.com/books?id=3fHDCAAAQBAJ&pg=PA1 |chapter=Chapter 1: Introducing disk data migration |title=DS8870 डेटा माइग्रेशन तकनीक|author=Dufrasne, B. |author2=Warmuth, A. |author3=Appel, J.|display-authors=et al |publisher=IBM Redbooks |pages=1–16 |year=2017 |isbn=9780738440606}
  3. Howard, P. (23 August 2011). "Data Migration Report - 2011". Bloor Research International Limited. Retrieved 20 July 2018.
  4. King, T. (17 August 2016). "Data Integration vs. Data Migration; What's the Difference?". Solutions Review - Data Integration. LeadSpark, Inc. Retrieved 20 July 2018.
  5. Seiwert, C.; Klee, P.; Marinez, L.; et al. (2012). "Chapter 2: Migration techniques and processes". आईबीएम डिस्क स्टोरेज सिस्टम में डेटा माइग्रेशन. IBM Redbooks. pp. 7–30. ISBN 9780738436289.
  6. Fowler, M.; Beck, K.; Brant, J.; et al. (2012). Refactoring: Improving the Design of Existing Code. Addison-Wesley. pp. 63–4. ISBN 9780133065268.
  7. Fronc, A. (1 March 2015). "डेटाबेस-अज्ञेयवादी अनुप्रयोग". DBA Presents. Retrieved 20 July 2018.
  8. Plivna, G. (1 July 2006). "Data migration from old to new application: An experience". gplivna.eu. Retrieved 20 July 2018.
  9. 9.0 9.1 Allen, M.; Cervo, D. (2015). Multi-Domain Master Data Management: Advanced MDM and Data Governance in Practice. Morgan Kaufmann. pp. 61–2. ISBN 9780128011478.
  10. van der Hoeven, Jeffrey; Bram Lohman; Remco Verdegem (2007). "Emulation for Digital Preservation in Practice: The Results". The International Journal of Digital Curation. 2 (2): 123–132. doi:10.2218/ijdc.v2i2.35.
  11. Muira, Gregory (2007). "Pushing the Boundaries of Traditional Heritage Policy: maintaining long-term access to multimedia content" (PDF). IFLA Journal. 33 (4): 323–326. doi:10.1177/0340035207086058. S2CID 110505620.


बाहरी संबंध