डेटाबेस संरक्षण

From alpha
Revision as of 11:39, 1 March 2024 by Indicwiki (talk | contribs) (Created page with "{{short description|Form of preservation}} डेटाबेस संरक्षण में आम तौर पर डेटा की प्रारंभिक...")
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)

Jump to navigation Jump to search

डेटाबेस संरक्षण में आम तौर पर डेटा की प्रारंभिक विशेषताओं (संदर्भ, सामग्री, संरचना, उपस्थिति और व्यवहार) को खोए बिना, कंप्यूटर प्रौद्योगिकी में परिवर्तन के रूप में डेटाबेस में संग्रहीत जानकारी को लंबे समय तक सुलभ होने की संभावना वाले रूप में परिवर्तित करना शामिल होता है।[1] डेटाबेस की व्यापकता के साथ, डेटाबेस और उनकी सामग्री के संरक्षण में सहायता के लिए विभिन्न तरीके विकसित किए गए हैं। ये विधियाँ डेटाबेस विशेषताओं और संरक्षण आवश्यकताओं के आधार पर भिन्न होती हैं।[2] डेटाबेस संरक्षण की तीन बुनियादी विधियाँ हैं: माइग्रेशन, XML और इम्यूलेशन।[1]ऐसे कुछ उपकरण, सॉफ़्टवेयर और प्रोजेक्ट भी हैं जो SIARD, डिजिटल प्रिजर्वेशन टूलकिट, CHRONOS और RODA सहित डेटाबेस के संरक्षण में सहायता के लिए बनाए गए हैं।

डेटाबेस विशेषताएँ

उक्त डेटाबेस के संरक्षण का प्रयास करते समय डेटाबेस की विशेषताओं को ही ध्यान में रखा जाता है। संबंध का डेटाबेस उन तालिकाओं से बने होते हैं जिनमें रिकॉर्ड में डेटा होता है और ये तालिकाएँ फिर सामान्य डेटा बिंदुओं के माध्यम से एक दूसरे से जुड़ती हैं जो उनके रिकॉर्ड में संग्रहीत होते हैं।[3] हालाँकि, बड़े डेटा के उद्भव के साथ नया NoSQL डेटाबेस भी चलन में आ रहा है।[4] डेटाबेस को खुले या बंद और स्थिर या गतिशील के रूप में जाना जाता है। जब किसी डेटाबेस को खुला माना जाता है तो इसका मतलब है कि यह अतिरिक्त डेटा जोड़े जाने के लिए खुला है, हालांकि जब किसी डेटाबेस को बंद माना जाता है तो इसका मतलब विपरीत होता है - यह अपनी पूर्ण प्रकृति के कारण नए डेटा के लिए बंद है। एक डेटाबेस को स्थिर माना जाता है जब इसमें ऐसे रिकॉर्ड होते हैं जिन्हें उनके प्रारंभिक समावेशन के बाद संपादित या परिवर्तित नहीं किया जाता है, हालांकि एक डेटाबेस को गतिशील माना जाता है जब इसमें ऐसे रिकॉर्ड होते हैं जिन्हें भविष्य में संपादित किया जा सकता है। चाहे कोई डेटाबेस खुला और स्थिर हो, खुला और गतिशील हो, बंद और स्थिर हो, या बंद और गतिशील हो, यह संरक्षण के लिए उपयोग की जाने वाली विधियों को प्रभावित करेगा। स्थिर डेटाबेस की तुलना में गतिशील डेटाबेस को संरक्षित करना अधिक कठिन है क्योंकि डेटा लगातार बदल रहा है, और बंद डेटाबेस की तुलना में खुले डेटाबेस को संरक्षित करना अधिक कठिन है क्योंकि डेटा लगातार जोड़ा जा रहा है। जितनी अधिक बार कोई डेटाबेस बदलता है, या तो किसी रिकॉर्ड के भीतर या किसी रिकॉर्ड को जोड़कर, संरक्षण के लिए उस परिवर्तन को पकड़ने के लिए उतनी ही अधिक बार कदम उठाए जाने चाहिए।[2]


डेटाबेस संरक्षण विधियाँ

डिजिटल संरक्षण के तीन मुख्य तरीकों को डेटाबेस के संरक्षण के लिए भी लागू किया जा सकता है। इन विधियों में माइग्रेशन, XML और इम्यूलेशन शामिल हैं।[1]


प्रवासन

आंकड़ों का विस्थापन विधि (जिसे निष्क्रिय संग्रह के रूप में भी जाना जाता है)[3]इसमें अप्रचलित डेटाबेस प्रोग्राम से डेटा को एक नए प्रारूप में स्थानांतरित करना शामिल है। माइग्रेशन के तीन तरीके हैं: बैकवर्ड अनुकूलता, अंतरसंचालनीयता, और मानकों में रूपांतरण। बैकवर्ड संगतता में किसी दस्तावेज़ को खोलने, एक्सेस करने और पढ़ने के लिए नए सॉफ़्टवेयर या हार्डवेयर संस्करणों का उपयोग करना शामिल है जो पुराने संस्करण का उपयोग करके बनाया गया था। इंटरऑपरेबिलिटी में यह सुनिश्चित करके अप्रचलन की संभावना को कम करना शामिल है कि किसी विशेष फ़ाइल को सॉफ़्टवेयर और हार्डवेयर के एक से अधिक संयोजन के साथ एक्सेस किया जा सकता है। मानकों में रूपांतरण में डेटा भंडारण को एक मालिकाना प्रारूप से एक खुले, अधिक आसानी से सुलभ और व्यापक रूप से उपयोग किए जाने वाले प्रारूप में स्थानांतरित करना शामिल है।[1]


एक्सएमएल

XML विधि (XML सामान्यीकरण के रूप में भी जाना जाता है)[3]इसमें मूल डेटाबेस जानकारी को XML मानक प्रारूप में परिवर्तित करना शामिल है। एक प्रारूप के रूप में XML को किसी विशेष हार्डवेयर या सॉफ़्टवेयर (टेक्स्ट एडिटर या वर्ड प्रोसेसर से परे) की आवश्यकता नहीं होती है और यह मानव और मशीन दोनों द्वारा पढ़ने योग्य है, जो इसे संरक्षण और भंडारण उद्देश्यों के लिए एक टिकाऊ प्रारूप बनाता है।[1]हालाँकि, डेटा को XML प्रारूप में परिवर्तित करने में, डेटाबेस की कुछ इंटरैक्टिव कार्यक्षमता, जैसे क्वेरी करने की क्षमता, खो जाती है।[3]


अनुकरण

अनुकरण पद्धति में नई तकनीकों और सॉफ्टवेयर के साथ पुराने कंप्यूटिंग वातावरण को फिर से बनाना शामिल है। यह अप्रचलित सॉफ़्टवेयर, हार्डवेयर, या फ़ाइल स्वरूपों को नए सिस्टम पर पहुंच योग्य रहने की अनुमति देता है। इसलिए, एक पुराने डेटाबेस को एक एमुलेटर पर चलाया जा सकता है जो उस वातावरण की नकल करता है जिसमें डेटाबेस मूल रूप से बनाया गया था।[1]


संरक्षण उपकरण

SIARD

सॉफ़्टवेयर इंडिपेंडेंट आर्काइविंग ऑफ़ रिलेशनल डेटाबेस (SIARD) प्रारूप का संस्करण 1.0 2007 में स्विस फ़ेडरल आर्काइव्स द्वारा विकसित किया गया था। इसे विक्रेता-तटस्थ रूप में रिलेशनल डेटाबेस को संग्रहीत करने के लिए डिज़ाइन किया गया था। SIARD संग्रह XML और SQL:1999 पर आधारित फ़ाइलों का एक ज़िप-आधारित पैकेज है। एक SIARD फ़ाइल में डेटाबेस सामग्री और मशीन-प्रक्रिया योग्य संरचनात्मक मेटाडेटा दोनों शामिल होते हैं जो डेटाबेस तालिकाओं की संरचना और उनके संबंधों को रिकॉर्ड करते हैं। ज़िप फ़ाइल में एक XML फ़ाइल होती है जो डेटाबेस संरचना (मेटाडेटा.xml) का वर्णन करती है और साथ ही तालिका की सामग्री को कैप्चर करने वाली XML फ़ाइलों का एक संग्रह, प्रति तालिका एक होती है। SIARD संग्रह में डेटाबेस की बड़ी वस्तुओं (BLOBs और CLOBs) का प्रतिनिधित्व करने वाली टेक्स्ट फ़ाइलें और बाइनरी फ़ाइलें भी हो सकती हैं। SIARD ज़िप उपकरणों के साथ खोज करके व्यक्तिगत तालिकाओं तक सीधी पहुंच की अनुमति देता है। SIARD संग्रह एक परिचालन डेटाबेस नहीं है, लेकिन संग्रहीत डेटाबेस को किसी अन्य रिलेशनल डेटाबेस प्रबंधन प्रणाली (RDBMS) में पुन: एकीकरण का समर्थन करता है जो SQL:1999 का समर्थन करता है। इसके अलावा, SIARD वर्णनात्मक और प्रासंगिक मेटाडेटा को जोड़ने का समर्थन करता है जो डेटाबेस में ही दर्ज नहीं है और संग्रह में दस्तावेज़ फ़ाइलों को एम्बेड करने का समर्थन करता है।[5] SIARD संस्करण 1.0 को 2013 में मानक eCH-0165 के रूप में समरूप बनाया गया था।[6] SIARD संरक्षण प्रारूप का संस्करण 2.0 ई-ARK परियोजना के तत्वावधान में स्विस फेडरल अभिलेखागार द्वारा डिजाइन और विकसित किया गया था।[7] संस्करण 2.0 संस्करण 1.0 पर आधारित है और एक प्रारूप को परिभाषित करता है जो संस्करण 1.0 के साथ पीछे की ओर संगत है। संस्करण 2.0 में नई सुविधाओं में शामिल हैं:

  • SQL:1999 समर्थन को SQL:2008 समर्थन में अपग्रेड करना
  • सभी SQL:2008 प्रकारों के लिए समर्थन, विशेष रूप से उपयोगकर्ता-परिभाषित डेटा प्रकारों (UDTs) में
  • नियमित अभिव्यक्तियों का उपयोग करके डेटा प्रकार परिभाषाओं के लिए अधिक स्पष्ट सत्यापन नियम
  • "फ़ाइल:" यूआरआई का उपयोग करके SIARD फ़ाइल के बाहर बड़ी वस्तुओं को संग्रहीत करने के लिए समर्थन
  • संपीड़न तंत्र के रूप में "डिफ्लेट" के लिए समर्थन।

डीबीएमएल (डेटाबेस मार्कअप लैंग्वेज)

रिलेशनल डेटाबेस से टेबल जानकारी और डेटा कैप्चर करने के लिए मिन्हो विश्वविद्यालय के शोधकर्ता जोस कार्लोस रामाल्हो द्वारा एक XML स्कीमा बनाया गया था। यह 2007 में प्रकाशित हुआ था।[8]


क्रोनोस

CHRONOS एक सॉफ्टवेयर उत्पाद है जो डेटाबेस संरक्षण उपकरण के रूप में कार्य करता है।[4]सीएसपी क्रोनोस आर्काइविंग डेटाबेस संरक्षण के लिए एक मालिकाना समाधान का प्रतिनिधित्व करता है। CHRONOS को 2004 से 2006 तक CSP द्वारा यूनिवर्सिटी ऑफ एप्लाइड साइंसेज यूनिवर्सिटी ऑफ एप्लाइड साइंसेज लैंडशूट|लैंडशूट के कंप्यूटर विज्ञान विभाग के साथ साझेदारी में विकसित किया गया था।[4][9] CHRONOS डेटाबेस प्रबंधन प्रणाली से डेटा खींचता है और इसे CHRONOS संग्रह में टेक्स्ट या XML फ़ाइलों के रूप में संग्रहीत करता है। इसलिए सभी डेटा को डेटाबेस मैनेजमेंट सिस्टम (DBMS), या CHRONOS के बिना ही एक्सेस और पढ़ा जा सकता है, क्योंकि यह सादे पाठ प्रारूप में है। यह केवल संरक्षित स्थैतिक डेटाबेस को पढ़ने के लिए डीबीएमएस को बनाए रखने की आवश्यकता के साथ-साथ संभावित रूप से जोखिम भरे तरीके से डेटाबेस फ़ाइलों को नए डेटाबेस प्रारूपों में स्थानांतरित करने की आवश्यकता को समाप्त करता है।[9]हालाँकि CHRONOS डेटा को सादे पाठ प्रारूप में संग्रहीत करता है, लेकिन इसकी क्वेरी क्षमताओं को एक रिलेशनल डेटाबेस के बराबर माना जाता है।[4]


डेटाबेस संरक्षण टूलकिट

सामान्यीकृत प्रारूप में संबंधपरक डेटाबेस को समाहित करने और संरक्षित करने के लिए RODA परियोजना द्वारा बनाए गए चरणों की एक श्रृंखला, डेटाबेस संरक्षण टूलकिट या dbtoolkit का प्रतिनिधित्व करती है: संग्रहीत डेटाबेस के संरक्षण और पहुंच के लिए डिज़ाइन किया गया एक उपकरण। रिलेशनल डेटाबेस के सामान्यीकरण को प्राप्त करने के लिए, डेटाबेस प्रिजर्वेशन टूलकिट का उपयोग करते हुए, डेटा को DBML (डेटाबेस पाठ के प्रस्तुतिकरण के लिए प्रयुक्त भाषा ) या SIARD में परिवर्तित किया जाता है, क्योंकि दोनों XML का उपयोग करते हैं, एक मानक प्रारूप जिसमें विशिष्ट या मालिकाना सॉफ़्टवेयर या हार्डवेयर की आवश्यकता नहीं होती है - एक संरक्षण प्रारूप के लिए आदर्श .[10] डेटाबेस प्रिजर्वेशन टूलकिट (DBPTK) डेटाबेस को डिजिटल रूप से संरक्षित करने के प्रयोजनों के लिए लाइव सिस्टम से कनेक्शन सहित डेटाबेस प्रारूपों के बीच रूपांतरण की अनुमति देता है। टूलकिट लाइव या बैकअप किए गए डेटाबेस को SIARD जैसे संरक्षण प्रारूपों में परिवर्तित करने की अनुमति देता है, जो डेटाबेस संरक्षण के उद्देश्य से बनाया गया एक XML-आधारित प्रारूप है। इस रूपांतरण प्रक्रिया में टूलकिट DBMS-विशिष्ट कनेक्टर्स का उपयोग करके अद्वितीय DBMS जानकारी निकालता है। ये कनेक्टर एक विशेष DBMS के साथ जुड़ते हैं, उसका डेटा निकालते हैं, और इसे XML फॉर्म में प्रस्तुत करते हैं जिसके बाद DBML और SIARD में प्रतिनिधित्व होता है। नए DBMS के अंतर्ग्रहण के लिए नए कनेक्टर भी बनाए जा सकते हैं।[10]टूलकिट डेटाबेस की पूर्ण कार्यक्षमता की अनुमति देने के लिए संरक्षण प्रारूपों को लाइव सिस्टम में परिवर्तित करने की भी अनुमति देता है। उदाहरण के लिए, यह PhpMyAdmin के लिए अनुकूलित MySQL में एक विशेष निर्यात का समर्थन करता है, ताकि डेटाबेस को वेब इंटरफ़ेस का उपयोग करके पूरी तरह से प्रयोग किया जा सके।

यह टूलकिट मूल रूप से RODA प्रोजेक्ट का हिस्सा था[11] और फिर अपने आप रिलीज़ हो जाता है। इसे SIARD संरक्षण प्रारूप के एक नए संस्करण के साथ E-ARK परियोजना में और विकसित किया गया है।

टूलकिट इनपुट और आउटपुट मॉड्यूल का उपयोग करता है। प्रत्येक मॉड्यूल किसी विशेष डेटाबेस प्रारूप या लाइव सिस्टम को पढ़ने और/या लिखने का समर्थन करता है। नए इंटरफ़ेस के कार्यान्वयन और नए ड्राइवरों को जोड़कर नए मॉड्यूल आसानी से जोड़े जा सकते हैं।[12]


डेटाबेस संरक्षण परियोजनाएं

इस संबंध में अनुसंधान परियोजनाओं में शामिल हैं:

  • रिलेशनल डेटाबेस का सॉफ़्टवेयर स्वतंत्र संग्रह (SIARD)[13]
  • सॉफ्टवेयर डेटाबेस संरक्षण टूलकिट (ओपन-सोर्स, SIARD 2.0 का समर्थन करता है)[12]* प्रामाणिक डिजिटल डेटा ऑब्जेक्ट का भंडार (RODA)[14]
  • डिजिटल संरक्षण परीक्षण किया गया[15]
  • लॉकएसएस (LOCKSS) परियोजना का नेतृत्व स्टैनफोर्ड विश्वविद्यालय के पुस्तकालयों द्वारा किया गया था।[16]


प्रामाणिक डिजिटल वस्तुओं का भंडार (RODA)

RODA, या प्रामाणिक डिजिटल वस्तुओं का भंडार, पुर्तगाल के सरकारी संस्थानों द्वारा उत्पादित उन डिजिटल वस्तुओं को संरक्षित करने के लिए, पुर्तगाली राष्ट्रीय अभिलेखागार द्वारा 2006 में पुर्तगाल में शुरू की गई एक परियोजना थी। परियोजना का उद्देश्य संबंधपरक डेटाबेस सहित कई प्रकार की डिजिटल वस्तुओं को एक भंडार में संयोजित करना है। कई अलग-अलग प्रकार की डिजिटल वस्तुओं के एक अद्वितीय भंडार के रूप में, RODA का लक्ष्य सभी अंतर्ग्रहीत वस्तुओं को सामान्य बनाना है, अर्थात दस्तावेज़ों को संग्रहीत करने के लिए उपयोग किए जाने वाले प्रारूप प्रकारों को कम करना और समान प्रारूपों में समान दस्तावेज़ों को संरक्षित करना है।[10]

RODA परियोजना ने डेटाबेस को डिजिटल ऑब्जेक्ट के रूप में संरक्षित करने के लिए एक मानकीकृत विधि के निर्माण पर जोर दिया। डेटाबेस संरक्षण एक अनोखी चुनौती पेश करता है क्योंकि संरक्षण प्रक्रिया तीन परतों में विभाजित है: डेटा, संरचना (तर्क), और शब्दार्थ (इंटरफ़ेस)।[17] अर्थात्, यह निर्धारित किया गया था कि डेटाबेस के डेटा, साथ ही इसकी संरचना और शब्दार्थ को संरक्षित करने की आवश्यकता है। इन तीनों तत्वों को संरक्षित करने के लिए, RODA परियोजना ने डेटाबेस संरक्षण टूलकिट विकसित किया।[10]


यह भी देखें

  • डिजिटल संरक्षण

संदर्भ

  1. 1.0 1.1 1.2 1.3 1.4 1.5 Digital Preservation Testbed. (2003). From digital volatility to digital permanence: Preserving databases. ICTU Foundation. https://web.archive.org/web/20130531200744/http://en.nationaalarchief.nl/sites/default/files/docs/kennisbank/volatility-permanence-databases-en.pdf
  2. 2.0 2.1 Ashley, K. (2004). The preservation of databases. VINE, 34(2), 66-70. https://doi.org/10.1108/03055720410551075
  3. 3.0 3.1 3.2 3.3 Brogan, M., & Brown, J. (n.d.). Challenges in digital preservation: Relational databases. School of Computer and Information Science, Edith Cowan University. https://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.89.886&rep=rep1&type=pdf
  4. 4.0 4.1 4.2 4.3 Lindley, A. (2013, September 3–5). Database preservation evaluation report - SIARD vs. CHRONOS: Preserving complex structures as databases through a record centric approach? [Paper presentation]. iPRES 2013 - 10th International Conference on Preservation of Digital Objects, Lisbon, Portugal. https://doi.org/10.13140/2.1.3272.8005
  5. "SIARD (सॉफ़्टवेयर इंडिपेंडेंट आर्काइविंग ऑफ़ रिलेशनल डेटाबेस) संस्करण 1.0". 30 May 2015.
  6. Bruggisser, H., Büchler, G., Dubois, A., Kaiser, M., Kansy, L., Lischer, M., Röthlisberger-Jourdan, C., Thomas, H., & Voss, A. (2015). eCH-0165 SIARD format specification 2.0 (draft). eCH E Government Standards. https://www.eark-project.com/resources/specificationdocs/32-specification-for-siard-format-v20/STAN_e_FINAL_2015-07-04_eCH-0165_V2%200_SIARD-Format.pdf
  7. "E-ARK Project".
  8. José Carlos Ramalho; Miguel Ferreira; Luís Faria; Rui Castro (August 7, 2007). "XML मॉडलिंग के माध्यम से संबंधपरक डेटाबेस संरक्षण" (PDF). Extreme Markup Languages. Retrieved April 16, 2017.
  9. 9.0 9.1 Brandl, S., & Keller-Marxer, P. (2007, March 23). Long-term archiving of relational databases with Chronos [Paper presentation]. First International Workshop on Database Preservation (PresDB'07), Edinburgh, Scotland. https://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.459.5158&rep=rep1&type=pdf
  10. 10.0 10.1 10.2 10.3 Ramalho, J.C., Faria, L., Helder, S., & Coutada, M. (2013, December 31). Database Preservation Toolkit: A flexible tool to normalize and give access to databases. University of Minho. https://core.ac.uk/display/55635702?source=1&algorithmId=15&similarToDoc=55614406&similarToDocKey=CORE&recSetID=f3ffea4d-1504-45e9-bfd6-a0495f5c8f9c&position=2&recommendation_type=same_repo&otherRecs=55614407,55635702,55607961,55613627,2255664
  11. "RODA Community - Repository of Authentic Digital Objects".
  12. 12.0 12.1 "db-preservation-toolkit by keeps".
  13. Heuscher, Stephan; Jaermann, Stephan; Keller-Marxer, Peter; Moehle, Frank (2004). "Providing Authentic Long-term Archival Access to Complex Relational Data". Proceedings PV-2004: Ensuring the Long-Term Preservation and Adding Value to the Scientific and Technical Data, 5-7 October 2004. pp. 241–261. arXiv:cs/0408054. Bibcode:2004cs........8054H.
  14. "RODA and Crib: A Service-Oriented Digital Repository" (PDF).
  15. "Duurzaam beheer van digitaal archiefmateriaal - Nationaal Archief" (PDF).
  16. "LOCKSS - बहुत सारी प्रतियां सामान को सुरक्षित रखती हैं". Stanford University. Retrieved April 16, 2017.
  17. Ribeiro, C., & David, G. (2009, March 11). Database preservation. Digital Preservation Europe. https://digitalpreservationeurope.eu/publications/briefs/database_preservation_ribiero_david.pdf