डेटा परिवर्तन (कंप्यूटिंग)

From alpha
Jump to navigation Jump to search

कंप्यूटिंग में, डेटा ट्रांसफ़ॉर्मेशन डेटा को एक प्रारूप या संरचना से दूसरे प्रारूप या संरचना में परिवर्तित करने की प्रक्रिया है। यह अधिकांश डेटा एकीकरण का एक मूलभूत पहलू है[1] और डेटा प्रबंधन कार्य जैसे डेटा की गड़बड़ी, डेटा भण्डारण, डेटा एकीकरण और एप्लिकेशन एकीकरण।

स्रोत (प्रारंभिक) डेटा और लक्ष्य (अंतिम) डेटा के बीच डेटा में आवश्यक परिवर्तनों के आधार पर डेटा परिवर्तन सरल या जटिल हो सकता है। डेटा परिवर्तन आम तौर पर मैन्युअल और स्वचालित चरणों के मिश्रण के माध्यम से किया जाता है।[2] डेटा परिवर्तन के लिए उपयोग किए जाने वाले उपकरण और प्रौद्योगिकियां रूपांतरित किए जा रहे डेटा के प्रारूप, संरचना, जटिलता और मात्रा के आधार पर व्यापक रूप से भिन्न हो सकती हैं।

मास्टर डेटा रीकास्ट डेटा ट्रांसफ़ॉर्मेशन का दूसरा रूप है जहां डेटाबेस से डेटा निकाले बिना डेटा मानों के पूरे डेटाबेस को रूपांतरित या रीकास्ट किया जाता है। एक अच्छी तरह से डिज़ाइन किए गए डेटाबेस में सभी डेटा प्रत्यक्ष या अप्रत्यक्ष रूप से विदेशी कुंजी बाधाओं के नेटवर्क द्वारा मास्टर डेटाबेस तालिकाओं के सीमित सेट से संबंधित होते हैं। प्रत्येक विदेशी कुंजी बाधा मूल डेटाबेस तालिका से एक अद्वितीय डेटाबेस सूचकांक पर निर्भर है। इसलिए, जब उचित मास्टर डेटाबेस तालिका को एक अलग अद्वितीय सूचकांक के साथ पुनर्गठित किया जाता है, तो प्रत्यक्ष और अप्रत्यक्ष रूप से संबंधित डेटा को भी पुनर्गठित या पुनर्स्थापित किया जाता है। प्रत्यक्ष और अप्रत्यक्ष रूप से संबंधित डेटा को अभी भी मूल रूप में देखा जा सकता है क्योंकि मूल अद्वितीय सूचकांक अभी भी मास्टर डेटा के साथ मौजूद है। साथ ही, डेटाबेस का पुनर्निर्माण इस तरह से किया जाना चाहिए कि अनुप्रयोग वास्तुकला सॉफ़्टवेयर पर कोई प्रभाव न पड़े।

जब डेटा मैपिंग एक मध्यस्थ डेटा मॉडल के माध्यम से अप्रत्यक्ष होती है, तो प्रक्रिया को डेटा मध्यस्थता भी कहा जाता है।

डेटा परिवर्तन प्रक्रिया

डेटा परिवर्तन को निम्नलिखित चरणों में विभाजित किया जा सकता है, प्रत्येक आवश्यक परिवर्तन की जटिलता के आधार पर आवश्यकतानुसार लागू होता है।

ये कदम अक्सर डेवलपर्स या तकनीकी डेटा विश्लेषकों का ध्यान केंद्रित करते हैं जो अपने कार्यों को करने के लिए कई विशेष उपकरणों का उपयोग कर सकते हैं।

चरणों का वर्णन इस प्रकार किया जा सकता है:

डेटा परिवर्तन प्रक्रिया में डेटा खोज पहला कदम है। आमतौर पर डेटा की संरचना और विशेषताओं को बेहतर ढंग से समझने और यह तय करने के लिए कि इसे कैसे रूपांतरित करने की आवश्यकता है, डेटा को प्रोफाइलिंग टूल का उपयोग करके या कभी-कभी मैन्युअल रूप से लिखी गई प्रोफाइलिंग स्क्रिप्ट का उपयोग करके प्रोफाइल किया जाता है।

डेटा मैपिंग यह परिभाषित करने की प्रक्रिया है कि अंतिम वांछित आउटपुट उत्पन्न करने के लिए व्यक्तिगत फ़ील्ड को कैसे मैप किया जाता है, संशोधित किया जाता है, जोड़ा जाता है, फ़िल्टर किया जाता है, एकत्रित किया जाता है आदि। डेवलपर्स या तकनीकी डेटा विश्लेषक पारंपरिक रूप से डेटा मैपिंग करते हैं क्योंकि वे परिवर्तन नियमों को परिभाषित करने के लिए विशिष्ट तकनीकों में काम करते हैं (उदाहरण के लिए विज़ुअल एक्सट्रैक्ट, ट्रांसफ़ॉर्म, लोड टूल,[3] परिवर्तन भाषाएँ)।

कोड जनरेशन निष्पादन योग्य कोड (जैसे SQL, पायथन, आर, या अन्य निष्पादन योग्य निर्देश) उत्पन्न करने की प्रक्रिया है जो वांछित और परिभाषित डेटा मैपिंग नियमों के आधार पर डेटा को बदल देगा।[4] आमतौर पर, डेटा परिवर्तन प्रौद्योगिकियां इस कोड को उत्पन्न करती हैं[5] डेवलपर्स द्वारा परिभाषित परिभाषाओं या मेटाडेटा के आधार पर।

कोड निष्पादन वह चरण है जिसके तहत वांछित आउटपुट बनाने के लिए उत्पन्न कोड को डेटा के विरुद्ध निष्पादित किया जाता है। निष्पादित कोड को ट्रांसफ़ॉर्मेशन टूल में कसकर एकीकृत किया जा सकता है, या जेनरेट किए गए कोड को मैन्युअल रूप से निष्पादित करने के लिए डेवलपर द्वारा अलग-अलग चरणों की आवश्यकता हो सकती है।

डेटा समीक्षा प्रक्रिया का अंतिम चरण है, जो यह सुनिश्चित करने पर केंद्रित है कि आउटपुट डेटा परिवर्तन आवश्यकताओं को पूरा करता है। यह आमतौर पर व्यावसायिक उपयोगकर्ता या डेटा का अंतिम अंतिम-उपयोगकर्ता होता है जो इस चरण को निष्पादित करता है। डेटा में कोई भी विसंगति या त्रुटि जो पाई जाती है और परिवर्तन प्रक्रिया में लागू की जाने वाली नई आवश्यकताओं के रूप में डेवलपर या डेटा विश्लेषक को वापस भेजी जाती है।[1]


डेटा परिवर्तन के प्रकार

बैच डेटा परिवर्तन

परंपरागत रूप से, डेटा परिवर्तन एक थोक या बैच प्रक्रिया रही है,[6] जिससे डेवलपर्स डेटा एकीकरण उपकरण में कोड लिखते हैं या परिवर्तन नियम लागू करते हैं, और फिर उस कोड या उन नियमों को बड़ी मात्रा में डेटा पर निष्पादित करते हैं।[7] यह प्रक्रिया उपरोक्त डेटा परिवर्तन प्रक्रिया में वर्णित चरणों के रैखिक सेट का अनुसरण कर सकती है।

बैच डेटा परिवर्तन वस्तुतः सभी डेटा एकीकरण प्रौद्योगिकियों जैसे डेटा वेयरहाउसिंग, डेटा माइग्रेशन और एप्लिकेशन एकीकरण की आधारशिला है।[1]

जब डेटा को कम विलंबता के साथ परिवर्तित और वितरित किया जाना चाहिए, तो "माइक्रोबैच" शब्द का उपयोग अक्सर किया जाता है।[6] यह डेटा के छोटे बैचों (उदाहरण के लिए पंक्तियों की एक छोटी संख्या या डेटा ऑब्जेक्ट्स का छोटा सेट) को संदर्भित करता है जिसे बहुत तेज़ी से संसाधित किया जा सकता है और ज़रूरत पड़ने पर लक्ष्य सिस्टम तक पहुंचाया जा सकता है।

बैच डेटा परिवर्तन के लाभ

पारंपरिक डेटा परिवर्तन प्रक्रियाओं ने दशकों से कंपनियों को अच्छी सेवा प्रदान की है। विभिन्न उपकरण और प्रौद्योगिकियाँ (डेटा प्रोफाइलिंग, डेटा विज़ुअलाइज़ेशन, डेटा क्लींजिंग, डेटा एकीकरण आदि) परिपक्व हो गई हैं और अधिकांश (यदि सभी नहीं) उद्यम भारी मात्रा में डेटा को परिवर्तित करते हैं जो आंतरिक और बाहरी अनुप्रयोगों, डेटा वेयरहाउस और अन्य डेटा स्टोर को फ़ीड करते हैं।[8]


पारंपरिक डेटा परिवर्तन की सीमाएँ

इस पारंपरिक प्रक्रिया की भी सीमाएँ हैं जो इसकी समग्र दक्षता और प्रभावशीलता में बाधा डालती हैं।[1][2][7]

जिन लोगों को डेटा का उपयोग करने की आवश्यकता होती है (उदाहरण के लिए व्यावसायिक उपयोगकर्ता) वे डेटा परिवर्तन प्रक्रिया में प्रत्यक्ष भूमिका नहीं निभाते हैं।[9] आमतौर पर, उपयोगकर्ता डेटा परिवर्तन कार्य उन डेवलपर्स को सौंपते हैं जिनके पास परिवर्तनों को परिभाषित करने और उन्हें डेटा पर निष्पादित करने के लिए आवश्यक कोडिंग या तकनीकी कौशल होते हैं।[8]

यह प्रक्रिया आवश्यक परिवर्तनों को परिभाषित करने का अधिकांश काम डेवलपर पर छोड़ देती है, जिसके पास अक्सर व्यावसायिक उपयोगकर्ता के समान डोमेन ज्ञान नहीं होता है। डेवलपर व्यावसायिक उपयोगकर्ता आवश्यकताओं की व्याख्या करता है और संबंधित कोड/तर्क लागू करता है। इससे प्रक्रिया में (गलत व्याख्या की गई आवश्यकताओं के माध्यम से) त्रुटियां आने की संभावना है, और समाधान पर पहुंचने का समय भी बढ़ जाता है।[9][10] इस समस्या ने डेटा एकीकरण में चपलता और स्वयं-सेवा की आवश्यकता को जन्म दिया है (यानी डेटा के उपयोगकर्ता को सशक्त बनाना और उन्हें डेटा को स्वयं इंटरैक्टिव रूप से बदलने में सक्षम बनाना)।[7][10]

ऐसी कंपनियाँ हैं जो स्वयं-सेवा डेटा परिवर्तन उपकरण प्रदान करती हैं। उनका लक्ष्य वर्तमान में मौजूद तकनीकी ज्ञान और प्रक्रिया जटिलता के बिना बड़ी मात्रा में डेटा का कुशलतापूर्वक विश्लेषण, मानचित्रण और परिवर्तन करना है। जबकि ये कंपनियां पारंपरिक बैच परिवर्तन का उपयोग करती हैं, उनके उपकरण विज़ुअल प्लेटफ़ॉर्म और आसानी से दोहराई जाने वाली स्क्रिप्ट के माध्यम से उपयोगकर्ताओं के लिए अधिक अन्तरक्रियाशीलता सक्षम करते हैं।[11] फिर भी, सामग्री संचालन, तैयारी और ऑडिट प्रथाओं में अंतर के कारण कुछ संगतता समस्याएं (उदाहरण के लिए चीजों की इंटरनेट जैसे नए डेटा स्रोत पुराने टूल के साथ सही ढंग से काम नहीं कर सकते हैं) और अनुपालन सीमाएं हो सकती हैं।[12]


इंटरैक्टिव डेटा परिवर्तन

इंटरएक्टिव डेटा ट्रांसफ़ॉर्मेशन (आईडीटी)[13] एक उभरती हुई क्षमता है जो व्यावसायिक विश्लेषकों और व्यावसायिक उपयोगकर्ताओं को विज़ुअल इंटरफ़ेस के माध्यम से बड़े डेटासेट के साथ सीधे बातचीत करने की क्षमता देती है,[9]डेटा की विशेषताओं को समझें (स्वचालित डेटा प्रोफाइलिंग या विज़ुअलाइज़ेशन के माध्यम से), और डेटा के कुछ तत्वों को क्लिक करने या चुनने जैसे सरल इंटरैक्शन के माध्यम से डेटा को बदलें या सही करें।[2]

यद्यपि इंटरैक्टिव डेटा परिवर्तन बैच डेटा एकीकरण के समान डेटा एकीकरण प्रक्रिया चरणों का पालन करता है, मुख्य अंतर यह है कि चरणों का पालन आवश्यक रूप से रैखिक फैशन में नहीं किया जाता है और आमतौर पर पूरा करने के लिए महत्वपूर्ण तकनीकी कौशल की आवश्यकता नहीं होती है।[14] ऐसी कई कंपनियां हैं जो डेटा परिवर्तन के लिए इंटरैक्टिव टूल पेश करती हैं, उदाहरण के लिए ट्राइफैक्टा, एलर्टेक्स और पैक्साटा जैसे स्टार्ट-अप। उनका लक्ष्य बड़ी मात्रा में डेटा का कुशल विश्लेषण, इमेजिंग और परिवर्तन प्रदान करना है, जबकि हुड के तहत होने वाली कुछ तकनीकी जटिलताओं और प्रक्रियाओं को दूर करना है।

ऐसी कई कंपनियाँ हैं जो इंटरैक्टिव डेटा ट्रांसफ़ॉर्मेशन टूल प्रदान करती हैं, उदाहरण के लिए स्टार्ट-अप ट्राइफैक्टा, एलर्टेक्स और पैक्साटा। उनका लक्ष्य बड़ी मात्रा में डेटा का कुशलतापूर्वक विश्लेषण, मानचित्रण और परिवर्तन करना है, साथ ही साथ हुड के नीचे होने वाली कुछ तकनीकी जटिलताओं और प्रक्रियाओं को दूर करना है।

इंटरएक्टिव डेटा ट्रांसफ़ॉर्मेशन समाधान एक एकीकृत विज़ुअल इंटरफ़ेस प्रदान करता है जो डेटा विश्लेषण, डेटा मैपिंग और कोड जेनरेशन/निष्पादन और डेटा निरीक्षण के पहले के अलग-अलग चरणों को जोड़ता है।[8]अर्थात्, यदि परिवर्तन एक चरण में किए जाते हैं (उदाहरण के लिए नाम बदलना), तो सॉफ़्टवेयर स्वचालित रूप से पूर्ववर्ती या निम्नलिखित चरणों को तदनुसार अपडेट कर देता है। इंटरैक्टिव डेटा परिवर्तन के लिए इंटरफेस में डेटा में उपयोगकर्ता पैटर्न और विसंगतियों को दिखाने के लिए विज़ुअलाइज़ेशन शामिल होते हैं ताकि वे गलत या बाहरी मूल्यों की पहचान कर सकें।[9]

एक बार जब वे डेटा को बदलना समाप्त कर लेते हैं, तो सिस्टम निष्पादन योग्य कोड/तर्क उत्पन्न कर सकता है, जिसे बाद के समान डेटा सेटों पर निष्पादित या लागू किया जा सकता है।

डेवलपर को प्रक्रिया से हटाकर, इंटरैक्टिव डेटा ट्रांसफ़ॉर्मेशन सिस्टम डेटा को तैयार करने और बदलने के लिए आवश्यक समय को कम कर देता है, उपयोगकर्ता की आवश्यकताओं की व्याख्या में महंगी त्रुटियों को खत्म करता है और व्यावसायिक उपयोगकर्ताओं और विश्लेषकों को अपने डेटा को नियंत्रित करने और आवश्यकतानुसार इसके साथ बातचीत करने के लिए सशक्त बनाता है।[10]


परिवर्तनकारी भाषाएँ

डेटा परिवर्तन करने के लिए कई भाषाएँ उपलब्ध हैं। कई परिवर्तनकारी भाषाओं के लिए व्याकरण उपलब्ध कराने की आवश्यकता होती है। कई मामलों में, व्याकरण को बैकस-नौर फॉर्म (बीएनएफ) से मिलती-जुलती किसी चीज़ का उपयोग करके संरचित किया जाता है। ऐसे उद्देश्यों के लिए कई भाषाएँ उपलब्ध हैं, जो उनकी पहुंच (लागत) और सामान्य उपयोगिता में भिन्न हैं।[15] ऐसी भाषाओं के उदाहरणों में शामिल हैं:

  • AWK - सबसे पुरानी और लोकप्रिय पाठ्य डेटा परिवर्तन भाषा में से एक;
  • पर्ल - प्रक्रियात्मक और ऑब्जेक्ट-ओरिएंटेड सिंटैक्स वाली एक उच्च-स्तरीय भाषा, जो बाइनरी या टेक्स्ट डेटा पर शक्तिशाली संचालन में सक्षम है।
  • वेब टेम्पलेट - डेटा को दस्तावेज़ों में बदलने के लिए विशेषीकृत (टेम्पलेट प्रोसेसर भी देखें);
  • TXL (प्रोग्रामिंग भाषा) - प्रोटोटाइप भाषा-आधारित विवरण, स्रोत कोड या डेटा परिवर्तन के लिए उपयोग किया जाता है।
  • XSLT - मानक XML डेटा परिवर्तन भाषा (कई अनुप्रयोगों में XQuery द्वारा उपयुक्त);

इसके अतिरिक्त, ट्राइफैक्टा और पैक्साटा जैसी कंपनियों ने डेटासेट की सर्विसिंग और ट्रांसफॉर्मेशन के लिए डोमेन-विशिष्ट परिवर्तनकारी भाषाएं (डीएसएल) विकसित की हैं। डोमेन-विशिष्ट भाषाओं के विकास को गैर-तकनीकी उपयोगकर्ताओं के लिए बढ़ी हुई उत्पादकता और पहुंच से जोड़ा गया है।[16] ट्राइफैक्टा की "रैंगल" ऐसी डोमेन विशिष्ट भाषा का एक उदाहरण है।[17] हाल की डोमेन-विशिष्ट परिवर्तनकारी भाषाओं की प्रवृत्ति का एक अन्य लाभ यह है कि एक डोमेन-विशिष्ट परिवर्तनकारी भाषा डोमेन-विशिष्ट परिवर्तनकारी भाषा में परिभाषित तर्क के अंतर्निहित निष्पादन को अमूर्त कर सकती है। वे उसी तर्क का उपयोग विभिन्न प्रसंस्करण इंजनों, जैसे SPARK (प्रोग्रामिंग भाषा), MapReduce, और Microsoft Dataflow में भी कर सकते हैं। दूसरे शब्दों में, एक डोमेन-विशिष्ट परिवर्तनकारी भाषा के साथ, परिवर्तन भाषा अंतर्निहित इंजन से बंधी नहीं होती है।[17]

हालाँकि परिवर्तनकारी भाषाएँ आम तौर पर परिवर्तन के लिए सबसे उपयुक्त होती हैं, उपयोगी परिवर्तन प्राप्त करने के लिए नियमित अभिव्यक्ति जैसी सरल चीज़ का उपयोग किया जा सकता है। [[ विम (पाठ संपादक) ]], इमैक या टेक्स्टपैड जैसा टेक्स्ट एडिटर तर्कों के साथ नियमित अभिव्यक्तियों के उपयोग का समर्थन करता है। इससे किसी विशेष पैटर्न के सभी उदाहरणों को मूल पैटर्न के कुछ हिस्सों का उपयोग करके दूसरे पैटर्न से प्रतिस्थापित किया जा सकेगा। उदाहरण के लिए: <पूर्व> foo (कुछ स्ट्रिंग, 42, gCommon); बार (someObj, अन्यObj);

foo (एक और स्ट्रिंग, 24, gCommon); बार (myObj, myOtherObj); </पूर्व> क्या दोनों को अधिक संक्षिप्त रूप में बदला जा सकता है जैसे:

फ़ूबार (कुछ स्ट्रिंग, 42, कुछओबीजे, अन्यओबीजे);
foobar (एक और स्ट्रिंग, 24, myObj, myOtherObj);

दूसरे शब्दों में, तीन तर्कों के साथ foo के एक फ़ंक्शन इनवोकेशन के सभी उदाहरण, इसके बाद दो तर्कों के साथ एक फ़ंक्शन इनवोकेशन को तर्कों के कुछ या सभी मूल सेट का उपयोग करके एकल फ़ंक्शन इनवोकेशन के साथ बदल दिया जाएगा।

रेगुलर एक्सप्रेशन का उपयोग करने का एक अन्य लाभ यह है कि वे अशक्त परिवर्तन परीक्षण में विफल नहीं होंगे। अर्थात्, अपनी पसंद की परिवर्तनकारी भाषा का उपयोग करके, एक ऐसे परिवर्तन के माध्यम से एक नमूना कार्यक्रम चलाएँ जो कोई परिवर्तन नहीं करता है। कई परिवर्तनकारी भाषाएँ इस परीक्षण में विफल हो जाएँगी।

यह भी देखें

संदर्भ

  1. 1.0 1.1 1.2 1.3 CIO.com. Agile Comes to Data Integration. Retrieved from: https://www.cio.com/article/2378615/data-management/agile-comes-to-data-integration.html Archived 2017-08-29 at the Wayback Machine
  2. 2.0 2.1 2.2 DataXFormer. Morcos, Abedjan, Ilyas, Ouzzani, Papotti, Stonebraker. An interactive data transformation tool. Retrieved from: http://livinglab.mit.edu/wp-content/uploads/2015/12/DataXFormer-An-Interactive-Data-Transformation-Tool.pdf Archived 2019-08-05 at the Wayback Machine
  3. DWBIMASTER. Top 10 ETL Tools. Retrieved from: http://dwbimaster.com/top-10-etl-tools/ Archived 2017-08-29 at the Wayback Machine
  4. Petr Aubrecht, Zdenek Kouba. Metadata driven data transformation. Retrieved from: http://labe.felk.cvut.cz/~aubrech/bin/Sumatra.pdf Archived 2021-04-16 at the Wayback Machine
  5. LearnDataModeling.com. Code Generators. Retrieved from: http://www.learndatamodeling.com/tm_code_generator.php Archived 2017-08-02 at the Wayback Machine
  6. 6.0 6.1 TDWI. 10 Rules for Real-Time Data Integration. Retrieved from: https://tdwi.org/Articles/2012/12/11/10-Rules-Real-Time-Data-Integration.aspx?Page=1 Archived 2017-08-29 at the Wayback Machine
  7. 7.0 7.1 7.2 Tope Omitola, Andr´e Freitas, Edward Curry, Sean O'Riain, Nicholas Gibbins, and Nigel Shadbolt. Capturing Interactive Data Transformation Operations using Provenance Workflows Retrieved from: http://andrefreitas.org/papers/preprint_capturing%20interactive_data_transformation_eswc_highlights.pdf Archived 2016-01-31 at the Wayback Machine
  8. 8.0 8.1 8.2 The Value of Data Transformation
  9. 9.0 9.1 9.2 9.3 Morton, Kristi -- Interactive Data Integration and Entity Resolution for Exploratory Visual Data Analytics. Retrieved from: https://digital.lib.washington.edu/researchworks/handle/1773/35165 Archived 2017-09-07 at the Wayback Machine
  10. 10.0 10.1 10.2 McKinsey.com. Using Agile to Accelerate Data Transformation
  11. "क्यों स्व-सेवा तैयारी बड़े डेटा के लिए एक हत्यारा ऐप है?". Datanami. 2016-05-31. Archived from the original on 2017-09-21. Retrieved 2017-09-20.
  12. Sergio, Pablo (2022-05-27). "डेटा परिवर्तन के लिए आपकी व्यावहारिक मार्गदर्शिका". Coupler.io Blog. Archived from the original on 2022-05-17. Retrieved 2022-07-08.
  13. Tope Omitola , Andr´e Freitas , Edward Curry , Sean O’Riain , Nicholas Gibbins , and Nigel Shadbolt. Capturing Interactive Data Transformation Operations using Provenance Workflows Retrieved from: http://andrefreitas.org/papers/preprint_capturing%20interactive_data_transformation_eswc_highlights.pdf Archived 2016-01-31 at the Wayback Machine
  14. Peng Cong, Zhang Xiaoyi. Research and Design of Interactive Data Transformation and Migration System for Heterogeneous Data Sources. Retrieved from: https://ieeexplore.ieee.org/document/5211525/ Archived 2018-06-07 at the Wayback Machine
  15. DMOZ. Extraction and Transformation. Retrieved from: https://dmoztools.net/Computers/Software/Databases/Data_Warehousing/Extraction_and_Transformation/ Archived 2017-08-29 at the Wayback Machine
  16. "रैंगल लैंग्वेज - ट्राइफैक्टा रैंगलर - ट्राइफैक्टा डॉक्यूमेंटेशन". docs.trifacta.com. Archived from the original on 2017-09-21. Retrieved 2017-09-20.
  17. 17.0 17.1 Kandel, Joe Hellerstein, Sean. "Advantages of a Domain-Specific Language Approach to Data Transformation - Strata + Hadoop World in New York 2014". conferences.oreilly.com. Archived from the original on 2017-09-21. Retrieved 2017-09-20.


बाहरी संबंध