नेचुरल लैंग्वेज यूजर इंटरफेस

From alpha
Jump to navigation Jump to search

नेचुरल लैंग्वेज यूजर इंटरफेस (एलयूआई या एनएलयूआई) एक प्रकार का यूजर इंटरफेस होता है जहां लैंग्वेज जैसे क्रियाएं, वाक्यांश और सॉफ्टवेयर अनुप्रयोगों में डेटा बनाने, चुनने और संशोधित करने के लिए यूआई नियंत्रण के रूप में कार्य करते है।

इंटरफेस प्रारूप में, नेचुरल-लैंग्वेज इंटरफेस की मांग उनकी गति और उपयोग में आसानी के लिए की जाती है, लेकिन अधिकांश को नेचुरल लैंग्वेज में अर्थ संबंधी अस्पष्टता की व्यापक प्रकारों को समझने में कठिनाइयों का सामना करना पड़ता है।[1] नेचुरल-लैंग्वेज इंटरफेस नेचुरल-लैंग्वेज प्रसंस्करण और कम्प्यूटेशनल लैंग्वेज विज्ञान के क्षेत्र में अध्ययन का एक सक्रिय क्षेत्र होता है। एक सहज सामान्य नेचुरल-लैंग्वेज इंटरफेस सेमांटिक वेब के सक्रिय लक्ष्यों में से एक होता है।

टेक्स्ट इंटरफेस अलग-अलग डिग्री के लिए स्वाभाविक होते है। कई औपचारिक (अनेचुरल) प्रोग्रामिंग लैंग्वेज में नेचुरल मानव लैंग्वेज के मुहावरे सम्मलित होते है। इसी तरह, एक पारंपरिक कीवर्ड सर्च इंजन को एक नेचुरल लैंग्वेज यूजर इंटरफेस के रूप में वर्णित किया जा सकता है।

अवलोकन

एक नेचुरल-लैंग्वेज सर्च इंजन सैद्धांतिक रूप से लक्षित प्रश्न का उत्तर प्राप्त करता है (कीवर्ड सर्च के विपरीत)। उदाहरण के लिए, जब यू.एस.' फॉर्म के प्रश्न का सामना किया जाता है। किस राज्य में सबसे अधिक आयकर है?', पारंपरिक सर्च इंजन इस प्रश्न को अनदेखा कर देते है और इसके अतिरिक्त सूचकांक शब्द 'राज्य', 'आय' और 'कर' पर सर्च करते है। दूसरी ओर, नेचुरल-लैंग्वेज सर्च, प्रश्न की प्रकृति को समझने के लिए नेचुरल-लैंग्वेज प्रसंस्करण का उपयोग करने का प्रयास करती है और फिर वेब के एक सबसेट को सर्च करने और वापस करने का प्रयास करती है जिसमें प्रश्न का उत्तर होता है। यदि यह काम करता है, तो प्रश्न सम्मलित होने के कारण, परिणाम कीवर्ड सर्च इंजन के परिणामों की तुलना में अधिक प्रासंगिक होते है।

इतिहास

प्रोटोटाइप एनएल इंटरफेस साठ के दशक के अंत और सत्तर के दशक के प्रारंभ में पहले ही सामने आ चुके थे।[2]

  • SHRDLU, एक नेचुरल-लैंग्वेज इंटरफेस होता है जो वर्चुअल दुनिया में बदलाव करता है।
  • लूनर, विलियम ए. वुड्स द्वारा अपोलो 11 चंद्रमा की चट्टानों के रासायनिक विश्लेषण वाले डेटाबेस के लिए एक नेचुरल-लैंग्वेज इंटरफेस है।
  • चैट-80 ने अंग्रेजी प्रश्नों को प्रोलॉग अभिव्यक्तियों में बदल दिया था, जिनका मूल्यांकन प्रोलॉग डेटाबेस के आधार पर किया गया था। चैट-80 का कोड व्यापक रूप से प्रसारित किया गया था, और कई अन्य प्रयोगात्मक एनएल इंटरफेस का आधार बना था। एलपीए वेबसाइट पर एक ऑनलाइन डेमो उपलब्ध है।[3]
  • 1964 और 1966 के बीच जोसफ वेइजेनबाम द्वारा एमआईटी में लिखी गई एलिजा, एक मनोचिकित्सक की नकल करती थी और स्क्रिप्ट के प्रति यूजरओं की प्रतिक्रियाओं को संसाधित करके संचालित की जाती थी। मानव विचार या भावना के बारे में लगभग कोई जानकारी नहीं होने के कारण, DOCTOR स्क्रिप्ट कभी-कभी आश्चर्यजनक रूप से मानव जैसी बातचीत प्रदान करती है। एलपीए वेबसाइट पर एक ऑनलाइन डेमो उपलब्ध है।[4]
  • जानूस भी अस्थायी प्रश्नों का समर्थन करने वाली कुछ प्रणालियों में से एक है।
  • ट्रिंज़िक से इंटेलेक्ट (AICorp और Aion के विलय से गठित)।
  • बीबीएन की लैंग्वेज रुस और इरस सिस्टम के विकास के अनुभव पर आधारित है।
  • आईबीएम लैंग्वेज एक्सेस
  • Q&A (सॉफ़्टवेयर) NortonLifeLock से प्रश्नोत्तर।
  • नेचुरल लैंग्वेज इंक।
  • बीआईएम सिस्टम।
  • लैरी हैरिस (कंप्यूटर वैज्ञानिक)

कठिनाइयां

नेचुरल-लैंग्वेज इंटरफेस ने अतीत में यूजरओं को कंप्यूटर का मानवीकरण करने, या कम से कम मशीनों को आवश्यकता से अधिक बुद्धिमत्ता का श्रेय देने के लिए प्रेरित किया था। यूजर की ओर से, इससे सिस्टम की क्षमताओं के बारे में अवास्तविक उम्मीदें उत्पन्न हो गई थी। यदि यूजर इसे बहुत अधिक क्षमता का श्रेय देते है तो ऐसी अपेक्षाओं से सिस्टम के प्रतिबंधों को सीखना कठिन हो जाता है, और अंततः निराशा होती है जब सिस्टम उम्मीद के समान प्रदर्शन करने में विफल हो जाता है जैसा कि 1970 और 80 के दशक की एआई में हुआ था।

एक 1995 पेपर जिसका शीर्षक 'डेटाबेस के लिए नेचुरल लैंग्वेज इंटरफेस - एक परिचय' है, कुछ कठिनाइयों का वर्णन करता है:[2] संशोधक अनुलग्नक

अनुरोध कंपनी में ड्राइविंग लाइसेंस वाले सभी कर्मचारियों की सूची अस्पष्ट होती है जब तक कि आप नहीं जानते कि कंपनियों के पास ड्राइविंग लाइसेंस नहीं हो सकता है।
संयोजन और विच्छेद
कैलिफ़ोर्निया और एरिज़ोना में रहने वाले सभी आवेदकों की सूची अस्पष्ट होती है जब तक कि आप नहीं जानते कि एक व्यक्ति एक साथ दो स्थानों पर नहीं रह सकता है।
अनाफोरा संकल्प
स्वयं-संदर्भित क्वेरी में यह हल करता है कि यूजर का 'वह', 'वह' या 'यह' से क्या मतलब है।

सामान्यतः विचार करने के लिए अन्य लक्ष्य इंटरफेस की गति और दक्षता एल्गोरिदम में ये दो बिंदु मुख्य बिंदु होते है जो यह निर्धारित करते है कि क्या कुछ विधियां दूसरों की तुलना में बेहतर है और इसलिए बाजार में अधिक सफलता है। इसके अतिरिक्त, कई लैंग्वेज साइटों पर स्थानीयकरण के लिए अतिरिक्त विचार की आवश्यकता होती है - यह अधिकांश लैंग्वेज के बीच अलग-अलग वाक्य संरचना और लैंग्वेज वाक्यविन्यास भिन्नता पर आधारित है।

अंत में, उपयोग की जाने वाली विधियों के संबंध में, हल की जाने वाली मुख्य समस्या एक सामान्य एल्गोरिदम बनाता है जो राष्ट्रीयता, लिंग या उम्र की परवाह किए बिना, विभिन्न आवाज़ों के पूरे स्पेक्ट्रम को पहचान सकता है। निकाली गई विशेषताओं के बीच महत्वपूर्ण अंतर, यहां तक ​​कि एक ही शब्द या वाक्यांश कहने वाले वक्ताओं से भी सफलतापूर्वक दूर किया जा सकता है।

उपयोग और अनुप्रयोग

नेचुरल-लैंग्वेज इंटरफेस कई अलग-अलग अनुप्रयोगों के लिए उपयोग की जाने वाली तकनीक को उत्पन्न करता है।

कुछ मुख्य उपयोग है:

  • डिक्टेशन, स्वचालित वाक् पहचान (एएसआर) सिस्टम के लिए सबसे सामान्य उपयोग है। इसमें मेडिकल ट्रांसक्रिप्शन, व्यावसायिक श्रुतलेख और सामान्य शब्द प्रसंस्करण सम्मलित है। कुछ स्थितियों में सिस्टम की त्रुटिहीनता बढ़ाने के लिए विशेष शब्दावलियों का उपयोग किया जाता है।
  • कमांड और कंट्रोल, एएसआर सिस्टम पर कार्य और क्रियाएं करने के लिए डिज़ाइन किए गए है, उन्हें कमांड और कंट्रोल सिस्टम के रूप में परिभाषित किया गया है।
  • टेलीफोनी, कुछ पीबीएक्स/स्वर का मेल सिस्टम कॉल करने वालों को विशिष्ट टोन भेजने के लिए बटन दबाने के अतिरिक्त कमांड बोलने की अनुमति देते है।
  • पहनने योग्य उपकरण के लिए इनपुट सीमित होता है, इसलिए बोलना एक स्वाभाविक संभावना होती है।
  • चिकित्सा, विकलांगता, कई लोगों को शारीरिक सीमाओं जैसे दोहरावदार तनाव चोटों (आरएसआई), मस्कुलर डिस्ट्रॉफी और कई अन्य के कारण टाइपिंग में कठिनाई होती है। उदाहरण के लिए, सुनने में कठिनाई वाले लोग कॉल करने वाले के भाषण को टेक्स्ट में बदलने के लिए अपने टेलीफोन से जुड़े सिस्टम का उपयोग कर सकते है।
  • एंबेडेड एप्लिकेशन, कुछ नए सेल्यूलर फोन में C&C वाक् पहचान सम्मलित होती है जो घर पर कॉल करने की अनुमति देती है। स्वचालित वाक् पहचान और लिनक्स के भविष्य में यह एक प्रमुख कारक हो सकता है।

नीचे कुछ ऐसे अनुप्रयोगों के नाम और परिलैंग्वेज दी गई है जो नेचुरल-लैंग्वेज पहचान का उपयोग करते है।

सर्वव्यापकता

यूबिक्विटी, मोज़िला फ़ायरफ़ॉक्स के लिए एक ऐड-ऑन (मोज़िला), त्वरित और आसान नेचुरल-लैंग्वेज-व्युत्पन्न कमांड का एक संग्रह होता है जो वेब सेवाओं के रूप में कार्य करता है, इस प्रकार यह यूजरओं को जानकारी प्राप्त करने की अनुमति देता है और इसे वर्तमान और अन्य वेबपेजों से जोड़ता है।

वुल्फ्राम अल्फा

वोल्फ्राम अल्फा एक ऑनलाइन सेवा है जो दस्तावेजों या वेब पेजों की एक सूची प्रदान करने के अतिरिक्त संरचित डेटा से उत्तर की गणना करके सीधे तथ्यात्मक प्रश्नों का उत्तर देती है, जिसमें एक सर्च इंजन के रूप में उत्तर सम्मलित हो सकते है।[5] इसकी घोषणा मार्च 2009 में स्टीफन वोल्फ्राम द्वारा की गई थी, और 15 मई 2009 को इसे जनता के लिए प्रदर्शित किया गया था।[6]

सिरी

सिरी एक बुद्धिमान व्यक्तिगत सहायक एप्लिकेशन है जो ऑपरेटिंग सिस्टम आईओएस के साथ एकीकृत है। यह एप्लिकेशन सवालों के उत्तर देने के लिए नेचुरल लैंग्वेज प्रसंस्करण का उपयोग करता है।

सिरी के विपणन प्रमाण में सम्मलित है कि यह समय के साथ यूजर की व्यक्तिगत प्राथमिकताओं को अनुकूलित करता है और परिणामों को वैयक्तिकृत करता है, और समय आरक्षण करने जैसे कार्य भी करता है।[7]

अन्य

  • Ask.com - (Ask.com) के पीछे मूल विचार पारंपरिक कीवर्ड सर्च था जिसमें, नेचुरल लैंग्वेज में पूछे गए प्रश्नों के उत्तर प्राप्त करने की क्षमता थी। गणित, शब्दकोश और रूपांतरण प्रश्नों के लिए अतिरिक्त समर्थन के साथ, वर्तमान Ask.com अभी भी इसका समर्थन करता है।
  • ब्रेना[8] - ब्रेना विंडोज़ ओएस के लिए एक नेचुरल लैंग्वेज इंटरफेस होता है जो एक निश्चित कार्य करने या जानकारी प्राप्त करने के लिए अंग्रेजी लैंग्वेज के वाक्यों को टाइप करने या बोलने की अनुमति देता है।
  • गनोम डू - गनोम वातावरण (एप्लिकेशन, इवोल्यूशन और पिजिन संपर्क, फ़ायरफ़ॉक्स बुकमार्क, रिदमबॉक्स और एल्बम इत्यादि) की विविध विरूपण को त्वरित रूप से प्राप्त करने और उन पर कार्यों को निष्पादित करने की अनुमति देता है (लॉन्च, ओपन, ईमेल, चैट, प्ले इत्यादि)।[9]
GNOME DO क्लासिक इंटरफेस का स्क्रीनशॉट
  • हकिया - हाकिया एक इंटरनेट सर्च इंजन था। कंपनी ने अनुक्रमण के लिए एक वैकल्पिक नए प्रतिरूप का आविष्कार किया था जिसमें सिमेंटिकरैंक एल्गोरिदम का उपयोग किया गया था, जो ऑन्टोलॉजिकल सिमेंटिक्स, फ़ज़ी लॉजिक, कम्प्यूटेशनल लैंग्वेजविज्ञान और गणित के विषयों का एक समाधान मिश्रण है। हाकिया 2014 में बंद हो गया था।
  • लेक्से - लेक्से एक इंटरनेट सर्च इंजन था जो प्रश्नों (सिमेंटिक सर्च) के लिए नेचुरल-लैंग्वेज प्रसंस्करण का उपयोग करता था। इसका उपयोग सर्च शब्दों, वाक्यांशों और प्रश्नों से किया जाता था, जैसे कि विकिपीडिया कितना पुराना है? लेक्से ने 2015 में अपनी सर्च इंजन सेवाएँ बंद कर दी थी।
  • पिकिमल - पिकिमल ने टेम्प्लेट द्वारा सर्च करने के लिए यूजर की प्राथमिकता से जुड़ी नेचुरल लैंग्वेज का उपयोग किया था। पिकिमल 2015 में बंद हो गया था।
  • पॉवरसेट (कंपनी) - 11 मई 2008 को, कंपनी ने कीवर्ड के अतिरिक्त संवादी वाक्यांशों का उपयोग करके विकिपीडिया के एक निश्चित उपसमूह को सर्च करने के लिए एक टूल का अनावरण किया था।[10] 1 जुलाई 2008 को इसे माइक्रोसॉफ्ट द्वारा खरीद लिया गया था।[11]
  • क्यू-गो - क्यू-गो तकनीक किसी कंपनी की इंटरनेट वेबसाइट या कॉर्पोरेट इंट्रानेट पर प्रश्नों के उत्तर में यूजरओं को प्रासंगिक उत्तर प्रदान करती है, जो नेचुरल वाक्यों या कीवर्ड इनपुट में समान रूप से विस्तृत किए जाते है। क्यू-गो को 2011 में राइटनाउ टेक्नोलॉजीज द्वारा अधिग्रहित किया गया था।
  • येबोल - येबोल एक ऊर्ध्वाधर निर्णय सर्च इंजन था जिसने एक ज्ञान-आधारित, अर्थ संबंधी सर्च मंच विकसित किया गया था। येबोल की कृत्रिम बुद्धिमत्ता मानव बुद्धि-संक्रमित एल्गोरिदम स्वचालित रूप से सर्च परिणामों, वेब साइटों, पृष्ठों और सामग्री को क्लस्टर और वर्गीकृत करती है जो इसे एक दृश्य अनुक्रमित प्रारूप में प्रस्तुत करती है जो प्रारंभिक मानव स्थितयों के साथ अधिक संरेखित होती है। येबोल ने संबंधित कीवर्ड या वेब पेजों का विश्लेषण करने के लिए एसोसिएशन, रैंकिंग और क्लस्टरिंग एल्गोरिदम का उपयोग किया था। येबोल ने एक वेब निर्देशिका स्थापित करने के लिए प्रत्येक क्वेरी के लिए मानव ज्ञान के साथ नेचुरल-लैंग्वेज प्रसंस्करण, मेटासिंथेटिक-इंजीनियर्ड ओपन कॉम्प्लेक्स सिस्टम और मशीन एल्गोरिदम को एकीकृत किया था, स्वचालित रूप से ज्ञान क्वेरी उत्पन्न करने के लिए सहसंबंध, क्लस्टरिंग और वर्गीकरण एल्गोरिदम का उपयोग करता है।[12]

यह भी देखें

संदर्भ

  1. Hill, I. (1983). "Natural language versus computer language." In M. Sime and M. Coombs (Eds.) Designing for Human-Computer Communication. Academic Press.
  2. 2.0 2.1 Natural Language Interfaces to Databases – An Introduction, I. Androutsopoulos, G.D. Ritchie, P. Thanisch, Department of Artificial Intelligence, University of Edinburgh
  3. "Chat-80 demo". Archived from the original on 11 November 2016. Retrieved 29 January 2018.
  4. "एलिज़ा डेमो". Archived from the original on 26 November 2016. Retrieved 29 January 2018.
  5. Johnson, Bobbie (2009-03-09). "ब्रिटिश सर्च इंजन 'Google को टक्कर दे सकता है'". The Guardian. Retrieved 2009-03-09.
  6. "एक शांत लॉन्च के लिए बहुत कुछ". Wolfram Alpha Blog. 2009-05-08. Retrieved 2009-10-20.
  7. "आईओएस - सिरी". Apple. Retrieved 29 January 2018.
  8. "ब्रेना - विंडोज़ के लिए आर्टिफिशियल इंटेलिजेंस सॉफ्टवेयर". www.brainasoft.com. Retrieved 29 January 2018.
  9. Ubuntu 10.04 Add/Remove Applications description for GNOME Do
  10. Helft, Miguel (May 12, 2008). "विकिपीडिया की खोज के साथ पॉवरसेट की शुरुआत". The New York Times.
  11. Johnson, Mark (July 1, 2008). "माइक्रोसॉफ्ट पॉवरसेट का अधिग्रहण करेगा". Powerset Blog. Archived from the original on February 25, 2009.
  12. Humphries, Matthew. "Yebol.com steps into the search market" Archived 2012-03-15 at the Wayback Machine Geek.com. 31 July 2009.