वेब विश्लेषिकी

From alpha
Jump to navigation Jump to search

वेब एनालिटिक्स वेब उपयोग को समझने और अनुकूलित करने के लिए वेब डेटा (कंप्यूटिंग) का मापन, डेटा संग्रह, विश्लेषण और रिपोर्टिंग है।[1] वेब एनालिटिक्स केवल वेब यातायात को मापने की एक प्रक्रिया नहीं है, बल्कि व्यापार और बाज़ार अनुसंधान के लिए एक उपकरण के रूप में इस्तेमाल किया जा सकता है और वेबसाइट की प्रभावशीलता का आकलन और सुधार कर सकता है। वेब विश्लेषिकी एप्लिकेशन कंपनियों को पारंपरिक प्रिंट या प्रसारण विज्ञापन अभियानों के परिणामों को मापने में भी मदद कर सकते हैं। इसका उपयोग यह अनुमान लगाने के लिए किया जा सकता है कि एक नया विज्ञापन अभियान शुरू करने के बाद वेबसाइट का ट्रैफ़िक कैसे बदलता है। वेब एनालिटिक्स किसी वेबसाइट पर विज़िटर की संख्या और पेज व्यू की संख्या के बारे में जानकारी प्रदान करता है, या उपयोगकर्ता व्यवहार प्रोफाइल बनाता है।[2] यह ट्रैफ़िक और लोकप्रियता के रुझान को मापने में मदद करता है, जो बाज़ार अनुसंधान के लिए उपयोगी है।

वेब विश्लेषिकी प्रक्रिया के मूल चरण

वेब विश्लेषिकी प्रक्रिया के मूल चरण

अधिकांश वेब विश्लेषिकी प्रक्रियाएं चार आवश्यक अवस्थाओं या चरणों तक सीमित हो जाती हैं,[3] जो हैं:

  • डेटा का संग्रह: यह चरण बुनियादी, प्राथमिक डेटा का संग्रह है। आमतौर पर, ये डेटा चीजों की गिनती होती है। इस चरण का उद्देश्य डेटा एकत्र करना है।
  • सूचना में डेटा का प्रसंस्करण: यह चरण आम तौर पर मायने रखता है और उन्हें अनुपात बनाता है, हालांकि अभी भी कुछ गणनाएं हो सकती हैं। इस चरण का उद्देश्य डेटा लेना और उसे सूचना, विशेष रूप से मेट्रिक्स में अनुरूप बनाना है।
  • केपीआई का विकास: यह चरण अनुपातों (और गणना) का उपयोग करने और उन्हें व्यावसायिक रणनीतियों के साथ जोड़ने पर केंद्रित है, जिसे प्रमुख प्रदर्शन संकेतक (केपीआई) कहा जाता है। कई बार, KPI रूपांतरण पहलुओं से निपटते हैं, लेकिन हमेशा नहीं। यह संगठन पर निर्भर करता है।
  • ऑनलाइन रणनीति तैयार करना: यह चरण संगठन या व्यवसाय के लिए ऑनलाइन लक्ष्यों, उद्देश्यों और मानकों से संबंधित है। ये रणनीतियाँ आम तौर पर पैसा बनाने, पैसे बचाने या बाज़ार में हिस्सेदारी बढ़ाने से संबंधित होती हैं।

वेबसाइटों के अनुकूलन के लिए विश्लेषकों द्वारा विकसित एक अन्य आवश्यक कार्य प्रयोग हैं

  • प्रयोग और परीक्षण: A/B परीक्षण एक नियंत्रित प्रयोग है, जिसमें ऑनलाइन सेटिंग में, जैसे कि वेब विकास, दो प्रकार होते हैं।

ए/बी परीक्षण का लक्ष्य उन वेब पेजों में परिवर्तनों की पहचान करना और सुझाव देना है जो रुचि के सांख्यिकीय रूप से परीक्षण किए गए परिणाम के प्रभाव को बढ़ाते हैं या अधिकतम करते हैं।

प्रत्येक चरण प्रभाव डालता है या प्रभावित कर सकता है (यानी, ड्राइव) इससे पहले या बाद के चरण। इसलिए, कभी-कभी संग्रह के लिए उपलब्ध डेटा ऑनलाइन रणनीति को प्रभावित करता है। दूसरी बार, ऑनलाइन रणनीति एकत्रित डेटा को प्रभावित करती है।

वेब विश्लेषिकी प्रौद्योगिकियां

वेब एनालिटिक्स की कम से कम दो श्रेणियां हैं, ऑफ-साइट और ऑन-साइट वेब एनालिटिक्स।

  • 'ऑफ-साइट वेब एनालिटिक्स' वेब मापन और विश्लेषण को संदर्भित करता है, भले ही कोई व्यक्ति किसी वेबसाइट का मालिक हो या उसका रखरखाव करता हो। इसमें एक वेबसाइट के संभावित दर्शकों (अवसर), आवाज का हिस्सा (दृश्यता), और बज़ (टिप्पणियां) का माप शामिल है जो इंटरनेट पर समग्र रूप से हो रहा है।
  • 'ऑन-साइट वेब एनालिटिक्स', दोनों में से अधिक सामान्य, किसी विशिष्ट वेबसाइट पर एक बार विज़िटर के व्यवहार को मापता है। इसमें इसके चालक और रूपांतरण शामिल हैं; उदाहरण के लिए, वह सीमा जिस तक विभिन्न लैंडिंग पृष्ठ ऑनलाइन खरीदारी से संबद्ध हैं. ऑन-साइट वेब एनालिटिक्स व्यावसायिक संदर्भ में किसी विशिष्ट वेबसाइट के प्रदर्शन को मापता है। इस डेटा की तुलना आमतौर पर प्रदर्शन के प्रमुख प्रदर्शन संकेतकों से की जाती है और इसका उपयोग वेबसाइट या मार्केटिंग अभियान के दर्शकों की प्रतिक्रिया को बेहतर बनाने के लिए किया जाता है। Google Analytics|Google Analytics और Adobe Analytics सबसे व्यापक रूप से उपयोग की जाने वाली ऑन-साइट वेब विश्लेषिकी सेवा हैं; हालाँकि नए उपकरण उभर रहे हैं जो गर्मी के नक्शे ्स और सत्र फिर से खेलना सहित जानकारी की अतिरिक्त परतें प्रदान करते हैं।

ऐतिहासिक रूप से, वेब विश्लेषिकी का उपयोग ऑन-साइट विज़िटर मापन को संदर्भित करने के लिए किया गया है। हालाँकि, यह अर्थ धुंधला हो गया है, मुख्यतः क्योंकि विक्रेता ऐसे उपकरण बना रहे हैं जो दोनों श्रेणियों को फैलाते हैं। कई अलग-अलग विक्रेता वेब एनालिटिक्स सॉफ़्टवेयर की ऑन-साइट वेब विश्लेषिकी सॉफ्टवेयर की सूची की सूची प्रदान करते हैं#होस्टेड .2F सॉफ़्टवेयर एक सेवा के रूप में। डेटा एकत्र करने के दो मुख्य तकनीकी तरीके हैं। पहला और पारंपरिक तरीका, सर्वर लॉग फ़ाइल विश्लेषण, सर्वर लॉग को पढ़ता है जिसमें वेब सर्वर ब्राउज़र द्वारा फ़ाइल अनुरोधों को रिकॉर्ड करता है। दूसरी विधि, टैग (मेटाडेटा), जब भी किसी वेब ब्राउज़र द्वारा वेबपेज प्रस्तुत किया जाता है, या यदि वांछित हो, जब माउस क्लिक होता है, तो तीसरे पक्ष के एनालिटिक्स-समर्पित सर्वर के लिए छवि अनुरोध करने के लिए वेबपेज में एम्बेडेड जावास्क्रिप्ट का उपयोग करता है। दोनों डेटा एकत्र करते हैं जिसे वेब ट्रैफ़िक रिपोर्ट बनाने के लिए संसाधित किया जा सकता है।

वेब विश्लेषिकी डेटा स्रोत

वेब एनालिटिक्स का मूल लक्ष्य वेब ट्रैफिक और उपयोग पैटर्न से संबंधित डेटा एकत्र करना और उसका विश्लेषण करना है। डेटा मुख्य रूप से चार स्रोतों से आता है:[4]

  1. डायरेक्ट HTTP रिक्वेस्ट डेटा: सीधे HTTP रिक्वेस्ट मैसेज (HTTP रिक्वेस्ट हेडर) से आता है।
  2. HTTP अनुरोधों से जुड़ा नेटवर्क-स्तर और सर्वर-जनित डेटा: HTTP अनुरोध का हिस्सा नहीं है, लेकिन यह सफल अनुरोध प्रसारण के लिए आवश्यक है - उदाहरण के लिए, एक अनुरोधकर्ता का आईपी पता।
  3. HTTP अनुरोधों के साथ भेजा गया एप्लिकेशन-स्तरीय डेटा: सत्र और रेफ़रल सहित एप्लिकेशन-स्तरीय प्रोग्राम (जैसे जावास्क्रिप्ट, PHP और ASP.Net) द्वारा उत्पन्न और संसाधित। ये आमतौर पर सार्वजनिक वेब विश्लेषिकी सेवाओं के बजाय आंतरिक लॉग द्वारा कैप्चर किए जाते हैं।
  4. बाहरी डेटा: ऊपर वर्णित वेबसाइट व्यवहार डेटा को बढ़ाने और वेब उपयोग की व्याख्या करने में सहायता के लिए ऑन-साइट डेटा के साथ जोड़ा जा सकता है। उदाहरण के लिए, आईपी पते आमतौर पर भौगोलिक क्षेत्रों और इंटरनेट सेवा प्रदाताओं, ई-मेल खुले और क्लिक-थ्रू दरों, प्रत्यक्ष मेल अभियान डेटा, बिक्री, लीड इतिहास, या अन्य डेटा प्रकारों से जुड़े होते हैं।

वेब सर्वर लॉग फ़ाइल विश्लेषण

वेब सर्वर अपने कुछ लेन-देन को लॉग फ़ाइल में रिकॉर्ड करते हैं। जल्द ही यह महसूस किया गया कि वेबसाइट की लोकप्रियता पर डेटा प्रदान करने के लिए इन लॉग फाइलों को एक प्रोग्राम द्वारा पढ़ा जा सकता है। इस प्रकार वेब लॉग विश्लेषण सॉफ्टवेयर उत्पन्न हुआ।

1990 के दशक की शुरुआत में, वेबसाइट के आँकड़ों में मुख्य रूप से वेब सर्वर पर किए गए क्लाइंट अनुरोधों (या हिट्स) की संख्या की गणना करना शामिल था। शुरुआत में यह एक उचित तरीका था क्योंकि प्रत्येक वेबसाइट में अक्सर एक ही HTML फ़ाइल होती थी। हालाँकि, HTML में छवियों की शुरुआत और कई HTML फ़ाइलों को फैलाने वाली वेबसाइटों के साथ, यह गणना कम उपयोगी हो गई। IPRO द्वारा 1994 में पहला सच्चा वाणिज्यिक लॉग विश्लेषक जारी किया गया था।[5] 1990 के दशक के मध्य में वेब सर्वर पर मानव गतिविधि की मात्रा को अधिक सटीक रूप से मापने के लिए माप की दो इकाइयाँ शुरू की गईं। ये पृष्ठ दृश्य और विज़िट (या सत्र) थे। एक पृष्ठ दृश्य को एक पृष्ठ के लिए वेब सर्वर से किए गए अनुरोध के रूप में परिभाषित किया गया था, जो एक ग्राफिक के विपरीत था, जबकि एक विज़िट को एक विशिष्ट पहचान वाले क्लाइंट से अनुरोधों के अनुक्रम के रूप में परिभाषित किया गया था जो एक निश्चित मात्रा में निष्क्रियता के बाद समाप्त हो गया था, आमतौर पर 30 मिनट .

1990 के दशक के अंत में वेब क्रॉलर और रोबोट के उद्भव के साथ-साथ बड़ी कंपनियों और इंटरनेट सेवा प्रदाता के लिए प्रॉक्सी सर्वर और डाइनामिक होस्ट कॉन्फिगरेशन प्रोटोकॉल ने एक वेबसाइट पर अद्वितीय मानव आगंतुकों की पहचान करना अधिक कठिन बना दिया। लॉग एनालाइज़र ने HTTP कुकी द्वारा वेब ट्रैकिंग विज़िट और ज्ञात स्पाइडर के अनुरोधों को नज़रअंदाज़ करके प्रतिक्रिया दी।[citation needed]

वेब कैश के व्यापक उपयोग ने लॉग फ़ाइल विश्लेषण के लिए एक समस्या भी पेश की। यदि कोई व्यक्ति किसी पृष्ठ पर दोबारा जाता है, तो दूसरा अनुरोध अक्सर ब्राउज़र के कैशे से पुनर्प्राप्त किया जाएगा, और इसलिए वेब सर्वर द्वारा कोई अनुरोध प्राप्त नहीं किया जाएगा। इसका अर्थ है कि साइट के माध्यम से व्यक्ति का पथ खो गया है। वेब सर्वर को कॉन्फ़िगर करके कैशिंग को पराजित किया जा सकता है, लेकिन इसका परिणाम विज़िटर के लिए खराब प्रदर्शन और सर्वर पर बड़ा भार हो सकता है।[6]


पेज टैगिंग

कैशिंग की उपस्थिति में लॉग फ़ाइल विश्लेषण की सटीकता के बारे में चिंता, और एक आउटसोर्स सेवा के रूप में वेब एनालिटिक्स को निष्पादित करने में सक्षम होने की इच्छा, दूसरी डेटा संग्रह विधि, पेज टैगिंग या वेब बीकन का नेतृत्व करती है।

1990 के दशक के मध्य में, वेब काउंटर आमतौर पर देखे जाते थे - ये एक वेब पेज में शामिल छवियां थीं, जो दर्शाती थीं कि छवि के लिए कितनी बार अनुरोध किया गया था, जो कि उस पृष्ठ पर विज़िट की संख्या का अनुमान था। 1990 के दशक के उत्तरार्ध में, यह अवधारणा एक दृश्य के बजाय एक छोटी अदृश्य छवि को शामिल करने के लिए विकसित हुई, और जावास्क्रिप्ट का उपयोग करके, छवि अनुरोध के साथ पृष्ठ और आगंतुक के बारे में कुछ जानकारी देने के लिए। इस जानकारी को तब एक वेब विश्लेषिकी कंपनी द्वारा दूरस्थ रूप से संसाधित किया जा सकता है, और व्यापक आँकड़े उत्पन्न किए जा सकते हैं।

वेब विश्लेषिकी सेवा उपयोगकर्ता को एक कुकी सौंपने की प्रक्रिया का प्रबंधन भी करती है, जो उनकी यात्रा के दौरान और बाद की यात्राओं में विशिष्ट रूप से उनकी पहचान कर सकती है। कुकी स्वीकृति दर वेबसाइटों के बीच महत्वपूर्ण रूप से भिन्न होती हैं और एकत्र किए गए और रिपोर्ट किए गए डेटा की गुणवत्ता को प्रभावित कर सकती हैं।

एक तृतीय-पक्ष डेटा संग्रह सर्वर (या यहां तक ​​कि एक इन-हाउस डेटा संग्रह सर्वर) का उपयोग करके वेबसाइट डेटा एकत्र करने के लिए उपयोगकर्ता के कंप्यूटर द्वारा संग्रह सर्वर का आईपी पता निर्धारित करने के लिए एक अतिरिक्त डोमेन की नामांकन प्रणाली लुकअप की आवश्यकता होती है। कभी-कभी, सफल या विफल डीएनएस लुकअप को पूरा करने में देरी के परिणामस्वरूप डेटा एकत्र नहीं हो पाता है।

अजाक्स (प्रोग्रामिंग)-आधारित समाधानों की बढ़ती लोकप्रियता के साथ, एक अदृश्य छवि के उपयोग का एक विकल्प प्रदान किए गए पृष्ठ से सर्वर पर कॉल बैक लागू करना है। इस मामले में, जब वेब ब्राउज़र पर पेज प्रस्तुत किया जाता है, तो जावास्क्रिप्ट कोड का एक टुकड़ा सर्वर पर वापस कॉल करेगा और क्लाइंट के बारे में जानकारी पास करेगा जिसे वेब एनालिटिक्स कंपनी द्वारा एकत्रित किया जा सकता है।

लॉगफाइल विश्लेषण बनाम पेज टैगिंग

लॉगफाइल विश्लेषण कार्यक्रम और पेज टैगिंग समाधान दोनों ही उन कंपनियों के लिए आसानी से उपलब्ध हैं जो वेब एनालिटिक्स करना चाहती हैं। कुछ मामलों में, एक ही वेब विश्लेषिकी कंपनी दोनों तरीकों की पेशकश करेगी। फिर सवाल उठता है कि कंपनी को कौन सा तरीका चुनना चाहिए। प्रत्येक दृष्टिकोण के फायदे और नुकसान हैं।[7]


लॉगफाइल विश्लेषण के लाभ

पेज टैगिंग की तुलना में लॉग फ़ाइल विश्लेषण के मुख्य लाभ इस प्रकार हैं:

  • वेब सर्वर सामान्य रूप से पहले से ही लॉग फाइल तैयार करता है, इसलिए कच्चा डेटा पहले से ही उपलब्ध है। वेबसाइट में किसी बदलाव की जरूरत नहीं है।
  • डेटा कंपनी के सर्वर पर है और एक मालिकाना, प्रारूप के बजाय एक मानक में है। इससे कंपनी के लिए बाद में प्रोग्राम बदलना, कई अलग-अलग प्रोग्राम का उपयोग करना और नए प्रोग्राम के साथ ऐतिहासिक डेटा का विश्लेषण करना आसान हो जाता है।
  • लॉग फाइलों में सर्च इंजन स्पाइडर्स से आने वाली यात्राओं की जानकारी होती है, जिन्हें आमतौर पर जावास्क्रिप्ट टैगिंग का उपयोग करके एनालिटिक्स टूल से बाहर रखा जाता है। (कुछ खोज इंजन किसी पृष्ठ पर जावास्क्रिप्ट को भी निष्पादित नहीं कर सकते हैं।) हालांकि इन्हें मानव गतिविधि के हिस्से के रूप में रिपोर्ट नहीं किया जाना चाहिए, यह खोज इंजन अनुकूलन के लिए उपयोगी जानकारी है।
  • लॉग फ़ाइलों के लिए किसी अतिरिक्त डोमेन नाम सिस्टम लुकअप या टीसीपी कंजेशन नियंत्रण की आवश्यकता नहीं है#धीमी शुरुआत। इस प्रकार कोई बाहरी सर्वर कॉल नहीं है जो पृष्ठ लोड गति को धीमा कर सकता है, या बेशुमार पृष्ठ दृश्य में परिणाम कर सकता है।
  • वेब सर्वर अपने द्वारा किए गए प्रत्येक लेन-देन को मज़बूती से रिकॉर्ड करता है, उदा. पीडीएफ दस्तावेजों और स्क्रिप्ट द्वारा उत्पन्न सामग्री की सेवा, और सहयोग करने वाले आगंतुकों के ब्राउज़रों पर भरोसा नहीं करता है।

पेज टैगिंग के फायदे

लॉग फ़ाइल विश्लेषण पर पेज टैगिंग के मुख्य लाभ इस प्रकार हैं:

  • पेज खोलकर (यह देखते हुए कि वेब क्लाइंट टैग स्क्रिप्ट चलाता है), सर्वर से अनुरोध किए बिना गिनती सक्रिय हो जाती है। यदि कोई पृष्ठ कैश किया गया है, तो इसकी गणना सर्वर-आधारित लॉग विश्लेषण द्वारा नहीं की जाएगी। कैश्ड पेज सभी पेज व्यू के एक-तिहाई तक हो सकते हैं, जो कई साइट मेट्रिक्स को नकारात्मक रूप से प्रभावित कर सकता है।[citation needed]
  • डेटा पृष्ठ में एक घटक (टैग) के माध्यम से एकत्र किया जाता है, जिसे आमतौर पर जावास्क्रिप्ट में लिखा जाता है। यह आमतौर पर एक सर्वर-साइड स्क्रिप्टिंग भाषा (जैसे PHP) के साथ संयोजन के रूप में उपयोग किया जाता है और (आमतौर पर) इसे डेटाबेस में संग्रहीत करता है।
  • स्क्रिप्ट के पास वेब क्लाइंट या उपयोगकर्ता पर अतिरिक्त जानकारी तक पहुंच हो सकती है, जिसे क्वेरी में नहीं भेजा गया है, जैसे विज़िटर के स्क्रीन आकार और उनके द्वारा खरीदे गए सामान की कीमत।
  • पेज टैगिंग उन घटनाओं की रिपोर्ट कर सकती है जिनमें वेब सर्वर के लिए अनुरोध शामिल नहीं है, जैसे कि Adobe Flash फिल्मों के भीतर बातचीत, आंशिक फॉर्म पूर्णता, माउस इवेंट जैसे onClick, onMouseOver, onFocus, onBlur, वगैरह।
  • पृष्ठ टैगिंग सेवा आगंतुकों को कुकीज़ सौंपने की प्रक्रिया का प्रबंधन करती है; लॉग फ़ाइल विश्लेषण के साथ, सर्वर को ऐसा करने के लिए कॉन्फ़िगर करना होगा।
  • पेज टैगिंग उन कंपनियों के लिए उपलब्ध है, जिनके पास अपने वेब सर्वर तक पहुंच नहीं है।
  • हाल ही में, वेब एनेलिटिक्स में पेज टैगिंग एक मानक बन गया है।[8]


आर्थिक कारक

लॉगफाइल विश्लेषण लगभग हमेशा इन-हाउस किया जाता है। पेज टैगिंग इन-हाउस की जा सकती है, लेकिन इसे अक्सर तृतीय-पक्ष सेवा के रूप में प्रदान किया जाता है। इन दो मॉडलों के बीच आर्थिक अंतर भी कंपनी के लिए एक विचार हो सकता है कि कौन सा खरीदना है।

  • लॉगफाइल विश्लेषण में आमतौर पर एक बार की सॉफ्टवेयर खरीद शामिल होती है; हालाँकि, कुछ विक्रेता अतिरिक्त जानकारी को संसाधित करने के लिए अतिरिक्त लागत के साथ अधिकतम वार्षिक पृष्ठ दृश्य पेश कर रहे हैं।[citation needed] व्यावसायिक पेशकशों के अलावा, वेब एनालिटिक्स सॉफ़्टवेयर की कई सूची#नि:शुल्क / मुक्त स्रोत (FLOSS)|ओपन-सोर्स लॉगफ़ाइल विश्लेषण उपकरण नि:शुल्क उपलब्ध हैं।
  • लॉगफाइल विश्लेषण के लिए डेटा को संग्रहित और संग्रहित किया जाना चाहिए, जो अक्सर तेजी से बढ़ता है। हालांकि ऐसा करने के लिए हार्डवेयर की लागत न्यूनतम है, आईटी विभाग के लिए ओवरहेड काफी हो सकता है।
  • लॉगफाइल विश्लेषण के लिए सॉफ्टवेयर को अपडेट और सुरक्षा पैच सहित बनाए रखने की आवश्यकता है।
  • कॉम्प्लेक्स पेज टैगिंग वेंडर वॉल्यूम के आधार पर मासिक शुल्क लेते हैं यानी प्रति माह एकत्र किए गए पेज व्यू की संख्या।

लागू करने के लिए कौन सा समाधान सस्ता है, कंपनी के भीतर तकनीकी विशेषज्ञता की मात्रा, चुने गए विक्रेता, वेबसाइटों पर देखी जाने वाली गतिविधि की मात्रा, मांगी गई जानकारी की गहराई और प्रकार, और अलग-अलग वेबसाइटों की संख्या पर निर्भर करता है, जिन्हें आंकड़ों की आवश्यकता होती है।

विक्रेता समाधान या डेटा संग्रह विधि के बावजूद, वेब विज़िटर विश्लेषण और व्याख्या की लागत भी शामिल की जानी चाहिए। यानी कच्चे डेटा को कार्रवाई योग्य जानकारी में बदलने की लागत। यह तीसरे पक्ष के सलाहकारों के उपयोग, एक अनुभवी वेब विश्लेषक की भर्ती, या एक उपयुक्त इन-हाउस व्यक्ति के प्रशिक्षण से हो सकता है। एक लागत-लाभ विश्लेषण तब किया जा सकता है। उदाहरण के लिए, वेब विज़िटर डेटा का विश्लेषण करके राजस्व में क्या वृद्धि या लागत बचत प्राप्त की जा सकती है?

हाइब्रिड तरीके

कुछ कंपनियां समाधान तैयार करती हैं जो लॉग फाइल और पेज टैगिंग दोनों के माध्यम से डेटा एकत्र करती हैं और दोनों प्रकार का विश्लेषण कर सकती हैं। एक संकर विधि का उपयोग करके, वे किसी भी विधि की तुलना में अधिक सटीक आँकड़े उत्पन्न करने का लक्ष्य रखते हैं। रूफस एविसन द्वारा 1998 में एक प्रारंभिक संकर समाधान तैयार किया गया था।[citation needed]

आगंतुकों का भौगोलिक स्थान

आईपी ​​​​जियोलोकेशन के साथ, विज़िटर्स के स्थानों को ट्रैक करना संभव है। आईपी ​​​​जियोलोकेशन डेटाबेस या एपीआई का उपयोग करके, आगंतुकों को शहर, क्षेत्र या देश स्तर पर भौगोलिक स्थान दिया जा सकता है।[9] आईपी ​​​​इंटेलिजेंस, या इंटरनेट प्रोटोकॉल (आईपी) इंटेलिजेंस, एक ऐसी तकनीक है जो इंटरनेट को मैप करती है और भौगोलिक स्थान (देश, क्षेत्र, राज्य, शहर और पोस्टकोड), कनेक्शन प्रकार, इंटरनेट सेवा प्रदाता (आईएसपी) जैसे मापदंडों द्वारा आईपी पतों को वर्गीकृत करती है। प्रॉक्सी जानकारी, और बहुत कुछ। IP इंटेलिजेंस की पहली पीढ़ी को भू लक्ष्यीकरण या जियोलोकेशन टेक्नोलॉजी के रूप में संदर्भित किया गया था। इस जानकारी का उपयोग व्यवसायों द्वारा ऑनलाइन विज्ञापन, व्यवहार लक्ष्यीकरण, सामग्री स्थानीयकरण (या वेबसाइट स्थानीयकरण), डिजिटल अधिकार प्रबंधन, वैयक्तिकरण, ऑनलाइन धोखाधड़ी का पता लगाने, स्थानीयकृत खोज, उन्नत विश्लेषिकी, वैश्विक यातायात प्रबंधन और सामग्री जैसे अनुप्रयोगों में ऑनलाइन दर्शकों के विभाजन के लिए किया जाता है। वितरण।

एनालिटिक्स पर क्लिक करें

क्लिकपाथ विश्लेषण बाईं ओर संदर्भ पृष्ठों के साथ और तीर और आयत मोटाई में भिन्न होते हैं और आंदोलन मात्रा का प्रतीक करने के लिए विस्तार करते हैं।

एनालिटिक्स पर क्लिक करें , जिसे क्लिकस्ट्रीम के नाम से भी जाना जाता है, एक विशेष प्रकार का वेब एनालिटिक्स है जो बिंदु बनाएं और क्लिक करें पर विशेष ध्यान देता है।

आमतौर पर, क्लिक एनालिटिक्स ऑन-साइट एनालिटिक्स पर केंद्रित होता है। साइट के उपयोगकर्ता क्लिक कर रहे हैं, इस संबंध में वेबसाइट का संपादक अपनी विशेष साइट के प्रदर्शन को निर्धारित करने के लिए क्लिक एनालिटिक्स का उपयोग करता है।

साथ ही, मांगी गई जानकारी के प्रकार के आधार पर, क्लिक विश्लेषण रीयल-टाइम या अवास्तविक-समय में हो सकता है। आम तौर पर, उच्च यातायात समाचार मीडिया साइटों पर फ्रंट-पेज संपादक सामग्री को अनुकूलित करने के लिए रीयल-टाइम में अपने पृष्ठों की निगरानी करना चाहेंगे। संपादक, डिज़ाइनर या अन्य प्रकार के हितधारक लेखकों, डिज़ाइन तत्वों या विज्ञापनों आदि के प्रदर्शन का आकलन करने में मदद करने के लिए व्यापक समय सीमा पर क्लिक का विश्लेषण कर सकते हैं।

क्लिकों के बारे में डेटा कम से कम दो तरीकों से इकट्ठा किया जा सकता है। आदर्श रूप से, जब कोई क्लिक होता है तो उसे लॉग किया जाता है, और इस पद्धति के लिए कुछ कार्यक्षमता की आवश्यकता होती है जो घटना होने पर प्रासंगिक जानकारी प्राप्त करती है। वैकल्पिक रूप से, कोई यह धारणा स्थापित कर सकता है कि एक पृष्ठ दृश्य एक क्लिक का परिणाम है, और इसलिए एक सिम्युलेटेड क्लिक लॉग करें जो उस पृष्ठ दृश्य का नेतृत्व करता है।

ग्राहक जीवनचक्र विश्लेषण

ग्राहक जीवनचक्र विश्लेषण मापने के लिए एक आगंतुक-केंद्रित दृष्टिकोण है जो जीवनचक्र विपणन की छत्रछाया में आता है।[10] पृष्ठ दृश्य, क्लिक और अन्य घटनाएँ (जैसे एपीआई कॉल, तृतीय-पक्ष सेवाओं तक पहुँच, आदि) सभी अलग-अलग डेटा बिंदुओं के रूप में संग्रहीत किए जाने के बजाय एक व्यक्तिगत आगंतुक से जुड़ी होती हैं। ग्राहक जीवनचक्र विश्लेषण सभी डेटा बिंदुओं को एक खरीद फ़नल में जोड़ने का प्रयास करता है जो आगंतुक व्यवहार और खोज इंजन अनुकूलन में अंतर्दृष्टि प्रदान कर सकता है।[11] ग्राहक जीवनचक्र विश्लेषण में उपयोग किए जाने वाले सामान्य मेट्रिक्स में ग्राहक अधिग्रहण लागत (CAC), ग्राहक आजीवन मूल्य (CLV), ग्राहक मंथन दर और ग्राहक संतुष्टि स्कोर शामिल हैं।[10]


अन्य तरीके

डेटा संग्रह के अन्य तरीकों का कभी-कभी उपयोग किया जाता है। पैकेट स्नीफिंग वेब सर्वर और बाहरी दुनिया के बीच गुजरने वाले नेटवर्क ट्रैफिक पैकेट सूंघने वाला द्वारा डेटा एकत्र करता है। पैकेट स्नीफिंग में वेब पेज या वेब सर्वर में कोई बदलाव नहीं होता है। वेब एनालिटिक्स को वेबसर्वर सॉफ्टवेयर में ही एकीकृत करना भी संभव है।[12] ये दोनों तरीके अन्य तरीकों की तुलना में बेहतर वास्तविक समय व्यापार खुफिया | रियल-टाइम डेटा प्रदान करने का दावा करते हैं।

ऑन-साइट वेब एनालिटिक्स मेट्रिक्स

वेब एनालिटिक्स के भीतर विश्व स्तर पर कोई भी परिभाषा नहीं है क्योंकि उद्योग निकाय कुछ समय के लिए उपयोगी और निश्चित परिभाषाओं पर सहमत होने की कोशिश कर रहे हैं, यानी, विभिन्न कंपनियों के उपकरण और उत्पादों में मेट्रिक्स को मापने, गिनने, मापने के अलग-अलग तरीके हो सकते हैं। नतीजतन, एक ही मीट्रिक नाम डेटा के अलग-अलग अर्थों का प्रतिनिधित्व कर सकता है। इस क्षेत्र में इनपुट रखने वाले मुख्य निकाय IAB (इंटरएक्टिव एडवरटाइजिंग ब्यूरो), JICWEBS (यूके और आयरलैंड में वेब मानकों के लिए संयुक्त उद्योग समिति), और DAA (डिजिटल एनालिटिक्स एसोसिएशन) हैं, जिन्हें औपचारिक रूप से WAA के रूप में जाना जाता है। (वेब एनालिटिक्स एसोसिएशन, यूएस)। हालांकि, कई शब्दों का उपयोग एक प्रमुख एनालिटिक्स टूल से दूसरे में लगातार तरीके से किया जाता है, इसलिए उन सम्मेलनों के आधार पर निम्न सूची उपयोगी प्रारंभिक बिंदु हो सकती है:

  • बाउंस दर - उन विज़िट्स का प्रतिशत जो एकल-पृष्ठ विज़िट्स हैं और उस पृष्ठ पर कोई अन्य इंटरैक्शन (क्लिक्स) नहीं हैं। दूसरे शब्दों में, किसी विशेष सत्र में एक क्लिक को बाउंस कहा जाता है।
  • पथ क्लिक करें - किसी विज़िट या सत्र के भीतर पृष्ठ दृश्यों का कालानुक्रमिक क्रम।
  • हिट (इंटरनेट) - वेबसर्वर से फ़ाइल के लिए अनुरोध। केवल लॉग विश्लेषण में उपलब्ध है। किसी वेबसाइट द्वारा प्राप्त हिट्स की संख्या को उसकी लोकप्रियता पर जोर देने के लिए अक्सर उद्धृत किया जाता है, लेकिन यह संख्या बेहद भ्रामक है और नाटकीय रूप से लोकप्रियता को बढ़ा देती है। एक एकल वेब-पेज में आमतौर पर असतत फ़ाइलों के कई (अक्सर दर्जनों) होते हैं, जिनमें से प्रत्येक को पेज डाउनलोड होने पर हिट के रूप में गिना जाता है, इसलिए हिट की संख्या वास्तव में एक मनमानी संख्या है जो अलग-अलग पृष्ठों की जटिलता को दर्शाती है। वेबसाइट की वास्तविक लोकप्रियता की तुलना में वेबसाइट। विज़िट या पेज व्यू की कुल संख्या लोकप्रियता का अधिक यथार्थवादी और सटीक मूल्यांकन प्रदान करती है।
  • पेज व्यू | पेज व्यू (पेज व्यू) - फ़ाइल के लिए एक अनुरोध, या कभी-कभी माउस क्लिक जैसी घटना, जिसे वेब एनालिटिक्स टूल के सेटअप में एक पेज के रूप में परिभाषित किया गया है। आमतौर पर पृष्ठदृश्यों की संख्या विज़िट और विज़िटर (अद्वितीय विज़िटर) से अधिक होती है। पृष्ठ टैगिंग में चल रही स्क्रिप्ट की घटना। लॉग विश्लेषण में, एक पृष्ठ दृश्य कई हिट उत्पन्न कर सकता है क्योंकि पृष्ठ (चित्र, .js और .css फ़ाइलें) देखने के लिए आवश्यक सभी संसाधन भी वेबसर्वर से अनुरोध किए जाते हैं। उसी वेबपेज के रिफ्रेश को दूसरे पेजव्यू के रूप में गिना जा सकता है। उदाहरण के लिए, समय: 16:07 पर, उपयोगकर्ता ने पृष्ठ A देखा, 2 सेकंड बाद, उपयोगकर्ता ब्राउज़र में रीफ़्रेश बटन पर क्लिक करता है, तब पृष्ठ A के पृष्ठदृश्य की संख्या 2 होती है।
  • अद्वितीय उपयोगकर्ता|आगंतुक/अद्वितीय आगंतुक/अद्वितीय उपयोगकर्ता - विशिष्ट रूप से पहचाना गया ग्राहक जो एक निर्धारित अवधि (जैसे दिन, सप्ताह या महीने) के भीतर पृष्ठ दृश्य या हिट उत्पन्न कर रहा है। विशिष्ट रूप से पहचाना जाने वाला ग्राहक आमतौर पर एक मशीन (उदाहरण के लिए काम पर डेस्कटॉप कंप्यूटर) और एक ब्राउज़र (उस मशीन पर फ़ायरफ़ॉक्स) का संयोजन होता है। पहचान आमतौर पर एक स्थायी कुकी के माध्यम से होती है जिसे साइट पेज कोड द्वारा कंप्यूटर पर रखा गया है। लॉग फ़ाइल विश्लेषण में उपयोग की जाने वाली एक पुरानी विधि, कंप्यूटर के आईपी पते और ब्राउज़र द्वारा वेब सर्वर को प्रदान की गई उपयोगकर्ता-एजेंट (ब्राउज़र) जानकारी का अनूठा संयोजन है। यह समझना महत्वपूर्ण है कि विज़िटर विज़िट के समय कंप्यूटर पर बैठे इंसान के समान नहीं है, क्योंकि एक व्यक्ति अलग-अलग कंप्यूटरों का उपयोग कर सकता है या एक ही कंप्यूटर पर, विभिन्न ब्राउज़रों का उपयोग कर सकता है, और होगा प्रत्येक परिस्थिति में एक अलग आगंतुक के रूप में देखा जाता है। तेजी से, लेकिन फिर भी, शायद ही कभी, आगंतुकों को फ्लैश एलएसओ (स्थानीय साझा वस्तु ्स) द्वारा विशिष्ट रूप से पहचाना जाता है, जो गोपनीयता प्रवर्तन के लिए कम संवेदनशील होते हैं।
  • विज़िट फ़िल्टर|विज़िट/सेशन - एक विज़िट या सत्र को पृष्ठ अनुरोधों की एक श्रृंखला के रूप में परिभाषित किया जाता है या, टैग के मामले में, एक ही विशिष्ट रूप से पहचाने गए क्लाइंट से छवि अनुरोधों के रूप में परिभाषित किया जाता है। आम तौर पर, विज़िटर्स की संख्या विज़िटर (अद्वितीय विज़िटर) से अधिक होती है। एक विशिष्ट ग्राहक की पहचान आमतौर पर एक आईपी पते या एक अद्वितीय आईडी द्वारा की जाती है जिसे ब्राउज़र कुकी में रखा जाता है। एक यात्रा समाप्त मानी जाती है जब कुछ मिनटों में कोई अनुरोध दर्ज नहीं किया जाता है। कई एनालिटिक्स टूल द्वारा 30-मिनट की सीमा (टाइम आउट) का उपयोग किया जाता है, लेकिन कुछ टूल (जैसे Google Analytics) में इसे अन्य मिनटों में बदला जा सकता है। विश्लेषिकी डेटा संग्राहकों और विश्लेषण उपकरणों के पास यह जानने का कोई विश्वसनीय तरीका नहीं है कि किसी आगंतुक ने पृष्ठ दृश्यों के बीच अन्य साइटों को देखा है या नहीं; किसी विज़िट को तब तक एक विज़िट माना जाता है, जब तक ईवेंट (पृष्ठ दृश्य, क्लिक, जो कुछ भी रिकॉर्ड किया जा रहा है) 30 मिनट या उससे कम एक साथ हों। ध्यान दें कि एक विज़िट में एक-पृष्ठ दृश्य या हज़ारों पृष्ठ शामिल हो सकते हैं। यदि पृष्ठ लोड होने के बीच का समय इंगित करता है कि कोई विज़िटर लगातार पृष्ठों को देख रहा है, तो एक अद्वितीय विज़िट सत्र भी बढ़ाया जा सकता है।
  • सक्रिय समय/सगाई का समय - औसत amमाउस की चाल, क्लिक, होवर और स्क्रॉल के आधार पर विज़िटर द्वारा किसी वेब पेज की सामग्री के साथ वास्तव में इंटरैक्ट करने में लगने वाला समय। सत्र अवधि और पृष्ठ दृश्य अवधि/पृष्ठ पर समय के विपरीत, यह मीट्रिक अंतिम पृष्ठ दृश्य में जुड़ाव की लंबाई को सटीक रूप से माप सकता है, लेकिन यह कई एनालिटिक्स टूल या डेटा संग्रह विधियों में उपलब्ध नहीं है।
  • औसत पृष्ठ गहराई/पृष्ठ दृश्य प्रति औसत सत्र - पृष्ठ गहराई औसत विज़िट का अनुमानित आकार है, जिसकी गणना पृष्ठ दृश्यों की कुल संख्या को विज़िट की कुल संख्या से विभाजित करके की जाती है।
  • पृष्ठ देखने की औसत अवधि - आगंतुकों द्वारा साइट के औसत पृष्ठ पर बिताया गया औसत समय।
  • क्लिक - साइट के एक पृष्ठ से दूसरे पृष्ठ पर हाइपरलिंक का अनुसरण करने वाले उपयोगकर्ता के एकल उदाहरण को संदर्भित करता है।
  • घटना - एक वेबसाइट पर होने वाली असतत क्रिया या क्रियाओं का वर्ग। पृष्ठ दृश्य एक प्रकार का ईवेंट है। इवेंट्स क्लिक्स, फॉर्म सबमिशन, कीप्रेस इवेंट्स और अन्य क्लाइंट-साइड यूजर एक्शन को भी एनकैप्सुलेट करते हैं।
  • एग्जिट रेट/% एग्जिट - एक आँकड़ा एक व्यक्तिगत पृष्ठ पर लागू होता है, न कि किसी वेब साइट पर। किसी पृष्ठ को देखने वाली विज़िट का प्रतिशत जहां वह पृष्ठ विज़िट में देखा गया अंतिम पृष्ठ है।
  • पहली मुलाकात/पहला सत्र - (कुछ टूल्स में इसे 'एब्सोल्यूट यूनीक विजिटर' भी कहा जाता है) विशिष्ट रूप से पहचाने गए ग्राहक से एक मुलाकात जिसने सैद्धांतिक रूप से कोई पिछला दौरा नहीं किया है। चूंकि यह जानने का एकमात्र तरीका है कि विशिष्ट रूप से पहचाना गया क्लाइंट पहले साइट पर आ चुका है या नहीं, यह लगातार कुकी की उपस्थिति है या डिवाइस फिंगरप्रिंट के माध्यम से जो पिछली विज़िट पर प्राप्त हुआ था, पहली विज़िट लेबल विश्वसनीय नहीं है यदि साइट की कुकीज़ उनकी पिछली विज़िट के बाद से हटा दी गई हैं।
  • फ़्रीक्वेंसी/सेशन प्रति यूनिक - फ़्रीक्वेंसी मापती है कि किसी निश्चित समय अवधि में विज़िटर कितनी बार वेबसाइट पर आते हैं। इसकी गणना सत्रों की कुल संख्या (या विज़िट्स) को किसी निर्दिष्ट समयावधि, जैसे कि एक माह या वर्ष के दौरान अद्वितीय विज़िटर्स की कुल संख्या से भाग देकर की जाती है। कभी-कभी इसे वफादारी शब्द के साथ विनिमेय किया जाता है।
  • इम्प्रेशन - इंप्रेशन की सबसे आम परिभाषा एक देखे गए पृष्ठ पर प्रदर्शित होने वाले विज्ञापन का एक उदाहरण है। ध्यान दें कि स्क्रीन पर वास्तव में प्रदर्शित क्षेत्र के नीचे एक देखे गए पृष्ठ पर एक विज्ञापन प्रदर्शित किया जा सकता है, इसलिए छापों के अधिकांश उपायों का मतलब यह नहीं है कि विज्ञापन देखने योग्य है।
  • नया आगंतुक - एक आगंतुक जिसने पिछली कोई यात्रा नहीं की है। यह परिभाषा एक निश्चित मात्रा में भ्रम पैदा करती है (सामान्य भ्रम नीचे देखें), और कभी-कभी पहली यात्राओं के विश्लेषण के साथ प्रतिस्थापित किया जाता है।
  • पृष्ठ देखे जाने का समय/पृष्ठ दृश्यता का समय/पृष्ठ देखने की अवधि - किसी एक पृष्ठ (या ब्लॉग, विज्ञापन बैनर) के स्क्रीन पर रहने की अवधि, उस पृष्ठ के अनुरोध के समय और उस पृष्ठ के समय के बीच की गणना के अंतर के रूप में मापी जाती है अगला रिकॉर्ड किया गया अनुरोध। यदि कोई अगला रिकॉर्ड किया गया अनुरोध नहीं है, तो उस पृष्ठ के उस उदाहरण को देखने का समय रिपोर्ट में शामिल नहीं किया जाता है।
  • पुनरावर्ती आगंतुक - एक आगंतुक जिसने कम से कम एक पिछली यात्रा की हो। पिछली और वर्तमान विज़िट के बीच की अवधि को विज़िटर रीसेंसी कहा जाता है और इसे दिनों में मापा जाता है।
  • रिटर्न विजिटर - गतिविधि के साथ एक अनूठा आगंतुक जिसमें रिपोर्टिंग अवधि के दौरान साइट पर जाना शामिल है और जहां अद्वितीय आगंतुक रिपोर्टिंग अवधि से पहले साइट पर आया था। रिपोर्टिंग अवधि के दौरान व्यक्ति की गणना केवल एक बार की जाती है।
  • सत्र अवधि/विज़िट अवधि - विज़िटर द्वारा प्रत्येक बार विज़िट करने पर साइट पर बिताया जाने वाला औसत समय. इसकी गणना सत्रों की कुल संख्या से विभाजित सभी सत्रों की अवधि के योग के रूप में की जाती है। यह मीट्रिक इस तथ्य से जटिल हो सकता है कि विश्लेषिकी कार्यक्रम अंतिम पृष्ठ दृश्य की लंबाई को माप नहीं सकते।[citation needed]
  • सिंगल पेज विज़िट/सिंगलटन - एक विज़िट जिसमें केवल एक पेज देखा जाता है (यह 'बाउंस' नहीं है)।
  • साइट ओवरले एक रिपोर्ट तकनीक है जिसमें वेब पेज के विज़ुअल स्नैपशॉट पर भौतिक स्थान के आधार पर आँकड़े (क्लिक) या हॉट स्पॉट आरोपित किए जाते हैं।
  • दर के माध्यम से क्लिक करें उन उपयोगकर्ताओं का अनुपात है जो किसी पृष्ठ, ईमेल या विज्ञापन को देखने वाले कुल उपयोगकर्ताओं की संख्या के लिए एक विशिष्ट लिंक पर क्लिक करते हैं। यह आमतौर पर किसी विशेष वेबसाइट के लिए ऑनलाइन विज्ञापन अभियान की सफलता के साथ-साथ ईमेल अभियानों की प्रभावशीलता को मापने के लिए उपयोग किया जाता है। क्लिक-थ्रू दर की एक अन्य ज्ञात परिभाषा | क्लिक-थ्रू दर (सीटीआर) क्लिक की गई कुल संख्या को इंप्रेशन की कुल संख्या से विभाजित करना है, क्योंकि क्लिक-थ्रू दर का मीट्रिक क्लिक और इंप्रेशन के अनुपात को मापना है, न कि संख्या को उपयोगकर्ताओं की संख्या (जिन्होंने क्लिक किया और देखा)।

ऑफ-साइट वेब विश्लेषिकी

ऑफ-साइट वेब एनालिटिक्स खुले डेटा विश्लेषण, सामाजिक मीडिया एक्सप्लोरेशन और वेब प्रॉपर्टी पर आवाज की हिस्सेदारी पर आधारित है। यह आमतौर पर यह समझने के लिए उपयोग किया जाता है कि सोशल मीडिया या अन्य वेबसाइटों से इस साइट पर टैग किए गए कीवर्ड की पहचान करके किसी साइट की मार्केटिंग कैसे की जाए।

वेब विश्लेषिकी में भ्रम के सामान्य स्रोत

होटल की समस्या

होटल की समस्या आम तौर पर वेब एनालिटिक्स के उपयोगकर्ता द्वारा सामना की जाने वाली पहली समस्या होती है। समस्या यह है कि एक महीने में प्रत्येक दिन के लिए अद्वितीय आगंतुकों का योग उस महीने के अद्वितीय आगंतुकों के योग के बराबर नहीं होता है। यह एक अनुभवहीन उपयोगकर्ता को लगता है कि वे जिस भी एनालिटिक्स सॉफ़्टवेयर का उपयोग कर रहे हैं, उसमें एक समस्या है। वास्तव में यह मीट्रिक परिभाषाओं की एक साधारण संपत्ति है।

स्थिति को चित्रित करने का तरीका एक होटल की कल्पना करना है। होटल में दो कमरे हैं (कक्ष ए और कमरा बी)।

Day 01 Day 02 Day 03 Total
Room A John John Mark 2 Unique Users
Room B Mark Anne Anne 2 Unique Users
Total 2 2 2 ?

जैसा कि तालिका दिखाती है, होटल में तीन दिनों में प्रत्येक दिन दो अद्वितीय उपयोगकर्ता होते हैं। इसलिए दिनों के संबंध में योग का योग छह है।

इस अवधि के दौरान प्रत्येक कमरे में दो अद्वितीय उपयोगकर्ता थे। इसलिए कमरों के संबंध में कुल योग चार है।

वास्तव में इस अवधि में केवल तीन आगंतुक होटल में रहे हैं। समस्या यह है कि एक व्यक्ति जो दो रातों के लिए एक कमरे में रहता है, यदि उसे प्रत्येक दिन एक बार गिना जाता है, तो उसे दो बार गिना जाएगा, लेकिन केवल एक बार गिना जाएगा यदि अवधि के लिए कुल देखा जाए। वेब विश्लेषिकी के लिए कोई भी सॉफ़्टवेयर चयनित समय अवधि के लिए इनका सही योग करेगा, इस प्रकार जब कोई उपयोगकर्ता योग की तुलना करने का प्रयास करता है तो समस्या उत्पन्न होती है।

विश्लेषिकी विष

जैसा कि इंटरनेट परिपक्व हो गया है, स्वचालित बॉट ट्रैफ़िक का प्रसार वेब विश्लेषिकी की विश्वसनीयता के लिए एक बढ़ती हुई समस्या बन गया है।[citation needed] चूंकि बॉट्स इंटरनेट पर चलते हैं, वे वेब दस्तावेज़ों को ऑर्गेनिक उपयोगकर्ताओं के समान तरीके से प्रस्तुत करते हैं, और परिणामस्वरूप संयोग से उसी कोड को ट्रिगर कर सकते हैं जिसका उपयोग वेब एनालिटिक्स ट्रैफ़िक की गणना करने के लिए करते हैं। संयुक्त रूप से, वेब विश्लेषिकी घटनाओं का यह आकस्मिक ट्रिगर डेटा की व्याख्या और उस डेटा पर किए गए अनुमानों को प्रभावित करता है। IPM ने इस अवधारणा का प्रमाण प्रदान किया कि कैसे Google Analytics के साथ-साथ उनके प्रतिस्पर्धियों को सामान्य बॉट परिनियोजन रणनीतियों द्वारा आसानी से ट्रिगर किया जाता है।[13]


वेब एनालिटिक्स के तरीके

कुकीज़ के साथ समस्या

ऐतिहासिक रूप से, पेज-टैगिंग एनालिटिक्स समाधानों के विक्रेताओं ने ब्राउज की जा रही वेबसाइट के डोमेन के बजाय विक्रेता के डोमेन से भेजे गए तृतीय-पक्ष कुकीज़ का उपयोग किया है। तृतीय-पक्ष कुकीज़ कंपनी की साइट के भीतर कई असंबंधित डोमेन पार करने वाले आगंतुकों को संभाल सकती हैं, क्योंकि कुकी हमेशा विक्रेता के सर्वर द्वारा नियंत्रित की जाती है।

हालांकि, सिद्धांत रूप में तृतीय-पक्ष कुकीज़ विभिन्न कंपनियों की साइटों पर एक व्यक्तिगत उपयोगकर्ता को ट्रैक करने की अनुमति देती है, जिससे एनालिटिक्स विक्रेता को उन साइटों पर उपयोगकर्ता की गतिविधि को मिलाने की अनुमति मिलती है जहां उसने अन्य साइटों पर अपनी गतिविधि के साथ व्यक्तिगत जानकारी प्रदान की थी जहां उसे लगा कि वह गुमनाम है। हालांकि वेब एनालिटिक्स कंपनियां ऐसा करने से इनकार करती हैं, अन्य कंपनियों जैसे वेब बैनर की आपूर्ति करने वाली कंपनियों ने ऐसा किया है। इसलिए तृतीय-पक्ष कुकी ने उपयोगकर्ताओं के एक उल्लेखनीय अल्पसंख्यक को तृतीय-पक्ष कुकीज़ को ब्लॉक करने या हटाने के लिए प्रेरित किया है। 2005 में, कुछ रिपोर्टों से पता चला कि लगभग 28% इंटरनेट उपयोगकर्ताओं ने तृतीय-पक्ष कुकीज़ को अवरुद्ध कर दिया और 22% ने उन्हें महीने में कम से कम एक बार हटा दिया।[14] पेज टैगिंग समाधानों के अधिकांश विक्रेता अब कम से कम प्रथम-पक्ष कुकीज (क्लाइंट उपडोमेन से निर्दिष्ट कुकीज) का उपयोग करने का विकल्प प्रदान करने के लिए चले गए हैं।

एक अन्य समस्या कुकी विलोपन है। जब वेब एनालिटिक्स अद्वितीय विज़िटर की पहचान करने के लिए कुकीज़ पर निर्भर करते हैं, तो आँकड़े एक अद्वितीय विज़िटर आईडी रखने के लिए एक स्थायी कुकी पर निर्भर होते हैं। जब उपयोगकर्ता कुकीज़ हटाते हैं, तो वे आमतौर पर पहले और तीसरे पक्ष की कुकीज़ दोनों को हटा देते हैं। यदि यह साइट के साथ बातचीत के बीच किया जाता है, तो उपयोगकर्ता अपने अगले इंटरैक्शन बिंदु पर पहली बार आने वाले आगंतुक के रूप में दिखाई देगा। निरंतर और अद्वितीय विज़िटर आईडी के बिना, रूपांतरण, क्लिक-स्ट्रीम विश्लेषण, और समय के साथ अद्वितीय विज़िटर की गतिविधियों पर निर्भर अन्य मीट्रिक सटीक नहीं हो सकते हैं।

कुकीज़ का उपयोग किया जाता है क्योंकि आईपी पते हमेशा उपयोगकर्ताओं के लिए अद्वितीय नहीं होते हैं और बड़े समूहों या प्रॉक्सी द्वारा साझा किए जा सकते हैं। कुछ मामलों में, कुकीज़ उपलब्ध नहीं होने पर किसी आगंतुक की अधिक सटीक पहचान करने के लिए आईपी पते को उपयोगकर्ता एजेंट के साथ जोड़ा जाता है। हालाँकि, यह केवल आंशिक रूप से समस्या को हल करता है क्योंकि अक्सर प्रॉक्सी सर्वर के पीछे उपयोगकर्ताओं के पास एक ही उपयोगकर्ता एजेंट होता है। किसी उपयोगकर्ता की विशिष्ट रूप से पहचान करने के अन्य तरीके तकनीकी रूप से चुनौतीपूर्ण हैं और ट्रैक करने योग्य ऑडियंस को सीमित कर देंगे या उन्हें संदिग्ध माना जाएगा। स्पाइवेयर के रूप में मानी जाने वाली तकनीकों का उपयोग किए बिना कुकीज़ सबसे कम आम भाजक तक पहुँचती हैं।[15]


सुरक्षित विश्लेषण (मीटरिंग) तरीके

यह जानना अच्छा हो सकता है कि तीसरे पक्ष की जानकारी एकत्र करना किसी भी नेटवर्क सीमाओं और लागू सुरक्षा के अधीन है। देश, सेवा प्रदाता और निजी नेटवर्क साइट विज़िट डेटा को तृतीय पक्षों को जाने से रोक सकते हैं। ऊपर वर्णित सभी विधियों (और कुछ अन्य तरीकों का उल्लेख यहां नहीं किया गया है, जैसे नमूनाकरण) में हेरफेर (मुद्रास्फीति और अपस्फीति दोनों) के प्रति संवेदनशील होने की केंद्रीय समस्या है। इसका मतलब है कि ये विधियां सटीक और असुरक्षित हैं (सुरक्षा के किसी भी उचित मॉडल में)। इस मुद्दे को कई पत्रों में संबोधित किया गया है,[16][17][18][19] लेकिन आज तक इन पत्रों में सुझाए गए समाधान सैद्धांतिक बने हुए हैं।

यह भी देखें

संदर्भ

  1. WAA Standards Committee. "Web analytics definitions." Washington DC: Web Analytics Association (2008).
  2. Nielsen, Janne (2021-04-27). "वेब ट्रैकिंग में वेब बीकन के ऐतिहासिक उपयोग का अध्ययन करने के लिए मिश्रित विधियों का उपयोग करना". International Journal of Digital Humanities. 2 (1–3): 65–88. doi:10.1007/s42803-021-00033-4. ISSN 2524-7832. S2CID 233416836.
  3. Jansen, B. J. (2009). Understanding user-web interactions via web analytics. Synthesis Lectures on Information Concepts, Retrieval, and Services, 1(1), 1-102.
  4. Zheng, G. & Peltsverger S. (2015) Web Analytics Overview, In book: Encyclopedia of Information Science and Technology, Third Edition, Publisher: IGI Global, Editors: Mehdi Khosrow-Pour
  5. Web Traffic Data Sources and Vendor Comparison by Brian Clifton and Omega Digital Media Ltd
  6. Marketing Management: A Value-Creation Process (2nd Edition) by Alain Jolibert, Pierre-Louis Dubois, Hans Mühlbacher, Laurent Flores, Pierre-Louis Jolibert Dubois, 2012, p. 359.
  7. Increasing Accuracy for Online Business Growth - a web analytics accuracy whitepaper
  8. "Revisiting log file analysis versus page tagging": McGill University Web Analytics blog article (CMIS 530) "Revisiting Log File Analysis versus Page tagging". Archived from the original on July 6, 2011. Retrieved February 26, 2010.
  9. IPInfoDB (2009-07-10). "आईपी ​​​​जियोलोकेशन डेटाबेस". IPInfoDB. Retrieved 2009-07-19. {{cite web}}: zero width space character in |title= at position 6 (help)
  10. 10.0 10.1 Kitchens, Brent; Dobolyi, David; Li, Jingjing; Abbasi, Ahmed (2018-04-03). "Advanced Customer Analytics: Strategic Value Through Integration of Relationship-Oriented Big Data". Journal of Management Information Systems. 35 (2): 540–574. doi:10.1080/07421222.2018.1451957. ISSN 0742-1222.
  11. Önder, Irem; Berbekova, Adiyukh (2022-08-10). "Web analytics: more than website performance evaluation?". International Journal of Tourism Cities. 8 (3): 603–615. doi:10.1108/IJTC-03-2021-0039. ISSN 2056-5607.
  12. Hu, Xiaohua; Cercone, Nick (1 July 2004). "A Data Warehouse/Online Analytic Processing Framework for Web Usage Mining and Business Intelligence Reporting". International Journal of Intelligent Systems. 19 (7): 585–606. doi:10.1002/int.v19:7.
  13. "Analytics Poisoning: A Short Review - IPM Corporation". 5 December 2020. Retrieved July 29, 2022.
  14. McGann, Rob (14 March 2005). "Study: Consumers Delete Cookies at Surprising Rate". Retrieved 3 April 2014.
  15. "Home News Access the Guide Tools Education Shopping Internet Cookies- Spyware or Neutral Technology?". CNET. February 2, 2005. Retrieved 24 April 2017.
  16. Naor, M.; Pinkas, B. (1998). "Secure and efficient metering". Advances in Cryptology — EUROCRYPT'98. Lecture Notes in Computer Science. Vol. 1403. p. 576. doi:10.1007/BFb0054155. ISBN 978-3-540-64518-4.
  17. Naor, M.; Pinkas, B. (1998). "Secure accounting and auditing on the Web". Computer Networks and ISDN Systems. 30 (1–7): 541–550. doi:10.1016/S0169-7552(98)00116-0.
  18. Franklin, M. K.; Malkhi, D. (1997). "Auditable metering with lightweight security". वित्तीय क्रिप्टोग्राफी. Lecture Notes in Computer Science. Vol. 1318. pp. 151. CiteSeerX 10.1.1.46.7786. doi:10.1007/3-540-63594-7_75. ISBN 978-3-540-63594-9.
  19. Johnson, R.; Staddon, J. (2007). "अपस्फीति-सुरक्षित वेब पैमाइश". International Journal of Information and Computer Security. 1: 39. CiteSeerX 10.1.1.116.3451. doi:10.1504/IJICS.2007.012244.


ग्रन्थसूची

  • Clifton, Brian (2010) Advanced Web Metrics with Google Analytics, 2nd edition, Sybex (Paperback.)
  • Kaushik, Avinash (2009) Web Analytics 2.0 - The Art of Online Accountability and Science of Customer Centricity. Sybex, Wiley.
  • Mortensen, Dennis R. (2009) Yahoo! Web Analytics. Sybex.
  • Farris, P., Bendle, N.T., Pfeifer, P.E. Reibstein, D.J. (2009) Key Marketing Metrics The 50+ Metrics Every Manager needs to know, Prentice Hall, London.
  • Plaza, B (2009) Monitoring web traffic source effectiveness with Google Analytics: An experiment with time series. ASLIB Proceedings, 61(5): 474–482.
  • Arikan, Akin (2008) Multichannel Marketing. Metrics and Methods for On and Offline Success. Sybex.
  • Tullis, Tom & Albert, Bill (2008) Measuring the User Experience. Collecting, Analyzing and Presenting Usability Metrics. Morgan Kaufmann, Elsevier, Burlington MA.
  • Kaushik, Avinash (2007) Web Analytics: An Hour a Day, Sybex, Wiley.
  • Bradley N (2007) Marketing Research. Tools and Techniques. Oxford University Press, Oxford.
  • Sostre, Pedro and LeClaire, Jennifer (2007) Web Analytics for Dummies. Wiley.
  • Burby, Jason and Atchison, Shane (2007) Actionable Web Analytics: Using Data to Make Smart Business Decisions.
  • Davis, J. (2006) ‘Marketing Metrics: How to create Accountable Marketing plans that really work’ John Wiley & Sons (Asia).
  • Peterson Eric T (2005) Web Site Measurement Hacks. O'Reilly ebook.
  • Peterson Eric T (2004) Web Analytics Demystified: A Marketer's Guide to Understanding How Your Web Site Affects Your Business. Celilo Group Media
  • Lenskold, J. (2003) ‘Marketing ROI: how to plan, Measure and Optimise strategies for Profit’ London: McGraw Hill Contemporary
  • Sterne, J. (2002) Web metrics, Proven Methods for Measuring Web Site Success, London: John Wiley & Sons.
  • Srinivasan, J .(2001) E commerce Metrics, Models and Examples, London: Prentice Hall.
  • Zheng, J. G. and Peltsverger, S. (2015) Web Analytics Overview, In book: Encyclopedia of Information Science and Technology, Third Edition, Publisher: IGI Global, Editors: Mehdi Khosrow-Pour