आजचे बिग डेटा चॅलेंज व्हॉल्यूम किंवा वेग नाही तर विविधतेमुळे उत्पन्न झाले आहे

लेखक: Judy Howell
निर्मितीची तारीख: 28 जुलै 2021
अद्यतन तारीख: 1 जुलै 2024
Anonim
9 कोडे फक्त उच्च बुद्ध्यांक असलेले लोक सोडवू शकतात
व्हिडिओ: 9 कोडे फक्त उच्च बुद्ध्यांक असलेले लोक सोडवू शकतात

सामग्री


टेकवे:

बरेच आयटी विभाग डेटा व्हॉल्यूम आणि वेग या समस्येवर आपल्याकडे असलेले सर्व काही टाकून देतात, डेटाच्या विविधतेच्या मूलभूत समस्येवर लक्ष देण्यास विसरून जातात.

गार्टनरचे संशोधन उपाध्यक्ष डग लेनेच्या मते, मोठा डेटा व्यवस्थापित करणे आणि त्याचा फायदा उठवणे हे तीन घटकांद्वारे आव्हान आहे. लेनने प्रथम एका दशकापेक्षा जास्त आधी नोंद घेतली आहे की मोठ्या डेटामुळे एंटरप्राइझसाठी अशी समस्या उद्भवली आहे कारण ती हार्ड-टू-मॅनेजमेंट वॉल्यूम, वेग आणि विविधता परिचित करते. अडचण अशी आहे की बरेच आयटी विभाग डेटा व्हॉल्यूम आणि वेग या समस्येवर आपल्याकडे असलेले सर्व काही टाकतात, डेटाच्या विविधतेच्या मूलभूत समस्येवर लक्ष देण्यास विसरून.

२००१ मध्ये, लेने लिहिले की "आघाडीचे उपक्रम अंतर्गत आणि बाह्य सहकार्यात सुधारणा करणारे सामान्य व्यवसाय शब्दसंग्रह परिभाषित करण्यासाठी केंद्रीकृत डेटा वेअरहाऊसचा वाढत्या वापर करतात." त्या शब्दसंग्रहाचा मुद्दा - आणि परिवर्तनामुळे कंपन्यांना ती तयार होण्यापासून रोखते - आज मोठ्या डेटा कॉनड्रॅमचा सर्वात कमी उद्देश केलेला पैलू राहिला आहे. (इतर तज्ज्ञांचे म्हणणे काय आहे ते पहा. अनुसरण करण्यासाठी बिग डेटा तज्ञ पहा.)


मोठ्या डेटाच्या तीन वि

वाढीव डेटाचे प्रमाण आणि गती वाढविण्यासाठी असंख्य व्यवसायांना पद्धती सापडल्या आहेत. उदाहरणार्थ, डेटाची प्रचंड मात्रा विश्लेषण करू शकते. अर्थात, तो डेटा समान पॅरामीटर्समध्ये वारंवार आणि पुन्हा सादर केला जातो. याने कॉलम डेटाबेस सारख्या तंत्रज्ञानाचा शोध लावला, जो आता समान कंपन्या समान डेटा आयटमच्या समान स्टोअरचा सामना करणार्‍या इतर कंपन्यांद्वारे मोठ्या प्रमाणात वापरला जातो.

वेगवान कामगिरीच्या संदर्भात, स्प्लंक मदत उद्योजकांसारखे विक्रेते लॉग फायलींद्वारे वेगाने तयार केलेल्या डेटाचे विश्लेषण करतात जे प्रति सेकंदात हजारो कार्यक्रम घेतात. सुरक्षा आणि कार्यक्षमता देखरेख वापर प्रकरणांमध्ये उच्च-खंड घटनांचे हे विश्लेषण लक्ष्यित आहे. डेटा व्हॉल्यूम आव्हानाप्रमाणेच गती आव्हान मुख्यत्वे परिष्कृत अनुक्रमणिक तंत्राद्वारे आणि वितरित डेटा ticsनालिटिक्सद्वारे लक्ष दिले गेले आहे जे डेटा गती वाढवण्याच्या प्रक्रियेस क्षमता सक्षम करते.

जेव्हा हे विविधतेत येते, तरीही बरीच डेटा एनालिटिक्सकडे जाण्याच्या प्रयत्नात अजूनही बर्‍याच उपक्रमांना मोठी समस्या येते. ही समस्या तीन घटकांद्वारे चालविली जाते: प्रथम, वाढ, अधिग्रहण आणि तंत्रज्ञानातील नवकल्पनांमुळे वातावरणात नवीन प्रणाली जोडल्या गेल्याने उद्यमांना अत्यंत विषम वातावरणात लॉक केले जाते आणि ही विपुलता केवळ काळानुसार वाढते. एंटरप्राइजेसना अशा प्रकारच्या प्रकारच्या प्रणालींचा वेध घेणे आवश्यक आहे आणि हजारो डेटा प्रकार व्यवस्थापित करणे आवश्यक आहे, तसेच समान डेटा भिन्न नामांकने आणि स्वरूप वापरुन दर्शविला जातो.


दुसरे म्हणजे, बर्‍याच प्रकरणांमध्ये या सिस्टीम आणि डेटा प्रकार संबंधित माहिती आणि माहिती या दोहोंचा अहवाल देतात ज्या समस्येच्या समस्येसंदर्भात असंबद्ध म्हणून सुरक्षितपणे फिल्टर केल्या जाऊ शकतात. प्रभावी माहिती प्रभावीपणे ओळखण्याची गरज आहे.

विविध आव्हानाचे तिसरे आयाम म्हणजे वातावरणातील निरंतर परिवर्तनशीलता किंवा बदल. सिस्टीम श्रेणीसुधारित केली जातात, नवीन प्रणाली आणल्या जातात, नवीन डेटा प्रकार जोडले जातात आणि नवीन नामांकन सादर केले जाते. यामुळे डेटा विविध आव्हानांवर विजय मिळविण्याची आमची क्षमता ताणली जाते. हे विविध आव्हानात अतिरिक्त स्तर जोडेल. (अधिक अंतर्दृष्टीसाठी, मोठा डेटा पहा: त्याचे कॅप्चर कसे केले जाते, व्यवसायाचे निर्णय कसे घ्यावेत आणि कसे वापरावे.)

डेटा विविधतेची समस्या संबोधित करीत आहे

डेटा विविध समस्येचे निराकरण करण्यासाठी, उद्योजकांनी आयटी डोमेनसह प्रारंभ करणे आवश्यक आहे, कारण हे बहुतेक वेळा सर्वात वाईट गुन्हेगार आणि विविध समस्येचे सर्वात वाईट बळी असे दोघांचे प्रतिनिधित्व करते. पहिली पायरी म्हणजे सर्व आयटी घटक किंवा मालमत्तांच्या विस्तृत परिभाषा किंवा वर्गीकरण सह प्रारंभ करणे. हे आयटीमध्ये किंवा त्याबद्दल कोणत्याही गोष्टींचा संदर्भ देण्यासाठी एक आधारभूत आधार किंवा पाया प्रदान करते आणि ज्ञात वर्गीकरण किंवा शब्दावलीच्या विरूद्ध वाढती विपुलता व्यवस्थापित करण्यासाठी उद्योजकांना सक्षम करते.

कोणतीही दोष नाही, तणाव नाही - आपले जीवन नष्ट न करता जीवन-बदलणारे सॉफ्टवेअर तयार करण्यासाठी चरण चरण बाय चरण

जेव्हा कोणालाही सॉफ्टवेअर गुणवत्तेची काळजी नसते तेव्हा आपण आपली प्रोग्रामिंग कौशल्ये सुधारू शकत नाही.

पुढील चरण म्हणजे रेकॉर्डच्या विविध सिस्टममध्ये समान ऑब्जेक्टचे प्रतिनिधित्व केले जाणारे असंख्य मार्ग ओळखणे. हे आयटी व्यावसायिकांना त्यांच्या वैविध्यपूर्ण वातावरणाकडे लक्ष देण्यास सक्षम करते आणि संबंधित आणि व्यवस्थापित भागांमध्ये डेटाचे अत्यधिक फिल्टर आणि संकुचित करते.

अखेरीस, त्याच घटकांचा संदर्भ घेण्यासाठी नवीन प्रकारचे घटक किंवा नवीन नामांकन यासारख्या बदलांसाठी आयटी व्यवस्थापकांनी पर्यावरणाची सतत तपासणी करण्याची प्रक्रिया अवलंबली पाहिजे.

या चरणांसह, आयटी संस्था विविध समस्या व्यवस्थापित करू शकतात आणि ऐतिहासिकदृष्ट्या आयटी संघांना वगळलेल्या खोल अंतर्दृष्टी प्राप्त करू शकतात. याउप्पर, विविध समस्या व्यवस्थापित केल्याने साधने आणि तंत्रामध्ये केलेल्या गुंतवणूकीवरील परतावा मोठ्या प्रमाणात सुधारतो जो खंड आणि गतीच्या अधिक पारंपारिक मोठा डेटा समस्या सोडवतो.