बिग डेटा व्यवस्थापित करण्याबद्दल 6 मोठी मान्यता

लेखक: Eugene Taylor
निर्मितीची तारीख: 15 ऑगस्ट 2021
अद्यतन तारीख: 22 जून 2024
Anonim
बिग डेटाबद्दल 7 घातक समज, भाग 6
व्हिडिओ: बिग डेटाबद्दल 7 घातक समज, भाग 6

सामग्री


स्रोत: ड्वेनल्ड 777 / ड्रीमस्टाइम डॉट कॉम

टेकवे:

मोठा डेटा मोठा व्यवसाय आहे, परंतु केवळ त्याचा योग्य वापर केला गेला तर.

मे २०१ 2014 मध्ये, फॉरेस्टर रिसर्चने दोन अहवाल जारी केला ज्याच्या आसपासच्या मोठ्या डेटाबद्दलच्या निष्पत्तीबद्दल काही निष्कर्ष काढले गेले. संशोधन संस्थेने 250 हून अधिक विपणन आणि व्यवसाय-विकास अधिका-यांचे सर्वेक्षण केले. अहवालातील लेखकांच्या मते, मोठा डेटा वक्तृत्व सर्व काळात उच्च आहे आणि तंत्रज्ञान विक्रेते उत्पादनांवर अविश्वसनीय दावे असल्याचे दर्शवित आहेत.

गार्टनर फॉरेस्टर रिसर्चशी सहमत आहे; भरीव हायपाइ आसपासचा मोठा डेटा. सप्टेंबर २०१ report च्या अहवालात, गार्टनर पाच सर्वात मोठा डेटा मिथक हटवितो आणि गार्टनर विश्लेषकांनी मोठा डेटा आणि त्याच्या हाताळणीबद्दल गैरसमज काय आहेत याबद्दल त्यांचे मत मांडले. मग मोठे डेटा सर्वात मोठे मिथक म्हणजे काय? चला एक नझर टाकूया.

मान्यता: मोठा डेटा अवलंब करण्यात प्रत्येकजण आपल्यापेक्षा पुढे आहे.

गार्टनर म्हणतात की मोठ्या डेटामध्ये स्वारस्य सर्व-वेळेस उच्च आहे. असे असूनही, त्यापैकी 13 टक्के पोलिंगमध्ये कार्य प्रणाली आहेत. कारणः बहुतेक कंपन्यांना डेटाच्या मोठ्या भांडारांतून मूल्य कसे कमवायचे हे शोधणे बाकी आहे. येथे, गार्टनरचे सर्वेक्षण फॉरेस्टर अहवालापेक्षा अधिक आशावादी आहे, ज्यामध्ये असे आढळले आहे की सर्वेक्षणातील केवळ 9 टक्के लोकांनी म्हटले आहे की त्यांनी पुढच्या वर्षात बिग-डेटा टेहलनालॉजीची अंमलबजावणी करण्याची योजना आखली. (बिग डेटाकडे ऑफर करण्यासाठी बरेच काही आहे. 5 रिअल-वर्ल्ड प्रॉब्लेम्स बिग डेटा निराकरण करू शकेल याबद्दल अधिक जाणून घ्या.)

मान्यता: आमच्याकडे खूप डेटा आहे; आम्हाला प्रत्येक छोट्या डेटा त्रुटीबद्दल चिंता करण्याची गरज नाही.

गार्टनरला आपल्याकडे असलेल्या मानवीय गोष्टींबद्दल काळजी आहे: "आमच्याकडे इतके आहे, जे थोडे वाईट आहे त्याचा फरक पडणार नाही." गार्डनरचे उपाध्यक्ष आणि प्रतिष्ठीत विश्लेषक टेड फ्रीडम असा विश्वास करतात की परिस्थिती पाहण्याचा हा चुकीचा मार्ग आहे.

“प्रत्यक्षात, प्रत्येक डेटाबेस कमी डेटा असताना त्याच्या संपूर्ण डेटासेटवर फारच कमी परिणाम होत असला तरी आधीपेक्षा जास्त दोष आहेत कारण तेथे जास्त डेटा आहे,” फ्रीडमॅन म्हणाले. "म्हणूनच, संपूर्ण डेटासेटवरील खराब-गुणवत्तेच्या डेटाचा एकूणच प्रभाव कायम आहे."

फ्रेडमॅनने चिंतेचे आणखी एक कारण जोडले. बिग-डेटा कॅप्चरमध्ये बर्‍याचदा व्यवसायाच्या बाहेरील डेटा समाविष्ट असतो जो अज्ञात रचना आणि मूळचा आहे. यामुळे चुकांची संभाव्यता वाढते.

मान्यता: मोठे डेटा तंत्रज्ञान डेटा एकत्रिकरणाची आवश्यकता दूर करेल.

मोठ्या डेटावर लागू होण्याची दोन की डेटा विश्लेषण रणनीती आहेतः "लिहिण्यावरील स्कीमा" किंवा "वाचनावरील स्कीमा." अलीकडे पर्यंत, लेखनावरील स्कीमा ही एकमेव पद्धत वापरली जात होती. वाचनवरील स्कीमा ही सध्याची डेटाबेस व्यवस्थापनाची क्रेझ आहे. लेखनावरील स्कीमाच्या विपरीत, ज्यास रचनात्मक स्वरुपाची आवश्यकता असते, डेटा त्याच्या कच्च्या स्वरूपात स्कीमा-ऑन-रीड डेटाबेसमध्ये लोड केला जातो. मग विकसक - हॅडॉप सारख्या अप्रबंधित डेटाबेस प्लॅटफॉर्मचा वापर करून - भिन्न डेटा वापरण्यायोग्य स्वरूपात वाकवा. वाचनावरील स्कीमाचे स्पष्ट फायदे आहेत परंतु, गार्टनरने सांगितल्यानुसार, डेटा समाकलन केव्हातरी होणे आवश्यक आहे.

मान्यता: प्रगत forनालिटिक्ससाठी डेटा वेअरहाउस वापरणे निरर्थक आहे.

डेटा वेअरहाउस तयार करण्यासाठी वेळ घालवणे हे बर्‍याच माहिती व्यवस्थापकांना निरर्थक वाटते, विशेषत: जेव्हा नवीन-कॅप्चर केलेला डेटा डेटा वेअरहाऊसमधील डेटापेक्षा वेगळा असतो. तथापि, गार्टनरने पुन्हा चेतावणी दिली की प्रगत डेटा ticsनालिटिक्स डेटा वेअरहाऊस आणि नवीन डेटा वापरेल, याचा अर्थ डेटा इंटिग्रेटरांनी हे करणे आवश्यक आहेः
  • विश्लेषणास योग्य बनविण्यासाठी नवीन डेटा प्रकार परिष्कृत करा
  • कोणता डेटा संबद्ध आहे आणि डेटा गुणवत्तेची पातळी आवश्यक आहे ते ठरवा
  • डेटा कसा एकत्रित करायचा ते ठरवा
  • डेटा गोदाम व्यतिरिक्त इतर ठिकाणी डेटा परिष्करण होऊ शकते हे समजून घ्या

मान्यता: डेटा तलाव डेटा कोठार पुनर्स्थित करेल.

डेटा स्ट्रक्चर्समध्ये जिथे डेटा असतो तेथे डेटा वेअरहाउसच्या विरूद्ध डेटा तलाव भिन्न डेटाची भांडार आहेत. डेटा गोदामांच्या तुलनेत डेटा तलाव तयार करण्यात थोडासा प्रयत्न (डेटा फॉरमॅट करण्याची आवश्यकता नाही) आहे, म्हणूनच डेटा तलाव स्वारस्य आहे.

गार्टनरने यावर जोर दिला की डेटा असणे हा मुद्दा नाही - माहितीच्या निर्णयासाठी हस्तगत केलेला डेटा हाताळण्यास सक्षम असणे हा मुद्दा आहे. शिवाय, निर्णय घेण्याच्या सोयीसाठी (काही प्रमाणात अप्रमाणित) डेटा तलाव वापरणे समस्याप्रधान आहे.

“डेटा वेअरहाऊसमध्ये आधीपासूनच संपूर्ण संस्थेमध्ये विविध प्रकारच्या वापरकर्त्यांना आधार देण्याची क्षमता असते,” असे गार्टनरचे संशोधन संचालक निक हेडेककर म्हणाले. "माहिती-व्यवस्थापन नेत्यांना डेटा तलाव पकडण्यासाठी प्रतीक्षा करावी लागणार नाही." (दत्तक घेण्यापूर्वी मोठा डेटा बद्दल आपल्याला माहित असलेल्या 7 गोष्टींमध्ये मोठा डेटा अवलंबण्याबद्दल अधिक जाणून घ्या.)

बिग डेटा वर्क्स - नवीन डेटा हाताळण्याच्या पद्धती कदाचित करू शकत नाहीत

गार्टनरने "बिग-डेटा मिथक" ऐवजी "सर्वात मोठा डेटा मिथक" सांगितल्याचे कारण अहवाल वाचल्यानंतर स्पष्ट होते. गार्टनर मोठ्या डेटाची कंटाळवाणे गोष्ट नाही. गार्टनर ज्यांना मोठा डेटा हाताळण्याच्या नवीन पद्धती "प्राइम टाइम" साठी सज्ज असल्याचे वाटतात त्यांच्याबद्दल आश्चर्य वाटते.