मशीन कॅटलॉग आणि मशीन लर्निंग मार्केटची परिपक्वता

लेखक: Roger Morrison
निर्मितीची तारीख: 28 सप्टेंबर 2021
अद्यतन तारीख: 21 जून 2024
Anonim
मशीन कॅटलॉग आणि मशीन लर्निंग मार्केटची परिपक्वता - तंत्रज्ञान
मशीन कॅटलॉग आणि मशीन लर्निंग मार्केटची परिपक्वता - तंत्रज्ञान

सामग्री


स्रोत: नेमेडिया / ड्रीमस्टाइम.कॉम

टेकवे:

एमएलडीसी मार्केट वाढत आहे, आणि मशीन शिक्षणाद्वारे मोठ्या डेटाचा प्रभावीपणे फायदा उठविण्याच्या प्रयत्नात असलेल्या उद्योजकांना क्षेत्रातील शीर्ष नावे आणि त्यांचे वैयक्तिक रँकिंग माहित असणे आवश्यक आहे.

हे मोठ्या डेटाचे वय आहे. आम्ही माहितीने वेढलेला आहोत आणि व्यवसायांना त्यातून त्याचे मूल्य व्यवस्थापित करणे आणि काढणे आव्हानात्मक आहे.

आज मोठ्या डेटाचा प्रवाह केवळ खंड, विविधता आणि वेगच नाही तर गुंतागुंत देखील आहे. बिग डेटा हिस्ट्री आणि एसएएस मध्ये एसएएस द्वारे ओळखल्यानुसार प्रवाहाचे घटक "एकाधिक स्त्रोतांमधून, यामुळे सिस्टममध्ये डेटा दुवा साधणे, जुळविणे, शुद्ध करणे आणि रूपांतरित करणे कठीण होते." (मोठ्या डेटाबद्दल अधिक जाणून घेऊ इच्छिता? पहा (मोठा) डेटा बिग फ्यूचर.)

मौल्यवान अंतर्दृष्टी शोधणे हा शक्य तितका डेटा एकत्रित करण्याचा प्रश्न नाही तर योग्य डेटा शोधण्याचा आहे. मॅन्युअल प्रक्रियेसह त्याद्वारे कार्य करणे अशक्य आहे. म्हणूनच अधिकाधिक व्यवसाय "डेटामधील प्रवेशाचे डेमोक्रॅटिकरण करण्यासाठी डेटा कॅटलॉगकडे वळत आहेत, आदिवासी डेटा ज्ञान अचूक करण्यास सक्षम करतात, डेटा धोरणे लागू करतात आणि व्यवसाय मूल्यासाठी सर्व डेटा द्रुतपणे सक्रिय करतात."


हे असे आहे जेथे डेटा कॅटलॉग (कधीकधी माहिती कॅटलॉग म्हणून देखील ओळखले जाते) चित्रात प्रवेश करतात. येथे परिभाषित केल्याप्रमाणे, ते "वापरकर्त्यांना त्यांचे आवश्यक डेटा स्रोत एक्सप्लोर करण्यासाठी आणि शोधलेल्या डेटा स्त्रोतांना समजून घेण्यास सक्षम करतात आणि त्याचबरोबर संस्थांना त्यांच्या सध्याच्या गुंतवणूकीतून अधिक मूल्य मिळविण्यास मदत करतात." असे करण्याचा एक मार्ग म्हणजे डेटा वापरण्यास अधिक सक्षम करणे, विविध प्रकारचे वापरकर्त्यांपैकी जे त्याचा वापर करू शकतात किंवा त्यात योगदान देऊ शकतात.

इन्फोनोमिक्स अत्यावश्यक

2017 च्या अखेरीस डेटा कॅटलॉगची नाटकीय वाढती मागणी लक्षात घेऊन गार्टनरने त्यांना "नवीन काळा" म्हणून संबोधले. "वेगाने वितरित आणि अव्यवस्थित डेटा मालमत्ता तयार करणे आणि त्यांची माहिती पुरवठा साखळी तयार करणे आणि त्यांचे वर्गीकरण करणे यासाठी एक जलद आणि किफायतशीर उपाय म्हणून त्यांची ओळख बनत चालली आहे." "इन्फोनॉमिक्स" च्या वाढीमुळे याची आवश्यकता निर्माण झाली आहे, ज्यात इतर व्यवसायिक मालमत्ता व्यवस्थापित करण्याप्रमाणेच माहितीच्या मागोवा घेण्याइतकीच सावधपणा लागू करण्याची आवश्यकता आहे. (पुरवठा साखळ्यांवरील अधिक माहितीसाठी, मशीन शिक्षण कसे पुरवठा साखळीची क्षमता सुधारू शकते.)


गार्टनर्स फॉरेस्टर वेव्ह j: मशीन लर्निंग डेटा कॅटलॉग, Q2 2018 सह जिबस घेतात. त्या अहवालातील सर्वेक्षणातील निम्म्याहून अधिक जणांनी सांगितले की ते त्यांचे डेटा कॅटलॉगची अंमलबजावणी करण्याच्या विचारात आहेत. बहुधा त्यांच्या संस्थेमध्ये कमीतकमी सात डेटा तलाव होते या वस्तुस्थितीमुळे ते मोठ्या प्रमाणात प्रेरित झाले होते. जसे गार्टनर डेटा कॅटलॉगवर स्पष्टीकरण देतात, डेटा कॅटलॉग विशेषतः डेटा लेकमध्ये अवर्गीकृत स्वरूपात सोडलेला "कोन, डेटा आणि डेटाचे मूल्य" बाहेर काढण्यासाठी उपयुक्त असतात.

फॉरेस्टर अहवाल देतो की २०१ 2017 मध्ये एक तृतीयांश डेटा आणि विश्लेषक निर्णय घेणारे 1000TB किंवा त्याहून अधिक डेटाचे व्यवहार करीत होते, ही रक्कम वर्षापूर्वी केवळ 10 ते 14 टक्क्यांनी कमी आहे. त्या प्रमाणात डेटा व्यवस्थापित करणे ही एक वाढती आव्हान किंवा विशेषत: दोन आव्हाने आहेत:

"१) विद्यमान व्यवसाय प्रक्रियेस त्याचे विश्लेषण करण्यासाठी स्रोत डेटावर विलीन करणे आणि अंतर्दृष्टी अंमलबजावणी करणे आणि २) डेटा वाढत असताना सोर्सिंग, एकत्रित करणे, व्यवस्थापित करणे आणि त्याचे संचालन करणे."

कोणतीही दोष नाही, तणाव नाही - आपले जीवन नष्ट न करता जीवन-बदलणारे सॉफ्टवेअर तयार करण्यासाठी चरण चरण बाय चरण

जेव्हा कोणालाही सॉफ्टवेअर गुणवत्तेची काळजी नसते तेव्हा आपण आपली प्रोग्रामिंग कौशल्ये सुधारू शकत नाही.

व्यवसायांसाठी डेटा कॅटलॉग काय करू शकतो

गार्टनर विशिष्ट मार्ग ओळखतो ज्यात डेटा कॅटलॉग माहिती आणि उत्पादनाच्या संस्थेचा प्रवाह सुधारू शकतो:

  • संस्थेस उपलब्ध असणारी अद्ययावत माहिती मालमत्ता यादीचे सहयोग आणि संप्रेषण.

  • संस्थांच्या डेटाचे अर्थपूर्ण व्याख्या आणि अर्थ परिभाषित करणार्‍या व्यवसायाच्या संज्ञेचा सामान्य शब्दकोष तयार करणे आणि त्याद्वारे परिभाषा विसंगतींमध्ये मध्यस्थी आणि निराकरण करण्याचे साधन प्रदान करते.

  • व्यवसाय आणि आयटी सहकार्यांना डेटा टिप्पणी करण्यास, दस्तऐवज करण्यास आणि सामायिक करण्यास सक्षम करण्यासाठी एक गतिशील आणि चपळ सहयोग वातावरण सक्षम करणे.

  • वंश आणि प्रभाव विश्लेषणासह डेटा वापर पारदर्शकता प्रदान करणे.

  • माहिती प्रशासन प्रक्रियेच्या समर्थनार्थ डेटाचे परीक्षण, ऑडिट आणि ट्रेसिंग.

  • डेटा वापर आणि पुनर्वापर, क्वेरी ऑप्टिमायझेशन आणि डेटा प्रमाणीकरणाचे अंतर्गत विश्लेषण वाढविण्यासाठी मेटाडेटा कॅप्चर करणे.

  • त्याच्या अस्तित्त्वात असलेल्या डेटाचे अस्तित्व शोधून काढणे, संप्रेषण करणे आणि त्याचे विश्लेषण करून माहिती संकलित करणे, तिचा डेटा कोठून आला आहे, कोणत्या बाबींमध्ये वापरला आहे, याची आवश्यकता का आहे, प्रक्रिया आणि प्रणाली यांच्यात ते कसे वाहते, त्यासाठी जबाबदार कोण आहे, याचा अर्थ काय आहे आणि त्याचे काय मूल्य आहे.

संघटनेतील महत्त्वाच्या लोकांकरिता डेटा योग्यरित्या ओळखणे आणि त्यांच्यापर्यंत पोहोचणे महत्वाचे आहे, असे गार्टनर अहवालात म्हटले आहे की, “डिजिटल व्यवसायाच्या निकालांसाठी डेटा मालमत्ता कमाई करण्याचा मार्ग शोधण्यासाठी नव्हे तर नियमांचे पालन करणे म्हणजे ते उद्योग आहेत- हेल्थ इन्शुरन्स पोर्टेबिलिटी आणि अकाउंटबिलिटी अ‍ॅक्ट (एचआयपीएए) किंवा सामान्य डेटा प्रोटेक्शन रेग्युलेशन (जीडीपीआर) सारख्या सामान्य प्रकारासारखे विशिष्ट.

मशीन लर्निंग मध्ये जोडणे

पण त्याच्या कमतरतांशिवाय काहीही नाही. डेटा कॅटलॉगसाठी, समस्या ठेवणे आवश्यक असलेल्या सर्व मेटाडेटासह व्यक्तिचलितरित्या तयार करण्यात हळूहळू आणि कंटाळवाणा प्रक्रिया आहे. मशीन लर्निंग घटक येतो.

फॉरेस्टरने ज्या डेटा कॅटलॉगचे मूल्यांकन केले आहे त्यांना एमएलडीसी म्हटले जाते कारण ते मशीनच्या शिक्षणाची शक्ती वापरतात, एआयच्या घटकांपैकी एक. पोडियम डेटा ब्लॉगने स्पष्ट केल्याप्रमाणे, "मेटाडेटाचे कायमस्वरूपी रेपॉजिटरी तयार करणे आणि नंतर अंतर्निहित डेटा मालमत्तेच्या आसपास संभाव्य उपयुक्त अंतर्दृष्टी उघड करण्यासाठी आणि एमएल / एआय लागू करणे शक्य करते."

कसे निवडावे

कोणत्या व्यवसायाची निवड करावी हे ठरवण्यासाठी संस्थांना मदत करण्यासाठी, फॉरेस्टरने अव्वल 12 एमएलडीसीवर मूल्यांकनचे 29 गुण लागू केले. आयबीएम, रीलिटो, युनिफाई सॉफ्टवेअर, Aलेशन आणि कोलिब्रा: या बाजारपेठेतील पुढा .्यांनी त्यास ओळखले. त्यांना सापडलेल्या मजबूत परफॉर्मर्समध्ये इनफॉर्मेटिका, ओरॅकल, वॉटरलाइन डेटा, इन्फोगिक्स, केंब्रिज सिमेंटिक्स आणि क्लौडेरा आहेत. हॉर्टनवर्क्स "प्रतिस्पर्धी" या श्रेणीत एकटेच उभा आहे.

तथापि, एकूणच क्रमवारीनुसार कोणीही जाऊ नये. अहवालात प्रत्येकाची विशिष्ट शक्ती आणि कमकुवतपणा कमी होते. त्यानुसार, संशोधन आणि विकास यासारख्या एखाद्या विशिष्ट वैशिष्ट्यास एखाद्या संस्थेसाठी अत्यंत महत्त्व असेल तर ते त्या बाबीसाठी हॉर्टनवर्क्सला आयबीएम आणि कॉलिब्राच्या बरोबरीचे मानू शकेल कारण त्या तिघांनी त्या गुणवत्तेसाठी पाच गुणांची भागीदारी केली होती, अ‍ॅलेशन आणि कोलौडेरापेक्षा दोन गुण चांगले आणि केंब्रिज सिमेंटिकपेक्षा चार गुण चांगले.

त्यानुसार, फॉरस्टर अहवाल हा रेकॉर्ड वापरणा those्यांना सल्ला देतो की शीर्ष क्रमांकाची कंपनी प्रत्येकासाठी सर्वात चांगली निवड आहे असे समजू नका. त्यांच्या विशिष्ट आवश्यकता कशा पूर्ण करतात हे शोधण्यासाठी त्यांनी मूल्यांकन बिघडण्याकडे बारीक लक्ष दिले पाहिजे.