नालिटिक्समुळे व्यवसायात सुधारणा कशी होईल? - तंत्रज्ञान भाग 2 उतारा

लेखक: Eugene Taylor
निर्मितीची तारीख: 14 ऑगस्ट 2021
अद्यतन तारीख: 7 मे 2024
Anonim
नालिटिक्समुळे व्यवसायात सुधारणा कशी होईल? - तंत्रज्ञान भाग 2 उतारा - तंत्रज्ञान
नालिटिक्समुळे व्यवसायात सुधारणा कशी होईल? - तंत्रज्ञान भाग 2 उतारा - तंत्रज्ञान



स्रोत: फ्लिकर / जेम्स रॉयल-लॉसन

टेकवे:

होस्ट एरिक कवानाग डेटाबेस वैज्ञानिक आणि उद्योगातील नेत्यांसह व्यवसायात विश्लेषणाच्या वापराबद्दल चर्चा करतात.

संपादक टीपः हे आमच्या मागील वेबकास्टपैकी एकाचे उतारे आहे. पुढील भाग लवकर येत आहे, नोंदणी करण्यासाठी येथे क्लिक करा.


एरिक कवानाग: स्त्रिया व सज्जनांनो, नमस्कार आणि पुन्हा एकदा टेकवॉईजच्या भाग 2 मध्ये आपले स्वागत आहे. होय, खरोखरच शहाण्या लोकांची वेळ आली आहे! त्या प्रयत्नात आम्हाला मदत करण्यासाठी मला आज लाईनवर खरोखर हुशार लोकांचा समूह मिळाला आहे. माझे नाव एरिक कवानाग नक्कीच आहे. या विजेच्या सत्रासाठी मी तुमचा यजमान होईन. लोकांनो, आमच्याकडे येथे बर्‍याच सामग्री आहे. आमच्या व्यवसायात काही मोठी नावे आहेत, जी आमच्या जागेत विश्लेषक आणि सर्वात मनोरंजक चार विक्रेते आहेत.तर आज आम्ही कॉलवर बर्‍यापैकी चांगली कृती करणार आहोत. आणि नक्कीच, प्रेक्षकांमध्ये प्रश्न विचारण्यात आपण महत्त्वपूर्ण भूमिका बजावत आहात.


तर पुन्हा एकदा हा शो टेक वाईज आहे आणि आज विषय आहे "अ‍ॅनॅलिटिक्स व्यवसाय कसे सुधारू शकेल?" अर्थात, हा एक चर्चेचा विषय आहे जिथे आपण करू शकत असलेल्या विविध प्रकारचे विश्लेषणे समजून घेण्याचा प्रयत्न करणार आहे आणि त्यामुळे आपल्या ऑपरेशन्समध्ये सुधारणा कशी होईल कारण दिवसाच्या शेवटी असेच होते.

म्हणून आपण वरच्या बाजूस मला वर पाहू शकता, हे खरोखर आपले आहे. जॉर्ज मेसन विद्यापीठाचे एक चांगले मित्र डॉ. तो एक प्रचंड डेटा अनुभव असलेले डेटा वैज्ञानिक आहे, या जागेत खूप खोल कौशल्य आणि डेटा खनन आणि मोठा डेटा आणि सर्व प्रकारच्या मजेदार सामग्री आहे. आणि अर्थातच आमच्याकडे ब्लॉर ग्रुपचे मुख्य विश्लेषक डॉ. रॉबिन ब्लॉर आहेत. ज्याने बर्‍याच वर्षांपूर्वी अभयारण्य म्हणून प्रशिक्षण दिले. आणि शेवटच्या अर्ध्या दशकात त्याने या संपूर्ण मोठ्या डेटा स्पेस आणि विश्लेषक जागेवर खरोखर लक्ष केंद्रित केले आहे. आम्ही ब्लू ग्रुप प्रति से. ला पाच वर्षे पूर्ण केली आहेत. जेव्हा आपण मजा करता तेव्हा वेळ उडते.

आम्ही पेंटाहोचे मुख्य आर्किटेक्ट विल गोर्मन कडून देखील ऐकत आहोत; स्टीव्ह विल्क्स, वेबएक्शनचे सीसीओ; फ्रँक सँडर्स, मार्कलॉजिकचे टेक्निकल डायरेक्टर; आणि ट्रेझर डेटाचे संचालक हॅना स्मॉलट्री. मी म्हटल्याप्रमाणे, ही बरीच सामग्री आहे.

मग विश्लेषणे आपल्या व्यवसायास कशी मदत करू शकतात? बरं, हे अगदी स्पष्टपणे तुमच्या व्यवसायाला कसं मदत करू शकत नाही? असे सर्व प्रकार आहेत की विश्लेषणे आपल्या संस्थेस सुधारित करणार्‍या गोष्टी करण्यासाठी वापरता येतील.

तर ऑपरेशन सुव्यवस्थित करा. हे असे आहे जे आपण विपणन किंवा महसूल वाढविणे किंवा संधी ओळखणे यासारख्या गोष्टींबद्दल आपण जितका ऐकत नाही. परंतु आपल्या ऑपरेशन्सचे सुलभ करणे ही खरोखर आपल्यासाठी खरोखर शक्तिशाली गोष्ट आहे जी आपण आपल्या संस्थेसाठी करू शकता कारण आपण अशा ठिकाणी ओळखू शकता जिथे आपण एकतर काहीतरी आउटसोर्स करू शकता किंवा आपण एखाद्या विशिष्ट प्रक्रियेमध्ये डेटा जोडू शकता. आणि एखाद्यास कॉल करण्यासाठी फोन उचलण्याची आवश्यकता नसल्यास किंवा कोणासही याची आवश्यकता नसल्यास हे प्रवाहात आणू शकते. असे बरेच भिन्न मार्ग आहेत की आपण आपले ऑपरेशन्स सुव्यवस्थित करू शकता. आणि हे सर्व खरोखरच आपली किंमत कमी करण्यात मदत करते, बरोबर? ती एक की आहे, ती किंमत कमी करते. परंतु हे आपल्याला आपल्या ग्राहकांची सेवा अधिक चांगल्या प्रकारे करण्यास अनुमती देते.

आणि जर आपण लोक अधीर कसे झाले याचा विचार केला तर आणि आम्ही वापरत असलेल्या आमच्या शो, सेवा प्रदात्यांसह देखील लोक ऑनलाइन कसे संवाद साधतात या दृष्टीने हे प्रत्येक दिवस मी पाहतो. लोकांचा धैर्य, लक्ष वेधण्यासाठी, दिवसेंदिवस कमी आणि कमी होत जातो. आणि याचा अर्थ असा आहे की आपल्याला एक संघटना म्हणून आपल्या ग्राहकांना संतुष्ट करण्यात सक्षम होण्यासाठी वेगवान आणि वेगवान कालावधीमध्ये प्रतिसाद देणे आवश्यक आहे.

तर, उदाहरणार्थ, जर एखादी व्यक्ती आपल्या वेबकास्ट साइटवर असेल किंवा काही शोधण्याचा प्रयत्न करीत असेल तर ते निराश झाले आणि ते गेले तर ठीक आहे, कदाचित आपण नुकताच एखादा ग्राहक गमावला असेल. आणि आपण आपल्या उत्पादनावर किंवा सेवेसाठी किती शुल्क आकारता यावर अवलंबून आहे आणि कदाचित ही एक मोठी गोष्ट आहे. तर सर्वात महत्त्वाची ओळ ही आहे की विश्लेषणे लागू करण्याच्या सर्वात लोकप्रिय जागांपैकी एक सुलभ ऑपरेशन आहे. आणि आपण आकडेवारी पाहून, डेटा क्रंच करून, शोधून काढता, उदाहरणार्थ, "अहो, आम्ही आमच्या वेबसाइटच्या पृष्ठावरील इतके लोक का गमावत आहोत?" "आत्ता आम्हाला यापैकी काही फोन कॉल का मिळत आहेत?"

आणि या प्रकारच्या सामग्रीस जितक्या वास्तविक वेळेस प्रतिसाद देता येईल तितक्या उशीर होण्यापूर्वी आपण परिस्थितीची स्थिती जाणून घेण्याविषयी आणि त्याबद्दल काहीतरी करण्याची शक्यता अधिक चांगली असते. कारण अशी वेळ येते की जेव्हा एखादी गोष्ट एखाद्या व्यक्तीबद्दल अस्वस्थ होते, ते असमाधानी असतात किंवा ते काहीतरी शोधण्याचा प्रयत्न करीत असतात परंतु ते निराश असतात; आपणास त्यांच्यापर्यंत पोचण्यासाठी, त्यांना पकडण्यासाठी, त्या ग्राहकाशी संवाद साधण्यासाठी संधीची एक विंडो मिळाली. आणि जर आपण योग्य मार्गाने हे अचूक डेटा किंवा ग्राहकांच्या चित्रासह केले तर - हा ग्राहक कोण आहे, त्यांची नफा काय आहे, त्यांची प्राधान्ये काय आहेत हे समजून घेतल्यास - जर आपण खरोखर त्यासंदर्भात हँडल मिळवू शकलात तर आपण ते करत आहात आपल्या ग्राहकांना धरून ठेवणे आणि नवीन ग्राहक मिळविणे हे एक उत्तम काम आहे. आणि हेच त्याबद्दल आहे.

तर त्यासह, मी हे खरं सांगत आहे, खरंच, आज कॉलवर आमच्या डेटा वैज्ञानिकांपैकी एक कर्क बोर्नला. लोकांनो, आजकाल ते दुर्मिळ आहेत. आमच्यापैकी कमीतकमी दोन कॉल आमच्याकडे आहेत जेणेकरून ते खूप मोठे आहे. त्यासह, कर्क, मी विश्लेषणे आणि त्या व्यवसायास कसा मदत करतो याबद्दल बोलण्यासाठी मी ते आपल्याकडे देणार आहे. त्यासाठी जा.

डॉ. कर्क बोर्ने: ठीक आहे, एरीक तुमचे खूप खूप आभार. आपण मला ऐकू शकता?

एरिक: ठीक आहे, पुढे जा.

डॉ. कर्क: ठीक आहे, चांगले. मी पाच मिनिटे बोललो तर मला फक्त सामायिक करायचं आहे आणि लोक माझ्याकडे हात फिरवत आहेत. म्हणून आपण या विषयावर खरोखरच बाधा निर्माण केल्याबद्दल उद्घाटनाची टिप्पणी, एरिक, पुढील काही मिनिटांत मी याबद्दल थोडक्यात बोलणार आहे, डेटाच्या समर्थनार्थ निर्णय घेण्याकरिता डेटा आणि विश्लेषणाचा तेथे वापर आहे. ऑपरेशनल स्ट्रीमलाइनिंग बद्दल तुम्ही केलेली टिप्पणी, माझ्या दृष्टीने ती ऑपरेशनल ticsनालिटिक्सच्या या संकल्पनेत येते ज्यामध्ये आपण विज्ञान अनुप्रयोग, व्यवसाय, सायबर सुरक्षा आणि कायद्याची अंमलबजावणी असो किंवा नाही याचा जगभरातील प्रत्येक अनुप्रयोगात आपण पाहू शकता. सरकार, आरोग्य सेवा. आमच्याकडे डेटाचा प्रवाह असणार्‍या आणि आम्ही त्या डेटा प्रवाहात दिसणार्‍या इव्हेंट्स आणि अ‍ॅलर्ट आणि वर्तन यांच्या प्रतिक्रिया म्हणून आम्ही काही प्रकारचे प्रतिसाद किंवा निर्णय घेत आहोत.

आणि म्हणूनच आज मी ज्या गोष्टींबद्दल बोलू इच्छितो त्यापैकी एक म्हणजे आपण कृती घेण्यासाठी निर्णय घेऊ शकू अशा बिंदूवर पोहोचण्यासाठी आपण मोठ्या डेटामधून ज्ञान आणि अंतर्दृष्टी कसे प्राप्त करीत आहात. आणि वारंवार आम्ही याबद्दल ऑटोमेशन कॉनमध्ये बोलतो. आणि आज मला लूपमधील मानवी विश्लेषकांसह स्वयंचलित मिश्रण करू इच्छित आहे. तर याचा अर्थ असा आहे की व्यवसायातील विश्लेषक येथे पैज लावण्यापासून, पात्रतेनुसार, विशिष्ट कृतींचे प्रमाणीकरण करण्यास किंवा मशीनमधून शिकवण्याच्या नियमांमध्ये महत्त्वपूर्ण भूमिका बजावते. परंतु आम्ही ज्या बिंदूवर पोहोचलो आहोत जिथे आम्ही मिळवलेल्या व्यवसायाचे नियम आणि आम्हाला सतर्क करण्याची यंत्रणा वैध आहे यावर आपल्याला जास्त विश्वास आहे, तर आपण त्या स्वयंचलित प्रक्रियेकडे वळवू शकतो. आम्ही प्रत्यक्षात असे करतो की एरिक बोलत असलेले ऑपरेशनल स्ट्रीमलाइनिंग.

म्हणून येथे माझ्या शब्दांवर थोडेसे नाटक आहे परंतु मी आशा करतो की हे आपल्यासाठी कार्य करत असल्यास, मी डी 2 डी आव्हानाबद्दल बोललो. आणि डी 2 डी, सर्व बाधांमधील निर्णयांचा डेटाच नाही तर आम्ही या स्लाइडच्या तळाशी क्रमवार पहात आहोत आशा आहे की आपण हे पाहू शकता, आमच्या विश्लेषणेच्या पाइपलाइनवरून शोध आणि कमाईच्या डॉलर्समध्ये वाढ.

तर या फसवणूकीत, माझ्याकडे येथे स्वतःकडे विक्रेत्याची भूमिका आहे जी आता मी कार्य करीत आहे आणि ती आहे; आपण करू इच्छित असलेली पहिली गोष्ट म्हणजे आपला डेटा वैशिष्ट्यीकृत करणे, वैशिष्ट्ये काढणे, आपल्या ग्राहकांची वैशिष्ट्ये किंवा ती आपल्या अस्तित्वात असलेल्या ट्रॅकचा मागोवा घेणारी कोणतीही संस्था काढून टाकणे. कदाचित हे आरोग्य विश्लेषक वातावरणात एक रुग्ण असेल. आपण एखाद्या सायबर सुरक्षिततेच्या समस्येचा क्रम पहात असल्यास कदाचित तो वेब वापरकर्ता असेल. परंतु वैशिष्ट्यीकृत करा आणि वैशिष्ट्ये काढा आणि नंतर त्या व्यक्तीबद्दल, त्या घटकाबद्दल काही कॉन काढा. आणि मग आपण नुकतेच तयार केलेले तुकडे गोळा करता आणि त्या संग्रहात काही प्रकारचे ठेवले जेथून आपण नंतर मशीन शिक्षण अल्गोरिदम लागू करू शकता.

मी हे असे म्हणण्याचे कारण असे आहे की, असे म्हणू द्या की आपल्याकडे विमानतळावर पाळत ठेवणारा कॅमेरा आहे. व्हिडिओ स्वतः एक प्रचंड, मोठा आवाज आहे आणि तो अगदी अ-रचनात्मक देखील आहे. परंतु आपण व्हिडिओ पाळत ठेवणे, चेहर्यावरील बायोमेट्रिक्समधून माहिती काढू शकता आणि पाळत ठेवण्याच्या कॅमेर्‍यातील व्यक्ती ओळखू शकता. म्हणून उदाहरणार्थ विमानतळात, आपण विशिष्ट व्यक्ती ओळखू शकता, आपण एकाधिक पाळत ठेवणार्‍या कॅमे in्यात समान व्यक्तीची ओळख करुन विमानतळावरून त्यांचा मागोवा घेऊ शकता. आपण खरोखर खाण आणि ट्रॅकिंग करत आहात की काढलेली बायोमेट्रिक वैशिष्ट्ये वास्तविक तपशीलवार व्हिडिओ नाही. परंतु एकदा आपल्याकडे ते उतारे झाल्यानंतर आपण एखाद्या विशिष्ट प्रकरणात कारवाई करण्याची आवश्यकता आहे की काहीतरी चुकीचे घडले आहे किंवा आपल्याकडे ऑफर करण्याची संधी आहे की नाही यावर निर्णय घेण्यासाठी आपण मशीन शिक्षण नियम आणि विश्लेषक लागू करू शकता. उदाहरणार्थ, आपण विमानतळावर एखादे दुकान असल्यास आणि तो ग्राहक आपल्या मार्गावर येत असल्याचे आपल्याला दिसत असेल आणि त्या ग्राहकाबद्दल आपल्याला इतर माहितीवरून हे माहित असेल की कदाचित त्याला ड्यूटी-फ्री शॉपमध्ये सामान खरेदी करण्यात रस असेल किंवा असं काहीतरी, त्या ऑफर करा.

तर मी कोणत्या प्रकारच्या गोष्टींचे वैशिष्ट्य आणि संभाव्यतेद्वारे अभिप्रेत आहे? वैशिष्ट्य म्हणजे मी पुन्हा डेटामधील वैशिष्ट्ये आणि वैशिष्ट्ये काढत आहे. आणि हे एकतर मशीन व्युत्पन्न केले जाऊ शकते, त्यानंतर त्याचे अल्गोरिदम प्रत्यक्षात काढू शकतात, उदाहरणार्थ, व्हिडिओ किंवा भावना विश्लेषणातून बायोमेट्रिक स्वाक्षरी. ऑनलाइन पुनरावलोकने किंवा सोशल मीडियाद्वारे आपण ग्राहकांची भावना मिळवू शकता. यापैकी काही गोष्टी मानव व्युत्पन्न होऊ शकतात, जेणेकरुन मानव, व्यवसाय विश्लेषक, पुढील स्लाइडमध्ये मी दर्शवित असलेल्या अतिरिक्त वैशिष्ट्ये काढू शकेल.

यापैकी कित्येकांना गर्दीची सोय होऊ शकते. आणि गर्दीमुळे, आपण त्याबद्दल विचार करू शकता असे बरेच भिन्न मार्ग आहेत. परंतु अगदी सहजपणे, उदाहरणार्थ, आपले वापरकर्ते आपल्या वेबसाइटवर येतात आणि त्यांनी शोध शब्द, कीवर्ड ठेवले आणि ते एका विशिष्ट पृष्ठावर समाप्त होतात आणि त्या पृष्ठावर तेथे खरोखर वेळ घालवतात. ते खरंच, किमान ते समजतात की ते त्या पृष्ठावरील गोष्टींवर पहात आहेत, ब्राउझ करीत आहेत. आपल्याला काय म्हणायचे आहे की त्यांनी अगदी सुरुवातीला टाइप केलेला कीवर्ड त्या पृष्ठाचा वर्णनकर्ता आहे कारण त्याने ग्राहकांना अपेक्षित असलेल्या पृष्ठावर आणले आहे. आणि म्हणूनच आपण हा अतिरिक्त माहितीचा तुकडा जोडू शकता, हा कीवर्ड वापरणारे ग्राहक हे आमच्या माहिती आर्किटेक्चरमध्ये हे वेबपृष्ठ खरोखर त्या कीवर्डशी जुळणारी सामग्री म्हणून ओळखले गेले.

आणि म्हणूनच गर्दीसोर्सिंग ही आणखी एक गोष्ट आहे जी कधीकधी लोक विसरतात, आपल्या ग्राहकांच्या ब्रेडक्रॅम्सचा मागोवा घेण्याचा प्रकार म्हणजे बोलणे; ते त्यांच्या जागेवर कसे जातील, मग ती ऑनलाइन मालमत्ता असो वा वास्तविक मालमत्ता. आणि मग त्या मार्गाचा वापर करा म्हणजे ग्राहक आम्ही ज्या गोष्टी पहात आहोत त्याविषयी अतिरिक्त माहिती घेते.

म्हणून मला मानवी-व्युत्पन्न गोष्टी, किंवा मशीन व्युत्पन्न म्हणायच्या आहेत विशिष्ट डेटा ग्रॅन्यूलस किंवा घटकांचे भाष्य करणे किंवा टॅग करणे क्रमवारीत एक कॉन येत. त्या संस्था रूग्णालयांच्या सेटींगमधील रूग्ण असोत, ग्राहक किंवा काहीही. आणि म्हणून विविध प्रकारचे टॅगिंग आणि भाष्ये आहेत. त्यातील काही डेटाबद्दलच आहे. त्या गोष्टी म्हणजे एक प्रकारची माहिती, कोणत्या प्रकारची माहिती, कोणत्या प्रकारची माहिती, वैशिष्ट्ये कोणती, आकार, कदाचित उरेस व नमुने, विसंगती, विसंगती नसलेली वागणूक. आणि मग काही शब्दार्थ काढा, म्हणजेच हे मला माहित असलेल्या इतर गोष्टींशी कसे संबंधित आहे किंवा हा ग्राहक इलेक्ट्रॉनिक्स ग्राहक आहे. हा ग्राहक कपड्यांचा ग्राहक आहे. किंवा या ग्राहकाला संगीत खरेदी करणे आवडते.

त्याबद्दल काही शब्दार्थ ओळखून, संगीत आवडणारे हे ग्राहक करमणूक पसंत करतात. कदाचित आम्ही त्यांना काही अन्य मनोरंजन मालमत्ता ऑफर करू शकू. म्हणून शब्दार्थ आणि काही प्राविण्य समजून घेणे, जे मुळात असे म्हणत आहे: हे कोठून आले, हे प्रतिपादन कोणी केले, कोणत्या वेळेस, कोणत्या तारखेस, कोणत्या परिस्थितीत ठेवले?

म्हणून एकदा आपल्याकडे त्या सर्व भाष्ये आणि वैशिष्ट्ये असल्यास, त्या नंतर जोडा पुढील चरण, जे कोन आहे, क्रमवारीत कोण आहे, काय, कधी, कुठे आणि का ते. वापरकर्ता कोण आहे? ते कोणत्या चॅनेलवर आले होते? माहितीचा स्रोत काय होता? या विशिष्ट माहितीच्या माहिती किंवा डेटा उत्पादनामध्ये आम्ही कोणत्या प्रकारचे पुनर्वापर पाहिले आहेत? आणि व्यवसाय प्रक्रियेमध्ये हे एक प्रकारचे मूल्य आहे काय? आणि मग त्या गोष्टी संकलित करा आणि त्या व्यवस्थापित करा आणि आपल्याला त्या मार्गाने विचार करायचा असल्यास डेटाबेस तयार करण्यात वास्तविक मदत करा. त्यांना शोधण्यायोग्य, पुन्हा वापरण्यायोग्य बनवा, अन्य व्यवसाय विश्लेषकांद्वारे किंवा स्वयंचलित प्रक्रियेद्वारे, पुढील वेळी जेव्हा मला हे वैशिष्ट्यांचे संचा दिसतील तेव्हा सिस्टम ही स्वयंचलित कारवाई करू शकेल. आणि म्हणून आम्ही त्या प्रकारच्या परिचालन विश्लेषक कार्यक्षमतेवर पोहोचतो, परंतु जितके जास्त आम्ही उपयुक्त, सर्वसमावेशक माहिती संकलित करतो आणि नंतर या वापर प्रकरणांसाठी ती अचूक करतो.

आम्ही व्यवसाय खाली उतरलो. आम्ही डेटा doनालिटिक्स करतो. आम्ही स्वारस्यपूर्ण नमुने, आश्चर्यांसाठी, नवीनपणाचा शोध घेणारे, विसंगती शोधत आहोत. आम्ही लोकसंख्येमधील नवीन वर्ग आणि विभाग शोधत आहोत. आम्ही विविध घटकांमध्ये असोसिएशन आणि परस्परसंबंध आणि दुवे शोधत आहोत. आणि मग आपण आपला शोध, निर्णय आणि डॉलर कमावण्याची प्रक्रिया चालविण्यासाठी त्या सर्व गोष्टी वापरतो.

तर तिथे पुन्हा, येथे आमच्याकडे असलेली शेवटची डेटा स्लाइड मिळाली आहे जी केवळ मुळातच सारांश देत आहे, व्यवसाय विश्लेषकांना वळण देऊन, पुन्हा, आपण त्या माणसाला काढत नाही आणि त्या माणसाला तिथेच ठेवणे महत्वाचे आहे.

तर ही वैशिष्ट्ये, ती सर्व मशीनद्वारे किंवा मानवी विश्लेषकांनी किंवा अगदी गर्दीसोर्सिंगद्वारे प्रदान केली आहेत. आम्ही आमच्या मॉडेल्ससाठी आपले प्रशिक्षण सेट सुधारण्यासाठी आणि अधिक अचूक भविष्यवाणी करणारे मॉडेल्स, कमी चुकीचे पॉझिटिव्ह आणि नकारात्मक, अधिक कार्यक्षम वर्तन, आमच्या ग्राहकांशी किंवा कुणालाही अधिक कार्यक्षम हस्तक्षेप करणे यासाठी गोष्टींचे संयोजन वापरतो.

तर, दिवसाच्या शेवटी, आम्ही खरोखरच मानवी अनुभूतीच्या शक्तीसह मशीन शिक्षण आणि मोठा डेटा एकत्र करीत आहोत, ज्यायोगे अशा प्रकारचे टॅगिंग भाष्य भाषेचा भाग येतो. आणि यामुळे व्हिज्युअलायझेशन आणि व्हिज्युअल analyनालिटिक्स-प्रकाराद्वारे होऊ शकते साधने किंवा व्यस्त डेटा वातावरण किंवा क्राउडसोर्सिंग. आणि दिवसाच्या शेवटी, हे खरोखर काय करीत आहे ते आपला शोध, अंतर्दृष्टी आणि डी 2 डी निर्माण करीत आहे. आणि त्या माझ्या टिप्पण्या आहेत, म्हणून ऐकल्याबद्दल धन्यवाद.

एरीक: अहो, ते छान वाटले आणि मला पुढे जाऊ द्या आणि डॉ. रॉबिन ब्लॉरलाही त्याचा दृष्टीकोन सांगायला द्या. होय, मी तुम्हाला ऑपरेशन संकल्पनेच्या त्या सुलभतेबद्दल टिप्पणी ऐकण्यास आवडत आहे आणि आपण ऑपरेशनल ticsनालिटिक्सबद्दल बोलत आहात. मला वाटते की हे एक मोठे क्षेत्र आहे ज्याचा संपूर्ण शोध घेणे आवश्यक आहे. आणि मला अंदाज आहे, रॉबिनच्या आधी अगदी द्रुत, मी तुम्हाला परत आणीन, कर्क. यासाठी कंपनीमधील विविध खेळाडूंमध्ये आपणास काही महत्वाचे सहकार्य असणे आवश्यक आहे, बरोबर? आपल्याला ऑपरेशन लोकांशी बोलावे लागेल; आपण आपले तांत्रिक लोक मिळविले आहे. कधीकधी आपल्याला आपले विपणन लोक किंवा आपल्या वेब इंटरफेसचे लोक मिळतात. हे सामान्यत: भिन्न गट आहेत. गेममध्ये प्रत्येकाने आपली त्वचा कशी टाळावी याविषयी आपल्याकडे काही उत्तम सराव किंवा सूचना आहेत?

डॉ. किर्क: मला असे वाटते की हे सहकार्याच्या व्यवसाय संस्कृतीतून आले आहे. खरं तर, मी विश्लेषणात्मक संस्कृतीच्या तीन सी च्या प्रकाराबद्दल बोलतो. एक म्हणजे सर्जनशीलता; दुसरे म्हणजे कुतूहल आणि तिसरे म्हणजे सहकार्य. म्हणून आपणास सर्जनशील, गंभीर लोक हवे आहेत परंतु आपल्याला या लोकांना सहयोग देखील मिळावा लागेल. आणि हे खरोखर वरून सुरू होते, त्या व्यवसायाच्या सामान्य उद्दीष्ट्यांसाठी एकत्रितपणे कार्य केले पाहिजे आणि एकत्रितपणे कार्य केले पाहिजे अशा लोकांमध्ये ती संस्कृती तयार करण्याचा प्रकार आहे.

एरिक: हे सर्व काही समजते. आणि तसे करण्यासाठी आपणास खरोखर शीर्षस्थानी चांगले नेतृत्व हवे आहे. चला तर मग पुढे जाऊ आणि हे डॉ. ब्लॉर यांच्या स्वाधीन करा. रॉबिन, मजला आपला आहे.

डॉ. रॉबिन ब्लॉर: ठीक आहे. एरिक, त्या परिचयबद्दल धन्यवाद. ठीक आहे, हे मार्ग कसे बाहेर पडतात हे दर्शविते, कारण आमच्याकडे दोन विश्लेषक आहेत; मला विश्लेषकांचे सादरीकरण पहायला मिळते जे इतर मुले करत नाहीत. कर्क काय म्हणत आहे ते मला माहित आहे आणि मी अगदी पूर्णपणे वेगळा कोन जातो जेणेकरून आम्ही जास्त आच्छादित होणार नाही.

म्हणून मी येथे ज्याबद्दल बोलत आहे किंवा याबद्दल बोलण्याचा विचार करीत आहे ती डेटा विश्लेषकांची भूमिका विरूद्ध व्यवसाय विश्लेषकांची आहे. आणि ज्या प्रकारे मी त्याचे वैशिष्ट्यीकरण करीत आहे, काही प्रमाणात जीभ-इन-गाल ही एक प्रकारची जीकील आणि हायड गोष्ट आहे. सिद्धांततः डेटा शास्त्रज्ञांमधील फरक कमीत कमी ते काय करीत आहेत हे माहित आहे. व्यवसायाचे विश्लेषक तसे नसले तरी गणिताच्या कार्यपद्धतीनुसार ठीक आहे, कशावर विश्वास ठेवला जाऊ शकतो आणि कशावर विश्वास ठेवला जाऊ शकत नाही.

तर आपण हे करत आहोत या कारणास्तव खाली जाऊया, डेटा विश्लेषणामुळे अचानक आपण खूप मोठ्या प्रमाणात डेटाचे विश्लेषण करू शकू आणि संस्थेच्या बाहेरून डेटा काढू शकतो या वस्तुस्थितीला बाजूला ठेवून एक मोठी गोष्ट झाली; ते देते का? ज्या प्रकारे मी हे पाहतो - आणि मला वाटते की हे फक्त एक केस बनत आहे परंतु मला खात्री आहे की ते एक प्रकरण आहे - डेटा विश्लेषण खरोखर व्यवसाय आहे आर एंड डी. डेटा विश्लेषणासह आपण एका मार्गाने किंवा दुसर्‍या मार्गाने जे करत आहात ते म्हणजे आपण एका व्यवसायाची प्रक्रिया पाहत आहात किंवा एखाद्या ग्राहकांशी संवाद साधला आहे की नाही, ते आपल्या किरकोळ ऑपरेशनच्या मार्गाने आहे, आपण ज्या मार्गाने तैनात केले आहे आपले स्टोअर समस्या काय आहे हे खरोखर फरक पडत नाही. आपण दिलेल्या व्यवसाय प्रक्रियेकडे पहात आहात आणि आपण त्यास सुधारण्याचा प्रयत्न करीत आहात.

यशस्वी संशोधन आणि विकासाचा परिणाम ही एक बदल प्रक्रिया आहे. आणि नेहमीचे उदाहरण म्हणून आपण इच्छित असल्यास उत्पादनाच्या बाबतीत विचार करू शकता. कारण मॅन्युफॅक्चरिंगमध्ये लोक उत्पादन प्रक्रियेला प्रयत्न करून सुधारण्यासाठी प्रत्येक गोष्टीबद्दल माहिती गोळा करतात. परंतु मला वाटते की काय घडले आहे किंवा मोठ्या डेटावर काय घडत आहे हे सर्व आता कोणत्याही प्रकारच्या कोणत्याही व्यवसायात कोणालाही विचार करता येईल अशा प्रकारे लागू केले जात आहे. जर आपण त्याबद्दल डेटा एकत्रित करू शकत असाल तर कोणत्याही व्यवसायाची प्रक्रिया परीक्षेसाठी तयार आहे.

तर ती एक गोष्ट आहे. आपल्याला आवडत असल्यास ते डेटा विश्लेषणाच्या प्रश्नावर जात आहे. डेटा विश्लेषक व्यवसायासाठी काय करू शकते? बरं, हा व्यवसाय पूर्णपणे बदलू शकतो.

हा विशिष्ट आकृती ज्याचे मी कुठल्याही सखोलतेने वर्णन करणार नाही, परंतु आम्ही या वर्षाच्या पहिल्या सहा महिन्यांपर्यंत केलेल्या संशोधन प्रकल्पातील कळस म्हणून पुढे आलो आहोत. मोठ्या डेटा आर्किटेक्चरचे प्रतिनिधित्व करण्याचा हा एक मार्ग आहे. आणि पुढील स्लाइड्सवर जाण्यापूर्वी ब things्याच गोष्टी निदर्शनास आणण्याजोग्या आहेत. येथे दोन डेटा प्रवाह आहेत. एक वास्तविक-वेळ डेटा प्रवाह आहे जो आकृतीच्या वरच्या बाजूस जातो. दुसरा एक हळू डेटा प्रवाह आहे जो आकृतीच्या तळाशी जातो.

आकृतीच्या तळाशी पहा. आमच्याकडे डेटा जलाशय म्हणून हडूप झाला आहे. आमच्याकडे विविध डेटाबेस आहेत. आम्हाला तेथे संपूर्ण क्रियाकलापांचा एक संपूर्ण डेटा मिळाला आहे, त्यातील बहुतेक विश्लेषणात्मक क्रियाकलाप आहेत.

मी येथे बनवित असलेला मुद्दा आणि मला येथे खरोखर बनवायचा एकच मुद्दा म्हणजे तंत्रज्ञान कठीण आहे. हे सोपे नाही. हे सोपे नाही. हे असे नाही की गेममध्ये नवीन असलेले कोणीही प्रत्यक्षात एकत्र केले जाऊ शकते. हे बर्‍यापैकी गुंतागुंतीचे आहे. आणि जर आपण या सर्व प्रक्रियेवर विश्वासार्ह विश्लेषक करण्यासाठी एखाद्या व्यवसायाचे साधन बनवत असाल तर विशेषतः द्रुतपणे होणारी अशी गोष्ट नाही. यास मिश्रणात बरेच तंत्रज्ञान जोडण्याची आवश्यकता आहे.

ठीक आहे. डेटा सायंटिस्ट म्हणजे काय, हा प्रश्न मी डेटा सायंटिस्ट असल्याचा दावा करू शकतो कारण संगणकात प्रशिक्षण घेण्यापूर्वी माझे आकडेवारीत प्रत्यक्ष प्रशिक्षण होते. आणि मी काही कालावधीसाठी वास्तविक काम केले जेणेकरुन व्यवसायाचे आयोजन कसे करावे हे मला ठाऊक आहे, आकडेवारीचे विश्लेषण, स्वतः चालविण्यासाठी. ही क्षुल्लक गोष्ट नाही. आणि मानवी व तंत्रज्ञानाच्या बाजूने एक अतिशय उत्तम प्रॅक्टिस सामील आहे.

म्हणून "डेटा वैज्ञानिक काय आहे" असा प्रश्न विचारत असताना मी फ्रँकन्स्टेन पिक फक्त ठेवले कारण ते एकत्र विणलेल्या गोष्टींचे संयोजन आहे. प्रकल्प व्यवस्थापनात सामील आहे. आकडेवारीत खोलवर समज आहे. येथे डोमेन व्यवसाय कौशल्य आहे, जे डेटा वैज्ञानिकपेक्षा आवश्यक नसलेल्या व्यवसाय विश्लेषकांची समस्या आहे. डेटा आर्किटेक्चर समजून घेण्याची आणि डेटा आर्किटेक्चर तयार करण्यात सक्षम असणे आणि तेथे सॉफ्टवेअर अभियांत्रिकी गुंतलेली आहे याचा अनुभव किंवा गरज आहे. दुसर्‍या शब्दांत सांगायचे तर, हा बहुधा एक संघ आहे. हे कदाचित एक व्यक्ती नाही. आणि याचा अर्थ असा की हा एक विभाग आहे ज्यास संघटित करण्याची आवश्यकता आहे आणि त्याच्या संस्थेबद्दल बर्‍यापैकी विस्तृत विचार करणे आवश्यक आहे.

मशीन शिक्षणाची वस्तुस्थिती मिसळत आहे. आम्ही करू शकत नाही, म्हणजे, मशीनी शिक्षण या अर्थाने मशीन लर्निंग हे नवीन नाही की मशीन शिक्षणात वापरल्या जाणा most्या बहुसंख्य सांख्यिकी तंत्रे कित्येक दशकांपासून ज्ञात आहेत. तेथे काही नवीन गोष्टी आहेत, म्हणजे न्यूरल नेटवर्क तुलनेने नवीन आहेत, मला वाटते की ते केवळ 20 वर्षांचे आहेत, म्हणून त्यातील काही तुलनेने नवीन आहेत. परंतु मशीन लर्निंगची समस्या ही होती की आमच्याकडे खरोखर हे करण्याची क्षमता नव्हती. आणि जे काही घडले त्याऐवजी आता संगणक शक्ती अस्तित्त्वात आहे. आणि याचा अर्थ असा आहे की आम्ही काय म्हणतो, डेटा शास्त्रज्ञांनी मॉडेलिंगच्या परिस्थितीत, डेटाचे सॅम्पलिंग आणि नंतर मार्शेलिंगच्या बाबतीत केले आहे जे डेटाचे सखोल विश्लेषण तयार करण्यासाठी करते. वास्तविक, आम्ही काही बाबतींत त्याकडे फक्त संगणक शक्ती टाकू शकतो. फक्त मशीन-लर्निंग अल्गोरिदम निवडा, त्यास डेटावर फेकून द्या आणि काय पुढे आले ते पहा. आणि हे असे काहीतरी आहे जे व्यवसाय विश्लेषक करू शकते, बरोबर? परंतु व्यवसाय विश्लेषक ते काय करीत आहेत हे समजून घेणे आवश्यक आहे. म्हणजे, मला वाटतं की हा मुद्दा खरोखरच आहे, इतर कोणत्याही गोष्टीपेक्षा जास्त.

ठीक आहे, व्यवसायाबद्दल त्याच्या डेटावरून इतर कोणत्याही मार्गांपेक्षा अधिक माहिती आहे. आईन्स्टाईन असं म्हणालं नाही, असं मी म्हणालो होतो. मी फक्त विश्वासार्हतेसाठी त्याचे चित्र लावले. परंतु प्रत्यक्षात अशी परिस्थिती विकसित होऊ लागली आहे जेथे तंत्रज्ञान, योग्यरित्या वापरले असल्यास आणि गणिताचा जर योग्य वापर केला असेल तर, एखादी व्यक्ती म्हणून व्यवसाय चालविण्यास सक्षम असेल. आम्ही हे आयबीएमसह पाहिले आहे. सर्व प्रथम, ते बुद्धीबळातील सर्वोत्तम मुलांना पराभूत करू शकले आणि नंतर ते संकटातल्या सर्वोत्तम मुलांना हरवू शकेल; परंतु अखेरीस आम्ही एखादी कंपनी चालवताना सर्वोत्कृष्ट लोकांना हरवू शकणार आहोत. आकडेवारी शेवटी विजय होईल. आणि ते कसे होणार नाही हे पाहणे कठीण आहे, अद्याप तसे झाले नाही.

तर मी काय म्हणत आहे, आणि हे माझ्या प्रेझेंटेशनचे पूर्ण प्रकार आहे, हे व्यवसायाचे हे दोन मुद्दे आहेत. प्रथम एक आहे, आपण तंत्रज्ञान बरोबर मिळवू शकता? आपण खरोखर त्या संघाचे तंत्रज्ञान कार्य करू शकता जे त्या अध्यक्षतेखाली सक्षम असेल आणि व्यवसायाचे फायदे मिळवू शकेल? आणि मग दुसरे म्हणजे, आपण लोकांना बरोबर आणू शकता? आणि हे दोन्ही मुद्दे आहेत. आणि ते असे मुद्दे आहेत जे वेळेवर नाहीत, ते म्हणतात की निराकरण केले आहे.

ठीक आहे एरिक, मी ते परत आपल्याकडे देईन. किंवा मी कदाचित ते विलकडे पाठवावे.

एरिक: वास्तविक, होय धन्यवाद, विल गोर्मन. होय, तेथे तुम्ही जा, विल. चला तर पाहूया. मी तुम्हाला वेबएक्सची कळ देतो. मग आपण काय चालले आहे? पेंटाहो, साहजिकच, आपण अगोदर थोडा वेळ आहात आणि ओपन-सोर्स स्त्रोत BI चा प्रकार ज्या ठिकाणी आपण प्रारंभ केला. परंतु आपल्याकडे पूर्वीपेक्षा बरेच काही मिळाले, म्हणून विश्लेषणासाठी या दिवसात काय मिळाले ते पाहूया.

विल गोर्मन: बिलकुल. नमस्कार मंडळी! माझे नाव विल गोर्मन आहे. मी पेंटाहो येथे मुख्य आर्किटेक्ट आहे. आपल्यापैकी ज्यांनी आमच्याविषयी ऐकले नाही त्यांच्यासाठी, मी नुकताच उल्लेख केला की पेंटाहो ही एक मोठी डेटा एकत्रीकरण आणि विश्लेषक कंपनी आहे. आम्ही दहा वर्षांपासून व्यवसायात आहोत. आमची उत्पादने मोठ्या डेटा समुदायासह एकत्रित विकसित झाली आहेत, डेटा एकत्रीकरण आणि विश्लेषणासाठी ओपन-सोर्स प्लॅटफॉर्म म्हणून सुरूवात केली, हदूप आणि नोएसक्यूएल सारख्या तंत्रज्ञानाद्वारे नवीन तंत्रज्ञानाची स्थापना तंत्रज्ञानाच्या आसपास अस्तित्त्वात आली. आणि आता आमच्याकडे ओपन सोर्सच्या सभोवतालच्या आमच्या नवीन शोधाचा परिणाम म्हणून 1500 पेक्षा जास्त व्यावसायिक ग्राहक आणि बर्‍याच उत्पादन भेटी आहेत.

आमची आर्किटेक्चर अत्यंत एम्बेड करण्यायोग्य आणि विस्तारनीय आहे, विशेषत: मोठी डेटा तंत्रज्ञान अत्यंत वेगवान वेगाने विकसित होत असल्याने लवचिक बनविण्यासाठी हेतू-निर्मित. पेंटाहो तीन मुख्य उत्पाद क्षेत्रे ऑफर करते ते म्हणजे मोठ्या डेटा ticsनालिटिक्स वापर प्रकरणे सोडविण्यासाठी एकत्र काम करणे.

आमच्या आर्किटेक्चरच्या सीमेवरील प्रथम उत्पादन म्हणजे पेंटाहो डेटा एकत्रीकरण जे डेटा तंत्रज्ञ आणि डेटा अभियंत्यांकडे लक्ष दिले आहे. हे उत्पादन डेटा पाइपलाइन परिभाषित करण्यासाठी व्हिज्युअल, ड्रॅग-एंड-ड्रॉप अनुभव देते तसेच मोठ्या डेटा वातावरणात आणि पारंपारिक वातावरणात डेटा ऑर्केस्ट्रेट करण्यासाठी प्रक्रिया करते. हे उत्पादन जावावर तयार केलेले एक हलके, मेटाडेटाबेस, डेटा-एकत्रीकरण प्लॅटफॉर्म आहे आणि मॅपरेड्यूस किंवा यार्न किंवा वादळ आणि इतर अनेक बॅच आणि रीअल-टाइम प्लॅटफॉर्मवर प्रक्रिया म्हणून तैनात केले जाऊ शकते.

आमचे दुसरे उत्पादन क्षेत्र व्हिज्युअल विश्लेषकांच्या आसपास आहे. या तंत्रज्ञानासह, संस्था आणि ओईएम आधुनिक ब्राउझर आणि टॅब्लेटद्वारे व्यवसाय विश्लेषक आणि व्यवसाय वापरकर्त्यांसाठी समृद्ध ड्रॅग-अँड-ड्रॉप व्हिज्युअलायझेशन आणि विश्लेषक अनुभव देऊ शकतात, ज्यायोगे अहवाल आणि डॅशबोर्ड तयार केले जाऊ शकतात. तसेच पिक्सेल-परिपूर्ण डॅशबोर्डिंग आणि अहवालांचे सादरीकरण.

आमचे तिसरे उत्पादन क्षेत्र डेटा वैज्ञानिक, मशीन-लर्निंग अल्गोरिदमसाठी लक्ष्यित भाकित विश्लेषकांवर लक्ष केंद्रित करते. पूर्वी नमूद केल्याप्रमाणे, न्यूरल नेटवर्क आणि अशाच प्रकारे डेटा ट्रान्सफॉर्मेशन वातावरणात समाविष्ट केले जाऊ शकते, ज्यामुळे डेटा शास्त्रज्ञांना मॉडेलिंगपासून उत्पादन वातावरणाकडे जाण्याची परवानगी मिळते आणि अंदाज वर्तविता प्रवेश मिळू शकतो आणि याचा परिणाम अगदी त्वरित, व्यवसाय प्रक्रियेवर होऊ शकतो.

ही सर्व उत्पादने कठोरपणे एकाच चपळ अनुभवात समाकलित झाली आहेत आणि आमच्या एन्टरप्राइझ ग्राहकांना त्यांच्या व्यवसायातील समस्यांकडे लक्ष देण्यासाठी आवश्यक लवचिकता देतात. पारंपारिक तंत्रज्ञानामध्ये मोठ्या डेटाचे द्रुतगतीने विकसनशील लँडस्केप आम्ही पहात आहोत. ईडीडब्ल्यूचा शेवट जवळ आला आहे हे आम्ही मोठ्या कंपन्यांमधील काही कंपन्यांकडून ऐकत आहोत. खरं तर, आम्ही आमच्या एंटरप्राइझ ग्राहकांमध्ये जे पहात आहोत ते म्हणजे विद्यमान व्यवसाय आणि आयटी प्रक्रियेत मोठा डेटा आणण्याची आणि त्या प्रक्रियेची जागा न घेण्याची गरज आहे.

हा साध्या रेखाचित्र आर्किटेक्चरमधील बिंदू दर्शवितो जो आपण बर्‍याचदा पाहतो, जो डेटा एकत्रीकरण आणि बीआय वापर प्रकरणांसह ईडीडब्ल्यू-तैनाती आर्किटेक्चरचा एक प्रकार आहे. आता हा आकृती मोठ्या डेटा आर्किटेक्चरवरील रॉबिनच्या स्लाइड प्रमाणेच आहे, यात रिअल-टाइम आणि ऐतिहासिक डेटा समाविष्ट आहे. जसजसे नवीन डेटा स्रोत आणि रीअल-टाइम आवश्यकता उद्भवतात, आम्ही एकूणच आयटी आर्किटेक्चरचा अतिरिक्त भाग म्हणून मोठा डेटा पाहतो. या नवीन डेटा स्रोतांमध्ये मशीन-व्युत्पन्न केलेला डेटा, संरचना नसलेला डेटा, मानक व्हॉल्यूम आणि गती आणि आम्ही मोठ्या डेटामध्ये ऐकत असलेल्या विविध आवश्यकतांचा समावेश आहे; ते पारंपारिक ईडीडब्ल्यू प्रक्रियेत बसत नाहीत. या डेटाचे अंतर्ग्रहण, डेटा प्रक्रिया करणे आणि व्हिज्युअलायझेशन तसेच ग्राहकांना त्यांच्या डेटा वातावरणात संपूर्ण दृष्टिकोन दर्शविण्यासाठी पारंपारिक स्त्रोतांसह या डेटाचे मिश्रण करणे सोपे करण्यासाठी पेन्टाहो हडोप आणि नंएसक्यूएल बरोबर काम करते. आम्ही हे नियमन पद्धतीने करतो जेणेकरून आयटी त्यांच्या व्यवसायासाठी संपूर्ण विश्लेषणाचे समाधान देऊ शकेल.

बंद केल्यावर, मी मोठा डेटा विश्लेषणे आणि एकत्रिकरण यांच्या आसपास आमचे तत्वज्ञान अधोरेखित करू इच्छितो; आमचा विश्वास आहे की ही तंत्रज्ञान एकाच युनिफाइड आर्किटेक्चरसह एकत्रितपणे कार्य करीत आहे, असंख्य असंख्य उपयोग प्रकरणांना सक्षम करते जे अन्यथा शक्य होणार नाही. आमच्या ग्राहकांचे डेटा वातावरण हे फक्त मोठा डेटा, हॅडूप आणि NoSQL पेक्षा अधिक आहे. कोणताही डेटा गोरा खेळ आहे. आणि मोठे डेटा स्रोत उपलब्ध असणे आवश्यक आहे आणि व्यवसायाच्या मूल्यावर परिणाम करण्यासाठी एकत्रितपणे कार्य करणे आवश्यक आहे.

अखेरीस, आमचा विश्वास आहे की उद्योजकांमधील या व्यवसायातील समस्या डेटाच्या माध्यमातून प्रभावीपणे सोडविण्यासाठी आयटी आणि व्यवसायाच्या ओळींनी एकत्रित कार्य करणे आवश्यक आहे, मोठ्या डेटा विश्लेषणासाठी नियोजित आणि एकत्रित दृष्टिकोनावर. एरिक, बोलण्यासाठी आपल्याला वेळ दिला त्याबद्दल तुमचे मनापासून आभार.

एरिक: तू पण पैज लाव. नाही, ती चांगली सामग्री आहे. आम्हाला प्रश्न व उत्तर मिळताच मला आपल्या आर्किटेक्चरच्या त्या बाजूकडे परत जायचे आहे. तर मग आपण उर्वरित सादरीकरणात जाऊ या आणि त्याबद्दल तुमचे आभारी आहोत. तुम्ही लोक नक्कीच गेल्या काही वर्षांत पटकन पुढे जात आहात, मला ते नक्कीच म्हणावे लागेल.

तर स्टीव्ह, मी पुढे जाऊ दे आणि तुला देईन. आणि तेथे फक्त खाली बाणावर क्लिक करा आणि त्यासाठी जा. स्टीव्ह, मी तुम्हाला कळ देतो. स्टीव्ह विल्क्स, तुमच्या कीबोर्डवरील त्या सर्वात खाली असलेल्या बाणावर क्लिक करा.

स्टीव्ह विल्क्स: तिथे आम्ही जाऊ.

एरिक: तिथे तुम्ही जा.

स्टीव्ह: जरी आपण मला दिलेली ती एक चांगली ओळख आहे.

एरिक: होय

स्टीव्ह: तर मी स्टीव्ह विल्क्स आहे. मी वेबएक्शन वर सीसीओ आहे. आम्ही फक्त गेल्या काही वर्षांपासून होतो आणि तेव्हापासून आम्ही नक्कीच वेगवान वाटचाल करत आहोत. वेबएक्शन एक रिअल-टाइम बिग डेटा ticsनालिटिक्स प्लॅटफॉर्म आहे. पूर्वी नमूद केलेला एरिक, प्रकारचा, वास्तविक वेळ किती महत्वाचा आहे आणि आपल्या अनुप्रयोगांना वास्तविक वेळ कसा मिळतो. आमचा प्लॅटफॉर्म रियल टाइम अ‍ॅप्स तयार करण्यासाठी डिझाइन केलेला आहे. आणि पुढच्या पिढीला डेटा-चालित अ‍ॅप्स सक्षम करण्यासाठी जे निरंतर तयार केले जाऊ शकतात आणि लोकांना त्या अ‍ॅप्समधून व्युत्पन्न केलेल्या डेटावरून डॅशबोर्ड तयार करण्याची परवानगी देण्यासाठी, परंतु रिअल टाइमवर लक्ष केंद्रित केले.

आमचा प्लॅटफॉर्म प्रत्यक्षात एक संपूर्ण टू-एंड-प्लॅटफॉर्म आहे जो डेटा संपादन, डेटा प्रक्रिया, डेटा व्हिज्युअलायझेशन पर्यंत सर्व काही करतो. आणि आमच्या एंटरप्राइझमधील विविध प्रकारच्या लोकांना एकत्र करुन कार्य करण्यास सक्षम करते रीअल-टाइम अॅप्स तयार करण्यासाठी, जे घडले त्याप्रमाणे त्यांच्या एंटरप्राइझमध्ये घडणार्‍या गोष्टींबद्दल त्यांना अंतर्दृष्टी देते.

आणि बहुतेक लोक मोठ्या डेटामध्ये पहात असलेल्या गोष्टींपेक्षा हे थोडेसे वेगळे आहे, जेणेकरून पारंपारिक दृष्टिकोन - चांगले, पारंपारिक गेल्या काही वर्षांपासून - मोठ्या डेटासह दृष्टिकोन भिन्न भिन्न स्त्रोतांमधून प्राप्त करण्यासाठी आणि नंतर त्यास मोठ्या जलाशयात किंवा तलावात किंवा आपण ज्याला कॉल करू इच्छित आहात त्यामध्ये ढकलून द्या. आणि त्यानंतर जेव्हा त्यावर क्वेरी चालविण्याची आवश्यकता असेल तेव्हा त्यावर प्रक्रिया करा; मोठ्या प्रमाणावर ऐतिहासिक विश्लेषण चालविण्यासाठी किंवा अगदी मोठ्या प्रमाणात डेटाची तदनुसार क्वेरी करणे. आता ते विशिष्ट वापर प्रकरणांमध्ये कार्य करते. परंतु आपण आपल्या एंटरप्राइझमध्ये सक्रिय होऊ इच्छित असाल तर दिवसाचा शेवट किंवा आठवड्याच्या शेवटी काही चुकीचे घडले आहे हे शोधण्याऐवजी आपल्याला खरोखर काय चालले आहे हे सांगायचे असेल तर आपल्याला खरोखर हलविण्याची आवश्यकता आहे वास्तविक वेळ

आणि यामुळे गोष्टी थोड्या थोड्या थोड्या अंतरावर स्विच होते. ते प्रक्रिया मध्यभागी हलवते. इतका प्रभावीपणे आपण एंटरप्राइझमध्ये सतत व्युत्पन्न होत असलेल्या मोठ्या प्रमाणात डेटाचे प्रवाह घेत आहात आणि आपण जसे मिळवाल तसे प्रक्रिया करत आहात. आणि आपण जसे मिळेल तसे यावर प्रक्रिया करीत असल्यामुळे आपल्याकडे सर्व काही संग्रहित करण्याची आवश्यकता नाही. आपण फक्त महत्वाची माहिती किंवा आपण ज्या गोष्टी लक्षात ठेवल्या पाहिजेत त्या खरोखरच घडल्या पाहिजेत. म्हणून जर आपण रस्त्यावरुन खाली फिरणा vehicles्या वाहनांच्या जीपीएस स्थानाचा मागोवा घेत असाल तर, दर सेकंदाला ते कोठे आहेत याची आपल्याला खरोखर काळजी नाही, आपण दर सेकंदाला कोठे आहेत हे आपल्याला संग्रहित करण्याची आवश्यकता नाही. आपल्याला फक्त काळजी करण्याची आवश्यकता आहे, त्यांनी हे ठिकाण सोडले आहे का? ते या ठिकाणी पोहोचले आहेत? त्यांनी फ्रीवेचा मार्ग वळविला आहे की नाही?

म्हणून हे लक्षात घेणे खरोखर महत्वाचे आहे की अधिकाधिक डेटा तयार होताना, त्यानंतर तीन वि. वेग दररोज किती डेटा व्युत्पन्न करतो हे मुळात निर्धारित करते. आपल्याला जितका संग्रहित करायचा तितका डेटा तयार केला जातो. आणि आपल्याकडे जितके अधिक संग्रहित करावे तितके कार्य होण्यास यास जास्त वेळ लागेल. परंतु आपण जसा मिळेल तसे त्यावर प्रक्रिया करू शकत असाल तर आपल्याला खरोखरच मोठा फायदा होईल आणि आपण त्यास प्रतिक्रिया देऊ शकता. आपल्याला असे सांगितले जाऊ शकते की नंतर गोष्टी शोधण्याऐवजी गोष्टी घडत आहेत.

म्हणून आमचे व्यासपीठ अत्यंत स्केलेबल करण्यासाठी डिझाइन केलेले आहे. यात तीन प्रमुख तुकडे आहेत - अधिग्रहण तुकडा, प्रक्रिया तुकडा आणि नंतर व्यासपीठाचे वितरण दृश्य भाग. अधिग्रहण बाजूला, आम्ही फक्त मशीनद्वारे व्युत्पन्न केलेला लॉग डेटा जसे की वेब लॉग किंवा इतर सर्व लॉग ज्याद्वारे व्युत्पन्न केले जात आहेत त्या अनुप्रयोगाकडे पहात नाही. आम्ही डेटाबेसमधून डेटा कॅप्चर करू आणि बदलू शकतो. मुळात ते आम्हाला सक्षम करते, आम्ही सादर केलेली ईटीएल बाजू आणि डेटाबेसच्या विरूद्ध क्वेरी चालवावी लागणारी पारंपारिक ईटीएल आम्ही पाहिली आहेत. जेव्हा डेटाबेसमध्ये गोष्टी घडतात तेव्हा आम्हाला सांगितले जाऊ शकते. आम्ही ते बदलतो आणि आम्ही ते हस्तगत करतो आणि त्या घटना प्राप्त करतो. आणि मग तेथे स्पष्टपणे सामाजिक फीड आणि थेट डिव्हाइस डेटा आहे जो आपल्यासाठी टीसीपी किंवा एसीडीपी सॉकेटवर पंप केला जात आहे.

डेटा मिळवण्याचे बरेच मार्ग आहेत. आणि व्हॉल्यूम आणि गतीविषयी बोलताना, आम्ही दररोज कोट्यावधी घटनांचे खंड पाहत आहोत, बरोबर? म्हणून हा डेटा खूप मोठा आहे आणि त्यावर प्रक्रिया करणे आवश्यक आहे.

आमच्या सर्व्हरच्या क्लस्टरद्वारे यावर प्रक्रिया केली जाते. सर्व्हरकडे सर्व एकसारखे आर्किटेक्चर आहे आणि सर्व समान गोष्टी करण्यास सक्षम आहेत. परंतु आपण त्या वेगवेगळ्या गोष्टी करण्यासाठी क्रमवारी लावू शकता. आणि सर्व्हरमधे आमच्याकडे हाय-स्पीड क्वेरी प्रोसेसिंग लेयर आहे जो आपल्याला डेटावरील काही वास्तविक-वेळ विश्लेषणे करण्यास सक्षम करतो, डेटाचे संवर्धन करण्यास, इव्हेंट परस्परसंबंधित करण्यास, वेळ विंडोमध्ये घडणार्‍या गोष्टींचा मागोवा घेण्यासाठी, भविष्यवाणी करण्यासाठी डेटामध्ये पाहिल्या जाणार्‍या नमुन्यावर आधारित विश्लेषणे. आणि नंतर तो डेटा वेगवेगळ्या ठिकाणी संग्रहित केला जाऊ शकतो - पारंपारिक आरडीबीएमएस, एंटरप्राइझ डेटा वेअरहाउस, हडूप, बिग डेटा इन्फ्रास्ट्रक्चर.

आणि समान लाइव्ह डेटा रीअल-टाइम डेटा-चालित अ‍ॅप्‍सची उर्जा देण्यासाठी देखील वापरला जाऊ शकतो. त्या अ‍ॅप्समध्ये काय चालले आहे याचे वास्तविक-वेळ दृश्य असू शकते आणि महत्त्वाच्या गोष्टी घडल्यास लोकांना सतर्क केले जाऊ शकते. दिवसाच्या शेवटी जाऊन त्याऐवजी खरोखर काहीतरी वाईट घडले हे जाणून घेण्याऐवजी आपण त्याबद्दल सावध होऊ शकेन कारण दुसरे आम्ही ते शोधून काढले आहे आणि ते काय आहे हे शोधण्यासाठी थेट पृष्ठाकडे जाईल. चालू आहे.

म्हणून जेव्हा मनोरंजक गोष्टी घडत असतात तेव्हा सांगितले जाते तेव्हा डेटाचे विश्लेषण केल्यापासून हे पूर्णपणे बदलते. आणि नंतर आमचा प्लॅटफॉर्म डेटा-आधारित अनुप्रयोग तयार करण्यासाठी वापरला जाऊ शकतो. आणि हे खरोखर आहे जेथे आम्ही लक्ष देत आहोत, हे अनुप्रयोग तयार करीत आहे. रीअल-टाइम डेटा विश्लेषणामध्ये खरे मूल्य दर्शविण्यासाठी ग्राहकांसाठी, ग्राहकांसह, भिन्न भिन्न भागीदारांसह. जेणेकरुन अशा लोकांना किंवा साइट अनुप्रयोग बनविणार्‍या कंपन्या, कालांतराने ग्राहकांच्या वापराचा मागोवा घेण्यास सक्षम असतील आणि सेवेची गुणवत्ता पूर्ण केली जात असल्याचे सुनिश्चित करते, रीअल-टाईम फसवणूक किंवा पैशांची उधळपट्टी दाखवते, एकाधिक लॉगिन शोधू शकतात किंवा खाच प्रयत्न आणि अशा प्रकारच्या सुरक्षा कार्यक्रम, सेट-टॉप बॉक्स किंवा इतर डिव्हाइस यासारख्या गोष्टी व्यवस्थापित करण्यासाठी, एटीएम मशीन्स ख them्या वास्तविक परिस्थितीत त्यांचे निरीक्षण करण्यासाठी, भविष्यात भाकित विश्लेषणाच्या आधारावर घडलेल्या अपयशा, घडू शकतील. आणि हे एरिकने पूर्वी नमूद केलेले ऑपरेशन सुलभ करण्याच्या बिंदूकडे परत गेले आहे जेणेकरून खरं काही घडवून आणण्यासाठी एखाद्याला बोलवण्याऐवजी काहीतरी घडणार आहे तेव्हा आपला व्यवसाय व्यवस्थित करण्यासाठी आपला व्यवसाय व्यवस्थित करा बरेच अधिक महाग.

ग्राहक आपल्या स्टोअरमध्ये असतानाही काहीतरी करत असताना ग्राहक विश्लेषक हा दुसरा तुकडा आहे. रीअल टाईम मध्ये संसाधनांचा वापर करण्यास आणि गोष्टी कुठे चालू आहेत हे बदलण्यासाठी आणि गोष्टी अधिक वेळेवर फॅश होणार आहेत तेव्हा त्याबद्दल जाणून घेण्यास सक्षम होण्यासाठी डेटा व्यवस्थापनाला पाठविलेला डेटा.

म्हणूनच ही थोडक्यात आमची उत्पादने आहेत आणि मला खात्री आहे की आम्ही प्रश्नोत्तर अधिवेशनात यापैकी काही गोष्टींकडे परत येऊ. धन्यवाद.

एरिक: होय, खरोखरच. चांगले काम. ठीक आहे. आणि आता आमच्या विजेच्या फे round्यात पुढील स्टॉप, आम्हाला मार्कलॉजिककडून फ्रँक सँडर्स कॉलिंग आला आहे. मला या मुलांबद्दल बर्‍याच वर्षांपासून माहित आहे, एक अतिशय, अतिशय मनोरंजक डेटाबेस तंत्रज्ञान. तर फ्रँक, मी ते तुमच्याकडे वळवित आहे. त्यामध्ये कुठेही क्लिक करा. आपल्या कीबोर्डवरील डाउन एरो वापरा आणि आपण शर्यतींकडे गेला आहात. तिथे तुम्ही जा.

फ्रँक सँडर्स: एरीक, खूप खूप धन्यवाद. म्हणून एरिकने सांगितल्याप्रमाणे, मी मार्कलॉजिक नावाच्या कंपनीत आहे. आणि मार्कलॉजिक काय करतो ते आम्ही एक एंटरप्राइझ नंबर एस क्यू एल डेटाबेस प्रदान करतो. आणि कदाचित आपण जी महत्त्वपूर्ण बाब आपल्या टेबलावर आणली आहे ती म्हणजे आपण या सारख्या प्रणालीचे माहिती विश्लेषण करणे, शोधणे आणि त्याचा उपयोग करणे यासाठी या सर्व भिन्न स्त्रोतांना प्रत्यक्षात एकत्र आणण्याची क्षमता. पारंपारिक रिलेशनल सिस्टमची सवय आहे, बरोबर?

आणि त्या संदर्भातील टेबलवर आम्ही आणत असलेली काही प्रमुख वैशिष्ट्ये अशी आहेत की आपण पारंपारिक डेटाबेस व्यवस्थापन प्रणालीकडून अपेक्षा केलेली एंटरप्राइझ वैशिष्ट्ये आहेत, आपली सुरक्षा, आपला एचए, आपला डीआर, आपला बॅकअप स्टोअरमध्ये आहे, आपली मालमत्ता व्यवहार तसेच एक अशी रचना जी आपल्याला मेघवर किंवा कमोडिटी हार्डवेअरमध्ये एकतर मोजमाप करण्यास अनुमती देते जेणेकरून आपण या क्रमवारीची रचना तयार करण्यासाठी आणि विश्लेषण करण्यासाठी आपण ज्या माहितीची हाताळणी करत आहात त्याचा आवाज आणि वेग हाताळू शकता. माहितीची.

आणि कदाचित, सर्वात महत्वाची क्षमता ही आहे की आम्ही योजना अज्ञेयवादी आहोत. याचा अर्थ काय आहे याचा अर्थ असा आहे की आपण आपला अनुप्रयोग तयार करण्यास प्रारंभ करता तेव्हा किंवा आपण त्या माहिती एकत्र खेचणे सुरू करता तेव्हा आपला डेटा कसा दिसतो हे ठरविण्याची गरज नाही. परंतु कालांतराने आपण नवीन डेटा स्रोतांचा समावेश करू शकता, अतिरिक्त माहिती ओढू शकता आणि नंतर लीव्हरेज आणि क्वेरी वापरू शकता आणि त्या माहितीचे विश्लेषण करू शकता जसे की आपण डिझाइन सुरू केल्यापासून तेथे असलेल्या कोणत्याही गोष्टीसह आहात. ठीक आहे?

मग आम्ही ते कसे करू? आरडीएफ तिहेरी, भूगर्भीय डेटा, ऐहिक डेटा, संरचित डेटा आणि मूल्ये किंवा बायनरी असो तरीही आम्ही आपल्याला विविध प्रकारच्या माहिती लोड करण्यास वास्तविकपणे कसे सक्षम करू. आणि उत्तर हे आहे की आम्ही शोध तंत्रज्ञान अंतर्भूत करण्यासाठी आम्ही खरोखरच आपला सर्व्हर तयार केला आहे ज्यामुळे आपणास माहिती अंतर्भूत करता येते आणि ती माहिती स्वतः वर्णन करते आणि आपल्याला त्या माहितीचा स्त्रोत किंवा स्वरूप न विचारता क्वेरी, पुनर्प्राप्त आणि शोध घेण्यास अनुमती देते. .

आणि याचा व्यावहारिक अर्थ काय आहे - आणि आपण विश्लेषण करत असताना हे महत्वाचे का आहे - विश्लेषक आणि माहिती योग्यरित्या संकलित केली जाते आणि लक्ष्यित असते तेव्हा ती सर्वात महत्वाची असते का? कोणत्याही प्रकारच्या विश्लेषणाचा एक महत्त्वाचा महत्वाचा भाग म्हणजे शोध होय आणि मुख्य भाग म्हणजे शोध विश्लेषणे. आपल्याकडे खरोखरच दुसर्‍याशिवाय एक असू शकत नाही आणि आपण जे साध्य करण्यासाठी ठरवले ते यशस्वीरित्या साध्य करा. बरोबर?

आणि आम्ही अशा प्रकारच्या विश्लेषणास सामर्थ्य देण्यासाठी मार्कलोगिक वापरत असलेल्या उत्पादनांच्या आमच्याकडे असलेल्या ग्राहकांच्या साडेतीन वेगवेगळ्या उपयोग प्रकरणांबद्दल थोडक्यात चर्चा करणार आहे. ठीक आहे. तर अशा प्रकारचे प्रथम ग्राहक फेअरफॅक्स काउंटी आहेत. आणि फेअरफॅक्स काउंटीने प्रत्यक्षात दोन स्वतंत्र अनुप्रयोग तयार केले आहेत. एक परवानगी आणि मालमत्ता व्यवस्थापन सुमारे आधारित आहे. आणि दुसरा, जो कदाचित थोडासा मनोरंजक आहे तो म्हणजे फेअरफॅक्स काउंटी पोलिस कार्यक्रमांचा अनुप्रयोग. पोलिस इव्हेंट्स अनुप्रयोग काय करतात ते म्हणजे ते पोलिस अहवाल, नागरिक अहवाल आणि तक्रारी, ट्वीट्स, लैंगिक गुन्हेगारांसारखी इतर माहिती आणि इतर एजन्सीज व स्त्रोतांकडून त्यांचा प्रवेश असणारी इतर कोणतीही माहिती यासारख्या माहिती एकत्र आणते. मग ते त्यांना हे पाहण्याची परवानगी देतात आणि हे नागरिकांसमोर सादर करतात जेणेकरुन ते शोधू शकतील आणि वेगवेगळ्या गुन्हेगारी कृती, पोलिस क्रियाकलाप, सर्व एकत्रित भौगोलिक निर्देशांकाद्वारे पाहू शकतात ना? तर आपण "पाच मैलांच्या आत गुन्हेगारीचे प्रमाण किती आहे" किंवा "माझ्या स्थानाच्या पाच मैलांच्या आत कोणते गुन्हे घडले?" सारखे प्रश्न विचारू शकता. ठीक आहे.

आम्हाला मिळालेला दुसरा वापरकर्ता, आमच्याकडे असलेला दुसरा ग्राहक ओईसीडी आहे. या संभाषणासाठी ओईसीडी महत्त्वाचे का आहे कारण माहिती एकत्र आणण्याच्या दृष्टीने आम्ही फेअरफॅक्स काउंटीसाठी सक्षम केलेल्या सर्व गोष्टी व्यतिरिक्त; ओईसीडीचे सदस्य असलेल्या सर्व विविध देशांकडून आपल्याला मिळणारी सर्व माहिती जी त्यांनी आर्थिक दृष्टीकोनातून नोंदविली आहे. आम्ही खरोखर लक्ष्यित ड्रिल घातली, बरोबर. तर आपण डावीकडील बाजूला पाहू शकता की आम्ही डेन्मार्कचा दृष्टीकोन विशेषतः घेत आहोत आणि आपण त्या प्रकारची फुलांची पाकळी पाहू शकता जे त्यास वेगवेगळ्या अक्षांवर रेट करते. बरोबर? आणि हे सर्व काही ठीक आहे. परंतु ओईसीडीने काय केले ते ते एक पाऊल पुढे गेले आहेत.

या सुंदर व्हिज्युअलायझेशन व्यतिरिक्त आणि या सर्व माहिती एकत्र खेचण्या व्यतिरिक्त, ते आपल्याला वास्तविक वेळेत आपले स्वत: चे चांगले जीवन अनुक्रमणिका तयार करण्याची अनुमती देत ​​आहेत, जे उजवीकडे आपण पाहू शकता. तर आपल्याकडे जे काही आहे ते आपल्याकडे स्लाइडर्सचे एक सेट आहे जे आपल्याला आपल्यासाठी उत्पन्न किंवा रोजगार, नोकरी, समुदाय, शिक्षण, पर्यावरण, नागरी गुंतवणूकी, आरोग्य, जीवनाचे समाधान, सुरक्षितता आणि आपले कार्य यासारख्या महत्त्वाच्या गोष्टी करण्यास परवानगी देते. / जीवन शिल्लक. आणि गतिकरित्या आपण त्या माहितीचे इनपुट कसे करीत आहात आणि त्या गोष्टींचे वजन कसे घेता यावर आधारित, मार्कलॉजिकची रिअल-टाइम अनुक्रमणिका क्षमता आणि क्वेरी क्षमता वापरुन नंतर या देशांतील प्रत्येकजण आपणास किती चांगल्या प्रकारे कल्पना देईल यावर बदल करण्यासाठी देश किंवा आपल्या देशाद्वारे दिलेल्या जीवनशैलीचे नकाशे. ठीक आहे?

आणि अंतिम उदाहरण जे मी सामायिक करणार आहे ते म्हणजे मार्कमेल. आणि मार्कमेलने खरोखर दाखविण्याचा प्रयत्न केला आहे ते म्हणजे आम्ही या क्षमता प्रदान करू शकतो आणि आपण केवळ त्या रचनात्मक माहितीवर किंवा त्यातील आकडेमोडीवर येणार्‍या माहितीवरच नव्हे तर प्रत्यक्षात अधिक सैल रचना, अ-संरचित माहितीवरच विश्लेषण करू शकता, बरोबर? च्या सारख्या गोष्टी आणि आपण येथे काय पाहिले आहे ते म्हणजे आपण भौगोलिक स्थान, एर, कंपनी, स्टॅक्स आणि हॅडूप सारख्या संकल्पना जसे हडूपचा उल्लेख केला आहे आणि नंतर नकाशावर दृश्यमान करुन त्या व्यक्ती कोण आणि काय त्या ओलांडून, पाठविलेली तारीख व तारीख. हे आपण पारंपारिकपणे रचना नसलेल्या गोष्टींकडे पहात आहात, त्या सैल रचना असू शकतात परंतु तरीही त्या माहितीतून काही संरचलित विश्लेषण घेण्यास सक्षम आहेत परंतु प्रत्यक्षात प्रयत्न करण्यासाठी आणि रचना करण्यासाठी किंवा त्यावर प्रक्रिया करण्यासाठी मोठ्या लांबीवर न जाता. एक वेळ आणि तेच

एरिक: अहो, ठीक आहे. आणि आम्हाला आणखी एक मिळाली. आम्हाला एक अतिशय मनोरंजक कंपनी ट्रेझर डेटाकडून हॅना स्मॉलट्री मिळाली आहे. लोकांनो, ही एक चांगली सामग्री आहे. अशा चांगल्या स्लाइड्स आणि इतकी चांगली माहिती घेऊन आल्याबद्दल तुमच्या सर्वांचे मनापासून आभार. तर हॅना, मी आत्ताच आपल्‍याला आपल्‍या चाव्या दिल्या, कोठेही क्लिक करा आणि आपल्या कीबोर्डवरील डाऊन बाण वापरा. कळले तुला. घेऊन जा.

हॅना स्मॉलट्री: एरीक, खूप खूप धन्यवाद. ट्रेझर डेटामधील हे हॅना स्मॉलट्री आहे. मी ट्रेझर डेटासह एक दिग्दर्शक आहे परंतु तंत्रज्ञ पत्रकार म्हणून माझ्याकडे भूतकाळ आहे, याचा अर्थ असा आहे की मी दोन गोष्टींचे कौतुक करतो. सर्व प्रथम, हे तंत्रज्ञानाच्या बर्‍याच वर्णनांमधून बराच काळ बसू शकते आणि हे सर्व एकत्र येऊ शकते असे वाटू शकते म्हणून मला खरोखर आमच्या विभेदकावर लक्ष केंद्रित करायचे आहे. आणि वास्तविक-जगातील अनुप्रयोग खरोखर महत्वाचे आहेत म्हणून मी त्यांचे कौतुक करतो की माझे सर्व मित्र त्या प्रदान करण्यात उत्कृष्ट आहेत.

ट्रेझर डेटा ही एक नवीन प्रकारची मोठी डेटा सेवा आहे. आम्ही सर्व्हिस किंवा व्यवस्थापित-सेवा मॉडेलच्या रूपात सॉफ्टवेअरमध्ये क्लाउडवर संपूर्णपणे वितरित केले. डॉ. ब्लॉरच्या आधीच्या मते, हे तंत्रज्ञान खरोखर कठीण असू शकते आणि उठणे आणि चालू असणे खूप वेळ घेणारी असू शकते. ट्रेझर डेटासह आपण या सर्व प्रकारच्या क्षमता मिळवू शकता जे तुम्हाला हडूप वातावरणात किंवा क्लाउडमध्ये प्री-प्रीमिस वातावरण वातावरणात मिळू शकेल जे या नवीन मोठ्या डेटा उपक्रमांसाठी खरोखर उपयुक्त आहे.

आता आम्ही आमच्या सेवेबद्दल काही भिन्न टप्प्यात बोलू. आम्ही विशेषत: इव्हेंट डेटा, रिअल-टाइम डेटा इतर प्रकारच्या डेटा एकत्रित करण्यासाठी काही फारच अनन्य संग्रह क्षमता ऑफर करतो. आम्ही त्या डेटा प्रकारांबद्दल थोडे अधिक बोलू. आमच्या सेवेसाठी हा एक मोठा भिन्नता आहे. जसे आपण मोठ्या डेटामध्ये जाता किंवा आपण आधीपासूनच त्यात असाल तर आपल्याला माहिती आहे की हा डेटा गोळा करणे क्षुल्लक नाही. जेव्हा आपण दर मिनिटास 100 सेन्सर आयएनजी कार असलेल्या कारबद्दल विचार करता, दर दहा मिनिटांत ते 100 सेन्सॉर आयएनजी डेटा वापरतात, तेव्हा आपण सेन्सर्ससह आपल्याकडे असलेल्या उत्पादनांचे प्रमाण गुणाकार करण्यास प्रारंभ करता तेव्हा ते द्रुतगतीने जोडले जाते आणि ते द्रुतगतीने होते. व्यवस्थापित करणे कठीण. म्हणून आम्ही बोलत आहोत ज्यांच्याकडे लाखो लोक आहेत, आमच्याकडे असे आहेत की ज्यांचेकडे दिवसेंदिवस कोट्यवधी पंक्ती डेटा आहेत ज्यांना ते आम्हाला गुंतवत आहेत. आणि ते एक जटिल Amazonमेझॉन इन्फ्रास्ट्रक्चरमध्ये स्वत: चे व्यवस्थापित करण्यासाठी किंवा ते त्यांच्या स्वतःच्या वातावरणात आणण्याचा प्रयत्न करण्याचा एक पर्याय म्हणून ते करीत आहेत.

आमच्याकडे स्वतःचे क्लाऊड स्टोरेज वातावरण आहे. आम्ही ते व्यवस्थापित करतो. आम्ही त्याचे परीक्षण करतो. आमच्याकडे लोकांचा एक कार्यसंघ आहे जो आपल्यासाठी हे सर्व ट्यूनिंग करीत आहे. आणि म्हणून डेटा प्रवाहित होतो, तो आमच्या व्यवस्थापित स्टोरेज वातावरणात जातो.

त्यानंतर आमच्याकडे क्वेरी इंजिन एम्बेड केली आहेत जेणेकरून आपले विश्लेषक तेथे जाऊन क्वेरी चालवू शकेल आणि डेटा विरूद्ध काही प्रारंभिक डेटा शोध आणि शोध घेईल. आमच्याकडे सध्या यासाठी भिन्न भिन्न क्वेरी इंजिन आहेत. आपण एसक्यूएल वाक्यरचना वापरू शकता, जे कदाचित आपल्या विश्लेषकांना कदाचित माहित असेल आणि आवडेल, काही मूलभूत डेटा डिस्कवरी करण्यासाठी, काही अधिक जटिल विश्लेषणे जी वापरकर्त्याने परिभाषित कार्ये केली आहेत किंवा अगदी ती डेटा एकत्रित करण्याइतकी सोपी आहेत आणि ती लहान बनविते जेणेकरून आपण आपल्या विद्यमान डेटा गोदाम वातावरणात आणू शकता.

आपण आपल्या विद्यमान बीआय साधनांना देखील जोडू शकता, आपले झांकी, हा आमचा एक मोठा साथीदार आहे; परंतु खरोखरच बहुतेक बीआय, व्हिज्युअलायझेशन किंवा toolsनालिटिक्स टूल्स आमच्या इंडस्ट्री स्टँडर्ड जेडीबीसी आणि ओडीबीसी ड्रायव्हर्सद्वारे कनेक्ट होऊ शकतात. तर हे आपल्याला मोठ्या डेटा क्षमतांचा संपूर्ण सेट देते. आपल्याला आपले क्वेरी परिणाम किंवा डेटा सेट कधीही विनामूल्य निर्यात करण्याची परवानगी आहे, जेणेकरून आपण तो डेटा सहजपणे समाकलित करू शकता. यास डेटा रिफायनरी म्हणून उपचार करा. मला त्यास तलावापेक्षा रिफायनरी म्हणून अधिक विचार करायला आवडेल कारण आपण त्यासह खरोखर कार्य करू शकता. आपण पुढे जाऊ शकता, मौल्यवान माहिती शोधू शकता आणि नंतर आपल्या एंटरप्राइझ प्रक्रियेत आणू शकता.

पुढील स्लाइड, आम्ही मोठ्या डेटाच्या तीन वि बद्दल बोललो आहोत - काही लोक म्हणतात की चार किंवा पाच. आमचे ग्राहक त्यांच्याकडे येणार्‍या डेटाच्या व्हॉल्यूम आणि गतीसह संघर्ष करतात. आणि म्हणून डेटा प्रकारांबद्दल विशिष्ट माहिती मिळविण्यासाठी - क्लिकस्ट्रीम, वेब प्रवेश नोंदी, मोबाइल डेटा आमच्यासाठी एक मोठा क्षेत्र आहे, मोबाइल अनुप्रयोग नोंदी, सानुकूल वेब अ‍ॅप्सवरील अनुप्रयोग लॉग किंवा इतर अनुप्रयोगांचे, इव्हेंट लॉग. आणि वाढत्या प्रमाणात, आमच्याकडे बरेच ग्राहक आहेत जे सेन्सर डेटासह व्यवहार करतात, म्हणून वेअरेबल उपकरणांपासून, उत्पादनांमधून, ऑटोमोटिव्हमधून आणि इतर प्रकारच्या मशीन डेटावरून. म्हणून जेव्हा मी मोठा डेटा म्हणतो, तेव्हा त्या प्रकारचा मोठा डेटा असतो ज्याविषयी मी बोलत आहे.

आता आपल्या दृष्टीकोनातून काही वापर प्रकरणे - आम्ही एका किरकोळ विक्रेत्याबरोबर काम करतो, एक मोठा किरकोळ विक्रेता. ते आशियामध्ये फारच परिचित आहेत. ते येथे अमेरिकेत विस्तारत आहेत. आपण स्टोअर पाहणे सुरू कराल; त्यांना सहसा आशियाई आयकेईए म्हटले जाते, म्हणूनच, साधे डिझाइन. त्यांच्याकडे एक निष्ठा अ‍ॅप आणि एक वेबसाइट आहे. आणि खरं तर, ट्रेझर डेटा वापरुन ते त्या निष्ठा अॅपला लवकरच द्रुतपणे तैनात करण्यात सक्षम झाले. आमचे सॉफ्टवेअर आणि आमच्या सर्व्हिस आर्किटेक्चरमुळे आणि आपल्याकडे सेवा म्हणून या सर्व क्षमता देण्यासाठी आपण सर्व जण पडद्यामागील सर्व मेहनत घेत असल्यामुळे आपले ग्राहक उठून काही दिवस किंवा आठवड्यांत धावतात.

म्हणून लोक आमच्या मोबाइल लॉयल्टी अनुप्रयोगात काय क्लिक करीत आहेत हे वर्तन पाहत मोबाइल अनुप्रयोग विश्लेषणासाठी आमच्या सेवा वापरतात. ते वेबसाइट क्लिक पाहतात आणि ते अधिक कार्यक्षम जाहिराती डिझाइन करण्यासाठी आमच्या ई-कॉमर्स आणि पीओएस डेटासह एकत्र करतात. त्यांना लोकांना स्टोअरमध्ये आणायचे होते कारण त्यांना असे आढळले की जेव्हा लोक स्टोअरमध्ये जातात तेव्हा जास्त पैसे खर्च करतात आणि मी त्याप्रमाणेच असतो; गोष्टी उचलण्यासाठी तुम्ही जास्त पैसे खर्च करता.

आणखी एक वापर प्रकरण जो आम्ही डिजिटल व्हिडिओ गेममध्ये पहात आहोत, अविश्वसनीय चपळता. त्यांच्या गेममध्ये नेमके काय घडत आहे ते पहायचे आहे आणि रिलीजच्या काही तासांतच त्या गेममध्ये बदल घडवून आणू इच्छित आहेत. म्हणून त्यांच्यासाठी ते वास्तवीक दृश्य अविश्वसनीय महत्वाचे आहे. आम्ही नुकताच एक खेळ सोडला परंतु पहिल्या तासात आमच्या लक्षात आले की प्रत्येकजण पातळी 2 वर सोडत आहे; आपण ते कसे बदलणार आहोत? ते कदाचित त्याच दिवशी बदलू शकतात. तर वास्तविक वेळ खूप महत्वाचा आहे. ते आम्हाला दररोज कोट्यावधी इव्हेंट लॉग इन करत आहेत. परंतु हा असा कुठलाही मोबाइल अनुप्रयोग असू शकतो जिथे आपणास कोणी हे कसे वापरत आहे याबद्दल काही प्रकारचे रीअल-टाइम दृश्य हवे असते.

आणि शेवटी, आमच्यासाठी एक मोठे क्षेत्र म्हणजे आमचे उत्पादन वर्तन आणि सेन्सर .नालिटिक्स. तर कारमध्ये असलेल्या सेन्सर डेटासह, ते इतर प्रकारच्या मशीनमध्ये, उपयोगितांमध्ये, आमच्यासाठी परिधान करण्यायोग्य डिव्हाइसमध्ये हे आणखी एक क्षेत्र आहे. आमच्याकडे संशोधन आणि विकास कार्यसंघ आहेत जे उत्पादनाच्या बदलांचा काय परिणाम करतात किंवा लोक उत्पादनाशी कसा संवाद साधत आहेत या वर्तनामध्ये स्वारस्य असलेले लोक द्रुतपणे हे जाणून घेऊ इच्छित आहेत. आणि आमच्याकडे बरीच उपयोग प्रकरणे आहेत जी निश्चितपणे आपल्यासह सामायिक करण्यात आम्हाला आनंदित आहेत.

आणि शेवटी, आपल्या वातावरणात हे कसे बसू शकते हे फक्त आपल्याला दर्शविते, आम्ही पुन्हा डेटा गोळा करण्याची क्षमता ऑफर करतो. आमच्याकडे संकलन तंत्रज्ञान अतिशय अद्वितीय आहे. म्हणून पुन्हा, जर रीअल-टाइम संग्रह असे काहीतरी आहे ज्यासह आपण संघर्ष करीत आहात किंवा आपण संघर्ष करत असल्याची अपेक्षा करीत असाल तर कृपया ट्रेझर डेटा सेवेकडे पहा. आम्ही स्ट्रीमिंग डेटा गोळा करण्यासाठी खरोखर क्षमता बनवल्या आहेत. आपण आपला डेटा मोठ्या प्रमाणात लोड करू शकता, तो संग्रहित करू शकता, आमच्या एम्बेडेड क्वेरी इंजिनसह त्याचे विश्लेषण करू शकता आणि नंतर मी सांगितल्याप्रमाणे, आपण त्यास आपल्या डेटा वेअरहाऊसवर निर्यात करू शकता. मला वाटते आपल्या विद्यमान प्रक्रियेत मोठा डेटा परिचय करण्याची आवश्यकता नमूद करेल. तर इकडे तिकडे जाऊ नका किंवा एक नवीन सिलो तयार करू नका, परंतु आपण तो डेटा कसा छोटा करा आणि नंतर आपल्या डेटा वेअरहाऊसमध्ये हलवा आणि आपण आपल्या बीआय, व्हिज्युअलायझेशन आणि प्रगत analyनालिटिक्स साधनांशी कनेक्ट होऊ शकता.

पण कदाचित, मी तुम्हाला सांगू इच्छित मुख्य मुद्दे म्हणजे आम्ही सेवा व्यवस्थापित आहोत, ते सॉफ्टवेअर म्हणूनच सेवा आहे; हे खूपच प्रभावी आहे. मासिक सदस्यता सेवा महिन्याकाठी काही हजार डॉलर्सपासून सुरू होते आणि आम्ही आपल्याला काही दिवस किंवा आठवड्यांत उठवून चालू देतो. म्हणून आपली स्वतःची पायाभूत सुविधा तयार करण्याच्या महिन्यांच्या आणि महिन्यांच्या किंमतीशी तुलना करा आणि त्या लोकांना कामावर घ्या आणि ते शोधा आणि सर्व वेळ इन्फ्रास्ट्रक्चरवर खर्च करा. जर आपण प्रयोग करीत असाल किंवा आपल्याला काल कशाचीही गरज भासली असेल तर आपण उठू शकता आणि ट्रेझर डेटासह खरोखर द्रुतपणे धावु शकता.

आणि मी तुला फक्त आमच्या वेबसाइटकडे आणि आमच्या स्टार्टर सेवेकडे निर्देश करीत आहे. आपण खेळायला आवडत असलेल्या एखाद्या व्यक्तीचे नाव असल्यास, कृपया आमची स्टार्टर सेवा तपासा. आपण पुढे जाऊ शकता, कोणतेही क्रेडिट कार्ड आवश्यक नाही, फक्त नाव आणि आणि आपण आमच्या सॅम्पल डेटासह खेळू शकता, आपला स्वत: चा डेटा लोड करू शकता आणि आम्ही ज्याबद्दल बोलत आहोत त्याबद्दल खरोखर जाणीव मिळवा. खूप खूप धन्यवाद तसेच, आमची वेबसाइट पहा. आम्हाला यावर्षी बिग डेटामध्ये गार्टनर कूल विक्रेता म्हणून गौरविण्यात आले आहे, याचा मला खूप अभिमान आहे. आणि त्या अहवालाची एक प्रत आमच्या संकेतस्थळावर तसेच इतर अनेक विश्लेषक श्वेतपत्रिकांवर आपण विनामूल्य मिळवू शकता. खूप खूप धन्यवाद

एरिक: ठीक आहे, खूप खूप धन्यवाद. लोकांनो, आम्हाला येथे प्रश्नांसाठी थोडा वेळ मिळाला आहे. आम्ही अजून थोडा लांब जाऊ कारण आम्हाला इथल्या लाईनवर अजून लोकांना वाटले आहे. आणि मला माहित आहे की मला स्वतःहून काही प्रश्न पडले आहेत, म्हणून मला पुढे जाऊ द्या आणि नियंत्रण परत घ्या आणि मग मी दोन प्रश्न विचारणार आहे. रॉबिन आणि कर्क, आपण योग्य दिसता तसे त्यामध्ये बुडी मारण्यास मोकळ्या मनाने.

तर मी पुढे जाऊ या आणि पेन्टाहो वरुन चेक केलेल्या या प्रथम स्लाइड्सवर जा. तर इथे, मला हे विकसनशील मोठे डेटा आर्किटेक्चर आवडते, आपण कंपनीमध्ये असे प्रकार कसे बसतात याबद्दल आपण काही प्रकारचे बोलू शकता? कारण स्पष्ट आहे की, आपण काही मोठ्या संस्थेमध्ये, अगदी मध्यम आकाराच्या कंपनीत प्रवेश करता आणि आपल्याकडे आधीच काही लोक असतात ज्यांच्याकडे या सामग्रीपैकी काही आहे; आपण हे सर्व एकत्र कसे करता? अ‍ॅप्लिकेशन कशासारखे दिसत आहे जेणेकरून आपल्याला या सर्व गोष्टी एकत्र टाकायला मदत होते आणि नंतर इंटरफेस कसे दिसते?

होईल: मस्त प्रश्न. इंटरफेस विविध प्रकारच्या व्यक्तींनुसार अवलंबून असतात. परंतु एक उदाहरण म्हणून, आम्हाला त्याची कथा सांगायला आवडते - पॅनेलच्या सदस्यांपैकी एकाने डेटा रिफायनरी वापर प्रकरणात नमूद केले - आम्हाला असे दिसून आले आहे की ग्राहकांमध्ये बरेच आहे.

आमच्या ज्या ग्राहकांबद्दल आम्ही बोलतो त्यापैकी एक म्हणजे पेट्रोनिक्स, जिथे त्यांच्याकडे पारंपारिक ईडीडब्ल्यू डेटा मार्ट वातावरण आहे. ते खासकरुन हडूप, क्लौडेरा आणि त्यामधील विविध वापरकर्त्याच्या अनुभवांसहदेखील सादर करीत आहेत. तर प्रथम अभियांत्रिकीचा अनुभव आहे, मग आपण या सर्व गोष्टी एकत्र कसे जोडता? हडूप वातावरण आणि ईडीडब्ल्यू दरम्यान आपण गोंद कसा तयार कराल?

आणि मग आपल्याकडे ज्या व्यवसायाचा वापरकर्ता अनुभव आहे याबद्दल आपण बोलतो, तेथे अनेक बीआय साधने आहेत, बरोबर? पेंटाहोकडे अधिक एम्बेड करण्यायोग्य OEM बीआय साधन आहे परंतु तेथे बरेच काही आहेत ज्यात टेबल आणि एक्सेल सारख्या उदाहरणादाखल लोकांना डेटा शोधायचा आहे. परंतु सहसा, आम्ही डेटा शासित असल्याची खात्री करुन घेऊ इच्छितो, बरोबर? चर्चेतील एक प्रश्न, सिंगल-व्हर्जन अनुभवाबद्दल काय, आपण ते कसे व्यवस्थापित करता आणि पेन्टाहो डेटा इंटिग्रेशन सारख्या तंत्रज्ञानाशिवाय डेटा काचेवर नसून आयटी वातावरणात एकत्रित करणे. म्हणूनच हे डेटाचे खरोखरच संरक्षण आणि नियंत्रण करते आणि व्यवसाय विश्लेषक आणि व्यवसाय वापरकर्त्यांसाठी एकच अनुभव अनुमती देते.

एरिक: ठीक आहे, छान आहे. अगदी स्पष्टपणे, हे एका कठीण प्रश्नाचे चांगले उत्तर आहे. आणि मी फक्त प्रत्येकाला प्रश्न विचारू आणि मग कदाचित रॉबिन आणि कर्क जर तुम्हालाही त्यात जायचे असेल तर. म्हणून मी पुढे जाऊन या स्लाइडला वेबएक्शनसाठी पुश करू इच्छितो जी मला वाटते की ही खरोखर एक अतिशय मनोरंजक कंपनी आहे. खरं तर, मला सह-संस्थापकांपैकी सामी अकबय देखील माहित आहे. मला त्याच्याशी काही वर्षांपूर्वी बोलताना आणि "अरे यार, तू काय करीत आहेस? काय करीत आहेस? मला माहित आहे की तुला कशावर तरी काम करायचं आहे." आणि अर्थातच तो होता. तो येथे संरक्षणाखाली वेबएक्शनवर काम करत होता.

स्टीव्ह, तुमच्यासाठी एक प्रश्न आला, म्हणून मी डेटा क्लीन्सिंगचा अधिकार तुमच्यापर्यंत टाकतो, बरोबर? आपण या वास्तविक-वेळेच्या क्षमतेच्या या घटकांबद्दल बोलू शकता? डेटा साफ करणे किंवा डेटा गुणवत्ता यासारख्या समस्यांचा आपण कसा सामना करता किंवा ते कार्य कसे करते?

स्टीव्ह: मग आपण आपले फीड्स कोठून घेत आहात यावर खरोखर अवलंबून आहे. थोडक्यात, डेटाबेसमधून फीड्स मिळवत असताना आपण डेटा कॅप्चर बदलता तेव्हा, पुन्हा डेटा कसा एंटर केला त्यावर अवलंबून असते. जेव्हा आपण एकाधिक स्त्रोतांकडून आपला डेटा प्राप्त करत असता किंवा लोक ते व्यक्तिचलितपणे प्रवेश करीत असतात तेव्हा आपल्याला डेटा साफ करणे खरोखरच एक समस्या बनते किंवा आपल्याला अशा प्रकारची अनियंत्रित गोष्ट असते ज्याद्वारे आपण प्रयत्न करून गोष्टी बाहेर काढाव्या लागतात. आणि तो निश्चितपणे प्रक्रियेचा एक भाग असू शकतो, जरी तो प्रकार केवळ ख true्या-वेगळ्या रीअल-टाइम प्रक्रियेस स्वतःला कर्ज देत नाही. डेटा साफ करणे ही एक महाग प्रक्रिया आहे.

तर हे कदाचित स्टोअर साइटमधील तथ्यानंतर केले जाऊ शकते. पण इतर गोष्ट म्हणजे प्लॅटफॉर्म खरोखर, खरोखर चांगले आहे परस्परसंबंध, म्हणून परस्परसंबंध आणि डेटा संवर्धनात. आपण, वास्तविक वेळेत, येणार्‍या डेटाशी परस्पर संबंध ठेवू शकता आणि ते एका विशिष्ट नमुनाशी जुळत आहे की नाही हे तपासू शकता किंवा डेटाबेस किंवा हडूप किंवा इतर स्टोअरमधून पुनर्प्राप्त केलेल्या डेटाशी जुळत आहे. म्हणून आपण त्यास ऐतिहासिक डेटाशी परस्पर संबंध ठेवू शकता, आपण करू शकत असलेली एक गोष्ट आहे.

आपण करू शकत असलेली दुसरी गोष्ट म्हणजे मुळात त्या डेटाचे विश्लेषण करणे आणि पहा की ते अशा प्रकारच्या विशिष्ट आवश्यक नमुन्यांशी जुळते की नाही. आणि हे असे काहीतरी आहे जे आपण वास्तविक वेळेत देखील करू शकता. परंतु पारंपारिक प्रकारची डेटा साफ करणारे, जिथे आपण कंपनीची नावे दुरुस्त करीत आहात किंवा आपण पत्ते आणि त्या सर्व प्रकारच्या गोष्टी दुरुस्त करीत आहात, त्या स्त्रोत किंवा त्या प्रकारात केल्या पाहिजेत, जे खूप महाग आहे आणि आपण प्रार्थना करता वास्तविक वेळेत ते करणार नाहीत

एरिक: होय आणि तुम्ही लोक खरोखरच वास्तविक गोष्टींच्या वास्तविकतेकडे लक्ष देण्याचा प्रयत्न करीत आहात परंतु लोकांना वेळेत मिळवून देण्याचा प्रयत्न करीत आहात. आणि आम्ही याबद्दल बोललो, अगदी बरोबर, मी तासांच्या शेवटी, संपूर्ण संधीची ही विंडो सांगितली आणि आपण खरोखर अशा कंपन्यांमधील विशिष्ट अनुप्रयोगांना लक्ष्य करीत आहात जिथे आपण या पर्यायी मार्गावर न जाता, सामान्य मार्गावर न जाता डेटा एकत्रित करू शकता आणि तसे करू शकता अशा कमी विलंबात आपण ग्राहक ठेवू शकता. उदाहरणार्थ, आपण लोकांना संतुष्ट ठेवू शकता आणि हे मनोरंजक आहे, जेव्हा मी सामींशी जेव्हा तुम्ही लोक काय करीत आहेत याबद्दल मी बोललो तेव्हा त्याने खरोखर चांगला मुद्दा मांडला. ते म्हणाले, आपण बर्‍याच नवीन वेब-आधारित अनुप्रयोगांवर लक्ष दिले तर; Bitly किंवा या इतर अनुप्रयोगांसारख्या गोष्टींकडे पाहूया; आम्ही पाहिलेले जुन्या अनुप्रयोगांपेक्षा ते बरेच वेगळे आहेत, म्हणा, मायक्रोसॉफ्ट मायक्रोसॉफ्ट वर्ड सारखे.

सॉफ्टवेअरच्या उत्क्रांतीबद्दल बोलण्यासाठी मी नेहमीच मायक्रोसॉफ्टला चाबूक असलेल्या मुलाच्या रूपात आणि विशेषत: वर्डचा वापर करतो. मायक्रोसॉफ्ट वर्ड अर्थातच वर्ड प्रोसेसिंग प्रोग्राम म्हणून सुरू झाला. मी अशा लोकांपैकी एक आहे ज्यांना शब्द परिपूर्ण आठवते. मुळात रिलीव्ह कीज किंवा रिलीव्ह कोड करणे सक्षम असणे मला आवडले ज्यामुळे तेथे तुम्हाला वास्तविक कोड दिसू शकेल. आपण बुलेट केलेली यादी चुकीची असल्यास आपण ते साफ करू शकता. बरं, शब्द तुम्हाला ते करू देत नाहीत. आणि मी सांगू शकतो की शब्द आपण करत असलेल्या प्रत्येक पृष्ठामध्ये कोडचा डोंगर एम्बेड करतात. जर कोणी माझ्यावर विश्वास ठेवत नसेल तर मायक्रोसॉफ्ट वर्डवर जा, "हॅलो वर्ल्ड" टाइप करा आणि नंतर "म्हणून निर्यात करा" किंवा "म्हणून जतन करा". एचटीएमएल करा. नंतर तो कागदजत्र संपादकात उघडा आणि तो दोन शब्दांसाठीच चार पृष्ठांचा कोड असेल.

तर तुम्ही मित्रांनो, मला वाटले की ते फारच रंजक आहे आणि आता त्यावेळेस आम्ही याबद्दल बोललो. आणि तिथेच तुम्ही लोक लक्ष केंद्रित करीत आहात, अगदी त्याच वेळी आपण क्रॉस-प्लॅटफॉर्म किंवा क्रॉस-एंटरप्राइझ किंवा क्रॉस-डोमेन संधी ज्याला आपण या गेममध्ये बदल करू शकता अशा द्रुत वेळात डेटा एकत्रित करण्यासाठी क्रॉस-डोमेन संधी कॉल करू शकता हे ओळखत आहे.

स्टीव्ह: होय, अगदी. आणि मला वाटते की आपण की आपल्या ग्राहकांना करण्यापूर्वी घडणा things्या गोष्टींबद्दल किंवा खरोखरच समस्या बनण्यापूर्वी त्या खरोखर घडल्या पाहिजेत याबद्दल आपण खरोखर जाणून घेऊ इच्छित आहात. उदाहरण म्हणून सेट टॉप बॉक्स आहेत. केबल बॉक्स, ते टेलीमेट्रीचे सर्व वेळ, टेलिमेटरीचे भार आणि भार सोडत असतात. आणि फक्त बॉक्सचे आरोग्यच नव्हे तर आपण पहात असलेले आणि त्या प्रकारच्या सर्व प्रकारच्या गोष्टी आहेत, बरोबर? ठराविक नमुना म्हणजे आपण बॉक्स अपयशी होईपर्यंत प्रतीक्षा करा आणि मग आपण आपल्या केबल प्रदात्यास कॉल कराल आणि ते म्हणतील की "ठीक आहे, आम्ही नोव्हेंबरच्या संपूर्ण महिन्यात सकाळी 6 ते 11 या वेळात आपल्याला भेटू." हा खरोखर चांगला ग्राहक अनुभव नाही.

परंतु जर ते त्या टेलिमेट्रीचे वास्तविक वेळेत विश्लेषण करू शकले असतील तर त्यांनी पुढील काही आठवड्यात आधारित ऐतिहासिक नमुन्यांमध्ये हे बॉक्स अपयशी ठरण्याची शक्यता आहे अशा गोष्टी करू शकतात. म्हणूनच आम्ही अयशस्वी होण्यापूर्वी आमच्या केबल दुरुस्तीसाठी या व्यक्तीच्या घरी जाण्यासाठी त्याचे वेळापत्रक तयार करू. आणि आम्ही सांताक्रूझ ते सनीवाले पर्यंत त्याच्याकडे न राहता आमच्या दृष्टीने त्या मार्गाने हे करू. ट्रॅव्हल्स सेल्समन पॅटर्न वगैरे चांगल्या क्रमवारीत आम्ही सर्वकाही शेड्यूल करू, जेणेकरून आम्ही आमच्या व्यवसायाचे अनुकूलन करू शकू. आणि म्हणून ग्राहक आनंदी आहेत कारण त्यांच्याकडे अयशस्वी केबल बॉक्स नाही. आणि केबल प्रदाता आनंदी आहेत कारण त्यांनी फक्त गोष्टी सुव्यवस्थित केल्या आहेत आणि त्यांच्याकडे सर्वत्र लोक नसतात. हे फक्त एक अतिशय द्रुत उदाहरण आहे.परंतु अशी बरीच उदाहरणे आहेत जिथे गोष्टी घडण्यापूर्वी त्यांची माहिती असणे, ते होण्यापूर्वी कंपन्यांना संपत्ती वाचवू शकतात आणि खरोखर त्यांचे ग्राहक संबंध सुधारू शकतात.

एरिक: होय, बरोबर. याबद्दल शंका नाही. चला पुढे जाऊया आणि मार्कलॉगिक वर जाऊया. मी पूर्वी म्हटल्याप्रमाणे, या मुलांबद्दल मला बर्‍याच काळापासून माहित आहे आणि म्हणूनच मी तुला यामध्ये आणीन, फ्रॅंक. आपण लोक आपला अनुप्रयोग तयार करण्याच्या दृष्टीने संपूर्ण मोठ्या डेटा हालचाली करण्यापेक्षा बरेच पुढे होते, ते खरोखर डेटाबेस आहे. परंतु ते तयार करीत असताना आपण शोधाच्या महत्त्वविषयी बोलले.

म्हणून जागेचे अनुसरण करणारे बरीच लोकांना हे माहित आहे की तिथले बरेच एनओएसक्यूएल टूल्स आता तृतीय पक्षाद्वारे किंवा ते स्वतःच प्रयत्न करण्याचा प्रयत्न करीत आहेत परंतु शोध क्षमतांवर बोल्ट आहेत. परंतु त्या शोधात आधीपासूनच एम्बेड केलेला असावा, बोलण्यासाठी बेक-इन करणे खरोखर एक मोठी गोष्ट आहे. कारण आपण याबद्दल विचार करत असल्यास, आपल्याकडे एसक्यूएल नसल्यास, मग आपण कसे जाल आणि डेटा शोधू शकता? आपण त्या डेटा संसाधनातून कसे खेचता? आणि उत्तर म्हणजे आपण शोधत असलेला डेटा मिळविण्यासाठी शोध वापरणे, बरोबर?

म्हणून मला वाटते की या सर्व भिन्न स्त्रोतांकडून डेटा खेचण्यात आणि डेटा संचयित करण्यात आणि खरोखर या प्रकारच्या संकरित वातावरणाला सुलभ करण्यात सक्षम होण्यासाठी आपण लोकांसाठी एक महत्त्वाचा फरक आहे. मी विचार करीत आहे की शोध क्षमता आपल्यासाठी एक मोठी गोष्ट आहे, बरोबर?

फ्रँक: होय, अगदी. खरं तर, समस्येचे निराकरण करण्याचा एकमेव एकमेव मार्ग आहे जेव्हा आपल्याला माहित नसते की सर्व डेटा कसा दिसतो आहे, बरोबर? जर आपण सर्व शक्यतांची कल्पना करू शकत नसाल तर आपल्याला पाहिजे असलेली सर्व माहिती आपण शोधू शकता याची खात्री करण्याचा एकमेव मार्ग, आपण त्यास सातत्याने शोधू शकता आणि आपण आपला डेटा मॉडेल कसा विकसित केला आणि आपल्या डेटा सेटचा विचार न करता शोधू शकता. आपण लोकांना सामान्य साधने दिली आहेत हे सुनिश्चित करण्यासाठी जे त्यांना त्या डेटाची चौकशी करण्यास परवानगी देतात. आणि करण्याचा सर्वात सोपा, सर्वात सहज मार्ग शोध प्रतिमान आहे, बरोबर? आणि शोधात समान दृष्टिकोनातून आम्ही एक व्यस्त अनुक्रमणिका कोठे तयार केली. आपल्याकडे नोंदी आहेत जिथे आपण त्या प्रत्यक्षात पहात आहात आणि नंतर रेकॉर्ड आणि कागदपत्रे आणि पंक्ती शोधू शकता ज्यात आपण शोधत आहात त्या माहितीस ग्राहकांकडे परत पाठवावे आणि त्यांना योग्य वाटेल त्यानुसार प्रक्रिया करण्याची परवानगी द्या.

एरिक: होय आणि आम्ही याबद्दल बरेच काही बोललो पण आपण मला त्यामध्ये एक प्रकारची खोदण्यासाठी खरोखर चांगली संधी देत ​​आहात - या समीकरणाची संपूर्ण शोध आणि शोध बाजू. पण सर्व प्रथम, हे खूप मजेदार आहे. ज्याला ही सामग्री आवडते अशा कोणालाही हा मजेदार भाग आहे ना? परंतु समीकरणाची दुसरी बाजू किंवा नाण्याची दुसरी बाजू, मी म्हणायला हवे की ती खरोखर पुनरुक्ती प्रक्रिया आहे. आणि आपण सक्षम होऊ शकले - येथे मी काही विपणन भाषा वापरत आहे - डेटासह ते संभाषण आहे, बरोबर? दुस words्या शब्दांत, आपण गृहीतकांची चाचणी घेण्यास सक्षम असणे आवश्यक आहे, त्यासह कार्य करणे आणि ते कसे कार्य करते ते पाहणे आवश्यक आहे. कदाचित ते तिथे नसेल, दुसर्‍या कशाची चाचणी घ्या आणि सतत गोष्टी बदला आणि पुनरावृत्ती करा आणि शोध आणि संशोधन करा आणि केवळ सामग्रीबद्दल विचार करा. आणि ही एक प्रक्रिया आहे. आणि जर आपल्याकडे मोठे अडथळे असतील, म्हणजे लांब विलंब किंवा एखादा अवघड यूझर इंटरफेस किंवा आपण आयटीला जायला विचारत असाल; हे फक्त संपूर्ण विश्लेषणात्मक अनुभव मारते, बरोबर?

म्हणून या प्रकारची लवचिकता असणे आणि शोध वापरण्यात सक्षम असणे महत्वाचे आहे. आणि मला येथे त्याचे चित्रण करण्याचा मार्ग आवडतो कारण आपण वेगवेगळे, क्रमवारी, संकल्पना किंवा की शोधत असाल तर की व्हॅल्यूज असतील आणि ते भिन्न परिमाण आहेत. आपल्या विश्लेषकांना उपयुक्त सामग्री शोधण्यात सक्षम करण्यासाठी आपण त्या सामग्रीस मिसळण्यास आणि त्यास जुळवून घेण्यास सक्षम होऊ इच्छिता, बरोबर?

फ्रँक: होय, अगदी. म्हणजे, पदानुक्रम ही देखील महत्वाची गोष्ट आहे, बरोबर? जेणेकरून जेव्हा आपण एखादे शीर्षक, बरोबर किंवा विशिष्ट पद किंवा मूल्य यासारखे काहीतरी समाविष्ट करता तेव्हा आपण त्यास खरोखर योग्य ते निर्देशित करू शकता. जर आपण एखाद्या लेखाचे शीर्षक शोधत असाल तर आपल्याला पुस्तकांची शीर्षके मिळत नाहीत ना? किंवा आपल्याला ब्लॉग पोस्टची शीर्षके मिळत नाहीत. त्यामधील आणि माहितीच्या श्रेणीरचना दरम्यान फरक करण्याची क्षमता देखील महत्त्वपूर्ण आहे.

आपण पूर्वीच्या विकासाकडे लक्ष वेधले, अगदी बरोबर? आमच्या ग्राहकांना काही तासात नवीन डेटा स्रोत खेचण्याची क्षमता, त्यांच्याबरोबर कार्य करण्यास प्रारंभ करणे, ते उपयुक्त आहेत की नाही याचे मूल्यांकन करणे आणि नंतर त्यांना समाकलित करणे सुरू ठेवणे किंवा त्या मार्गावरुन सोडणे अत्यंत मौल्यवान आहे. जेव्हा आपण याची तुलना एखाद्या पारंपारिक अनुप्रयोग विकासाच्या दृष्टिकोनाशी करता तेव्हा आपण काय करत आहात हे शोधून काढणे आवश्यक आहे की आपल्याला कोणता डेटा अंतर्भूत करायचा आहे, डेटा स्रोत आहे, आपण आपल्या विद्यमान डेटा मॉडेलमध्ये कसे बसणार आहात हे शोधून काढणे आवश्यक आहे किंवा मॉडेल ज्यामध्ये, त्या डेटा मॉडेलमध्ये त्याचा समावेश करण्यासाठी बदल करा आणि नंतर प्रत्यक्षात विकास सुरू करा, बरोबर? जिथे आपण हे प्रकार आपल्या डोक्यावर फिरवतो आणि ते फक्त आमच्याकडे आणू असे सांगत आहोत, आपण त्यासह विकास करणे सुरू करू द्या आणि नंतर आपण ते ठेवू इच्छिता की नाही किंवा जवळजवळ तातडीने त्याचे मूल्य आहे की नाही हे नंतर ठरवा.

एरिक: होय, तो खरोखर एक चांगला मुद्दा आहे. तो चांगला मुद्दा आहे. तर मला पुढे जाऊ द्या आणि आमचा चौथा प्रस्तुतकर्ता, ट्रेझर डेटा आणा. मला या मुला आवडतात. मला त्यांच्याबद्दल जास्त माहित नव्हते म्हणून मी स्वतःला लाथ मारतो. आणि मग हन्ना आमच्याकडे आली आणि त्यांनी काय केले ते आम्हाला सांगितले. आणि हन्ना म्हणाली, ती एक मीडिया पर्सन होती आणि ती अंधा side्या बाजूला गेली.

हॅना: मी केले, मी सदोष केले.

एरिक: ते ठीक आहे, कारण आपल्याला मीडिया जगात काय आवडते हे आपल्याला माहिती आहे. म्हणून जेव्हा एखादी मिडिया व्यक्ती विक्रेता कडे जाते तेव्हा हे नेहमीच छान होते कारण आपण समजू शकता अहो, ही सामग्री बोलणे इतके सोपे नाही आणि हे उत्पादन काय करते त्या विरूद्ध हे उत्पादन नेमके काय करते हे वेबसाइटवरून शोधणे कठीण आहे. आणि आपण काय बोलत आहात हे खरोखर मनोरंजक आहे. आता आपण एक मेघ-व्यवस्थापित सेवा आहात. म्हणून एखाद्यास वापरू इच्छित असलेला कोणताही डेटा ते आपल्या ढगावर अपलोड करतात, हे बरोबर आहे काय? आणि मग आपण ईटीएल किंवा सीडीसी, मेघ पर्यंत अतिरिक्त डेटा, ते कसे कार्य करते?

हॅना: बरं, हो. तर मी एक महत्त्वाचा फरक करूया. बहुतेक डेटा, मोठा डेटा, आमच्या ग्राहकांनी आम्हाला अगोदरच फायरवॉल - मोबाइल डेटा, उत्पादनांमध्ये असलेल्या सेन्सर डेटाच्या बाहेरचा असतो. आणि म्हणूनच आम्ही बर्‍याचदा अंतरिम स्टेजिंग क्षेत्र म्हणून वापरले जाते. म्हणून एखाद्याच्या एंटरप्राइझमधून डेटा आमच्या सेवेमध्ये तितकाच येत नाही जोपर्यंत तो वेबसाइटवरून, मोबाइल अनुप्रयोगातून, त्यात बरेचसे सेन्सर असलेले उत्पादन आपल्या मेघ वातावरणात वाहत आहे.

आता आपण आमच्या वातावरणात त्या मोठ्या डेटास समृद्ध करू इच्छित असाल तर आपण त्यास समृद्ध करण्यासाठी काही अनुप्रयोग डेटा किंवा काही ग्राहक डेटा निश्चितपणे अपलोड करू शकता आणि थेट क्लाऊडमध्ये बरेच विश्लेषक करू शकता. परंतु आमचे बरेच मूल्य हे फायरवॉलच्या बाहेर असलेल्या डेटा एकत्रित करण्यासाठी आणि एकाच ठिकाणी एकत्र आणत आहे. म्हणूनच आपल्या फायरवॉलच्या मागे हे क्रमवारी लावून आपली प्रगत विश्लेषणे करणे किंवा आपल्या विद्यमान बीआय किंवा environmentनालिटिक्स वातावरणात आणण्याचा आपला हेतू असला तरीही, तो खरोखर चांगला स्टेजिंग पॉईंट आहे. आपण आपल्या डेटा वेअरहाऊसमध्ये दिवसाच्या अब्ज पंक्ती आणू इच्छित नसल्याने ते प्रभावी नाही. आपण ते कोठेतरी आणि नंतर बॅच अपलोड करण्याची योजना आखत असाल तर हे देखील कठीण आहे.

तर आम्ही बर्‍याचदा पहिला मुद्दा असतो जिथे डेटा गोळा केला जात असतो जो आधीपासूनच फायरवॉलच्या बाहेर असतो.

एरिक: होय, तो खरोखर एक चांगला मुद्दा आहे. कारण बर्‍याच कंपन्या त्यांचा मालक ग्राहक डेटा घेण्याबद्दल, क्लाउडमध्ये ठेवून आणि संपूर्ण प्रक्रिया व्यवस्थापित करण्यास घाबरून जात आहेत.

हॅना: हं.

एरिकः आणि आपण ज्याविषयी बोलत आहात त्या लोकांना खरोखरच अशा जड कर्तव्याच्या क्रंचिंगसाठी स्त्रोत मिळवणे म्हणजे आपण सुचविता, मोबाइल डेटा आणि सामाजिक डेटा सारख्या तृतीय पक्षाचा डेटा आणि त्या प्रकारच्या मजेदार सामग्री. ते खूपच मनोरंजक आहे.

हॅना: हो, अगदी. आणि कदाचित ते उत्पादनांविषयी घाबरले आहेत कारण डेटा आधीच बाहेर आहे. आणि म्हणूनच, ते आणण्यापूर्वी आणि मला खरोखरच रिफायनरी संज्ञा आवडली, जसे मी सांगितल्याप्रमाणे, लेक विरूद्ध. तर आपण काही मूलभूत रिफायनरी करू शकता? चांगली सामग्री मिळवा आणि नंतर आपल्या अन्य सिस्टममध्ये आणि सखोल विश्लेषणासाठी प्रक्रियेत फायरवॉलच्या मागे आणा. त्यामुळे खरोखरच हे सर्व डेटा वैज्ञानिक करू शकतात, या नवीन डेटाचा वास्तविक-वेळ डेटा एक्सप्लोरेशन जो त्यात आहे.

एरिक: होय, हे बरोबर आहे. बरं, मी पुढे जाऊ आणि आमच्या विश्लेषकांना आणू आणि आम्ही त्यास उलट क्रमाने परत येऊ. ट्रेझर डेटाच्या संदर्भात रॉबिन, मी आपल्यापासून सुरूवात करीन आणि मग आम्ही काही इतरांसाठी कर्क येथे जाऊ. आणि नंतर रॉबिनकडे परत आणि कर्ककडे परत या, यासाठी आणखी काही आकलन करा.

आणि आपल्याला डेटा रिफायनरी माहित आहे, रॉबिन, हॅना येथे बोलत आहे. मला ती संकल्पना आवडते. मी याबद्दल काही लोक ऐकले आहेत परंतु मला असे वाटते की आपण यापूर्वी याचा उल्लेख केला आहे. आणि हे खरोखर आपल्या डेटावर काय होत आहे त्याबद्दल बोलत आहे. कारण, अर्थातच, एक रिफायनरी, आपण तेल शुद्धीकरणाबद्दल विचार केल्यास ते मूळत: खाली त्याच्या सामग्रीपर्यंत खाली आणते. मी थोड्या काळासाठी याचा अभ्यास केला आणि ते खूपच मूलभूत आहे, परंतु त्यातील अभियांत्रिकी अगदी योग्य असणे आवश्यक आहे किंवा आपल्याला पाहिजे असलेली सामग्री आपल्याला मिळत नाही. म्हणून मला वाटते की ही एक उत्तम समानता आहे. ट्रेझर डेटा क्लाउड सर्व्हिसच्या या संपूर्ण संकल्पनेबद्दल आपल्याला काय वाटते जे आपल्याला घरातल्या वस्तू न आणता त्या विशिष्ट विशिष्ट विश्लेषणात्मक गरजा सोडविण्यास मदत करतात?

रॉबिन: बरं, मला म्हणायचे आहे की ते किती सोयीस्कर आहे या परिस्थितीवर अवलंबून आहे. परंतु प्रत्यक्षात आधीपासून तयार केलेली प्रक्रिया कोणीही आपणास स्वतःस मिळाली नाही तर आपण आधीच गेमच्या पुढे जात आहे. यासारख्या कशासाठी हा पहिला मार्ग आहे. जर एखाद्याने काहीतरी एकत्र केले तर ते त्यांनी केले, ते बाजारपेठेत सिद्ध झाले आहे आणि म्हणूनच तेथे एक प्रकारचे मूल्य आहे, बरं, काम त्यात आधीपासूनच गेलं आहे. आकडेवारीचे परिष्करण करणे हे यापूर्वी कधीही झाले नव्हते त्यापेक्षा खूप मोठे प्रकरण आहे. म्हणजे, तरीही याबद्दल माझ्या मते, याबद्दल बोलले गेले नाही, ते जितके असले पाहिजे याबद्दल बोलले गेले नाही. केवळ आकडेवारीचा आकार वाढला आहे आणि स्त्रोतांची संख्या आणि त्या स्रोतांची संख्या बर्‍यापैकी वाढली आहे या व्यतिरिक्त. आणि डेटा स्वच्छ आहे की नाही याची विश्वासार्हता आहे, त्यांना डेटा नियंत्रित करणे आवश्यक आहे, डेटाच्या कारभाराच्या दृष्टीने उद्भवणार्‍या सर्व प्रकारच्या समस्या.

म्हणून आपण खरोखर त्यावर विश्वसनीय विश्लेषण करण्यास सक्षम होण्यापूर्वी आपल्याला माहिती आहे की आपला डेटा गलिच्छ असेल तर आपले परिणाम काही ना कोणत्या प्रकारे काढले जातील. तर त्याकडे लक्ष देण्याची गरज आहे, त्याबद्दल माहिती असणे आवश्यक आहे. आणि मी प्रदान करेपर्यंत त्रिकोणीय सेवा, त्यामध्ये सहाय्य करण्यासाठी एक अतिशय व्यवहार्य सेवा.

एरिक: होय, खरोखरच. बरं, मी पुढे जाऊ आणि कर्कला परत इथल्या समीकरणात परत आणू. मला या इतर स्लाइड्सपैकी एक पाहायचे आहे आणि कीर्क, फक्त अशाच प्रकारच्या गोष्टींबद्दल आपली धारणा मिळवू इच्छित आहे. तर मग या मार्कलॉजिक स्लाइडवर परत जाऊया. आणि तसे, कर्क यांनी त्याच्या काही वर्ग शोध स्लाइड्सवर, जर आपण तो लोकांना पाहत नसाल तर, दुवा प्रदान केला कारण ती एक अतिशय मनोरंजक संकल्पना आहे. आणि मला असे वाटते की हे माझ्या मनाच्या पाठीवर एक प्रकारचे पेय आहे, कर्क, जसे मी काही क्षणापूर्वी याबद्दल बोलत होतो. उपस्थितांपैकी एकाने आपल्याला नवीन वर्ग कसे शोधायचे याबद्दल विचारले असा प्रश्न. मला हा विषय आवडत आहे कारण तो खरोखर वर्गीकरण करण्याच्या कठीण बाजूच्या क्रमाशी बोलत आहे कारण मला नेहमी वर्गीकरण करणार्‍या गोष्टींचा सामना करण्यास कठीण जात आहे. मला असे वाटते की, "अरे देवा, मी पाच प्रकारात बसू शकतो, कोठे ठेवू?" तर मी फक्त कशाचेही वर्गीकरण करू इच्छित नाही, बरोबर?

आणि म्हणूनच मला शोधायला आवडते, कारण आपल्याला त्याचे वर्गीकरण करण्याची गरज नाही, आपल्याला ते फोल्डरमध्ये ठेवण्याची आवश्यकता नाही. फक्त त्याचा शोध घ्या आणि आपल्याला कसे शोधायचे हे आपल्याला माहित असल्यास आपणास सापडेल. परंतु आपण विभागण्याच्या प्रयत्नात असाल तर, कारण हेच वर्गीकरण म्हणजे काय ते विभागणे; नवीन वर्ग शोधत आहे, ही एक प्रकारची रोचक गोष्ट आहे. आपण शोध आणि शब्दार्थ आणि श्रेणीरचना यांच्या प्रकाराशी एकप्रकारे बोलू शकता, उदाहरणार्थ, फ्रॅंक मार्कलोगिक आणि नवीन वर्ग शोधण्यात ज्या भूमिकेविषयी बोलतो त्याबद्दल, आपण त्याबद्दल काय विचार करता?

कर्क: ठीक आहे, सर्व प्रथम, मी म्हणेन की आपण माझे मन वाचत आहात. कारण आपण बोलत होण्यापूर्वीच मी एका प्रश्नाचा विचार करीत होतो, हा मार्कलोगिकने सादर केलेला हा संपूर्ण अर्थपूर्ण भाग. आणि जर तुम्ही माझ्या स्लाइडवर परत आलात तर तुम्हाला हे करण्याची गरज नाही, परंतु मी आज दुपारी जे सादर केले त्यावरील स्लाइड पाचवर परत; मी या शब्दांविषयी बोललो की डेटा कॅप्चर करणे आवश्यक आहे.

तर शोधाची ही संपूर्ण कल्पना, आपण तेथे जा. माझा यावर ठाम विश्वास आहे आणि मी असा विश्वास ठेवत आहे की मोठ्या डेटासह, क्रमवार इंटरनेटची साधर्मिती घ्या, म्हणजे फक्त वेब, म्हणजे वेब ब्राउझरवर जागतिक ज्ञान आणि माहिती आणि डेटा असणे ही एक गोष्ट आहे. परंतु मोठ्या शोध इंजिन कंपन्यांपैकी एखादी कंपनी आपल्यासाठी पुरविते म्हणून शोधण्यायोग्य आणि पुनर्प्राप्त करण्यायोग्य असणे, मग तीच जिथे शोधायची खरी शक्ती आहे. कारण शोध संज्ञा कनेक्ट करीत असताना, वापरकर्त्याचे क्रमवारी लावण्यामुळे विशिष्ट डेटा ग्रॅन्यूल, विशिष्ट वेबपृष्ठाशी संबंधित क्षेत्रे आवडतात, आपण वेब उदाहरण विचार करू इच्छित असल्यास किंवा आपण दस्तऐवज लायब्ररीबद्दल बोलत असल्यास विशिष्ट दस्तऐवज. किंवा विभागाचा एखादा विशिष्ट प्रकार आपली जागा असल्यास.

आणि शब्दार्थ आपल्याला केवळ एक शब्द शोधाच्या वर अशा प्रकारचे लेयरिंग देते. आपण एखाद्या विशिष्ट प्रकारची वस्तू शोधत असल्यास, अशा गोष्टींच्या वर्गातील सदस्याचे इतर गोष्टींशी विशिष्ट संबंध असू शकतात हे समजून घ्या. आपण शोधत असलेल्या गोष्टी सारख्या प्रकारची माहिती शोधण्यासाठी त्या प्रकारच्या नातेसंबंधांची माहिती आणि ती वर्ग श्रेणीबद्ध माहिती देखील समाविष्ट करा. किंवा कधीकधी आपण शोधत असलेल्या गोष्टीच्या अगदी अगदी अगदी विपरिततेमुळे, कारण यामुळे आपल्याला एक प्रकारची अतिरिक्त समज दिली जाते. असो, कदाचित यास विरोधातील काहीतरी.

एरिक: होय

कर्क: तर हे खरोखर समजून घ्या. मी याच्या विरुध्द असे काहीतरी पाहू शकतो. आणि म्हणून सिमेंटिक थर हा एक मौल्यवान घटक आहे जो वारंवार गहाळ होत आहे आणि आता येथे मनोरंजक आहे की या कॉनमध्ये येथे या. कारण मी डेटाबेस, डेटा खनन, डेटा पासून डेटा, डेटा सायन्स या विषयांमध्ये पदवी अभ्यासक्रम शिकविला आहे, ज्याला आपण एका दशकासाठी कॉल करू इच्छित आहात; आणि या सेमेस्टर-लाँग कोर्समधील माझे एक युनिट सिमेंटिक्स आणि ऑन्टोलॉजीवर आहे. आणि वारंवार माझे विद्यार्थी माझ्याकडे पाहत असत की, आपण ज्या गोष्टी बोलत आहोत त्याचा त्यात काय संबंध आहे? आणि नक्कीच शेवटी, मला वाटते की आम्हाला हे समजले आहे की डेटा एक प्रकारची ज्ञान फ्रेमवर्कमध्ये ठेवला आहे. म्हणूनच, उदाहरणार्थ, मी एखाद्या विशिष्ट ग्राहक वर्तनाबद्दल माहिती शोधत आहे, ती वर्तन होते हे समजून घेऊन, लोक हे स्पोर्टिंग इव्हेंटमध्ये खरेदी करतात. जेव्हा मी त्यांच्या ग्राहकांना त्यांच्या सोशल मीडियावर - किंवा - तेव्हा लक्षात येते की ते फुटबॉल, बेसबॉल, हॉकी, वर्ल्ड कप यासारख्या स्पोर्टिंग इव्हेंटमध्ये जात आहेत असे मला वाटते तेव्हा मी कोणत्या प्रकारचे उत्पादने ऑफर करतो.

ठीक आहे, म्हणून खेळाचा कार्यक्रम. तर ते म्हणतात की ते बेसबॉल खेळायला जात आहेत. ठीक आहे, मला समजले की बेसबॉल ही एक स्पोर्टिंग इव्हेंट आहे. मी समजतो की सहसा एक सामाजिक आहे आणि आपण लोकांसह जाता. मला समजले की ते सहसा बाहेरील जागेत असते. म्हणजे, त्या सर्व विवादास वैशिष्ट्यांविषयी समजून घेणे, त्यात गुंतलेल्या ग्राहकांचे क्रमवारीकरण, अधिक शक्तिशाली, क्रमवारी आणि आपल्या अनुभवाचे वैयक्तिकरण करणे सक्षम करते जे आपण त्यांना देत असताना, उदाहरणार्थ, ते आपल्याशी संवाद साधत असताना मोबाईल अ‍ॅपद्वारे स्पेस स्टेडियममध्ये बसून असताना.

तर अशा प्रकारच्या सर्व गोष्टींमुळे डेटाची क्षमता आणि शोध क्षमता संभाव्यतेनुसार डेटा ग्रॅन्यूलसची अनुक्रमित करण्याची अनुक्रमित कल्पना येते आणि ज्ञानाची जागा खरोखरच महत्त्वपूर्ण आहे. आणि आज मी बाहेर पडलो खरंच मी खूप प्रभावित झालो होतो. मला असे वाटते की बोलणे ही मूलभूत गोष्ट आहे.

एरिक: होय, ते निश्चित आहे. हे शोध प्रक्रियेमध्ये खूप महत्वाचे आहे, वर्गीकरण प्रक्रियेत ते खूप महत्वाचे आहे. आणि जर आपण त्याबद्दल विचार केला तर जावा वर्गांमध्ये कार्यरत आहे. हे एक ऑब्जेक्ट ओरिएंटेड आहे, मला असे वाटते की कमीतकमी आपण प्रोग्रामिंगचे स्वरूप म्हणू शकता आणि जावा वर्गात काम करतो. म्हणून जर आपण खरंच सॉफ्टवेअर डिझाइन करत असाल तर नवीन वर्ग शोधण्याचा प्रयत्न करण्याची ही संपूर्ण संकल्पना ही आपण वितरीत करण्याचा प्रयत्न करीत असलेल्या कार्यक्षमतेच्या दृष्टीने खरोखरच महत्वाची सामग्री आहे. कारण विशेषत: या नवीन जंगलात, मोठ्या डेटाच्या लोखंडी जगात जिथे आपल्याकडे बरेच जावा आहे अशा प्रकारचे बरेच अनुप्रयोग चालवित आहेत, आपल्याला माहित आहे की संगणकाद्वारे काहीही केले जाण्यासाठी ,000 87,००० किंवा बरेच मार्ग आहेत, काही प्रकारचे मिळविण्यासाठी कार्यक्षमतेचे केले.

जेव्हा लोक म्हणतात की "अरेरे, आपण NoSQL चा वापर करुन डेटा वेअरहाउस तयार करू शकता." तेव्हा माझा एक विनोद विनोद. मला आवडते, "ठीक आहे, आपण हे करू शकता, होय. आपण मायक्रोसॉफ्ट वर्डचा वापर करुन डेटा वेअरहाउस देखील तयार करू शकता." ही चांगली कल्पना नाही, ती फार चांगली कामगिरी करणार नाही परंतु आपण प्रत्यक्षात ते करू शकता. म्हणून की काहीतरी असे करण्याचा उत्तम मार्ग आपल्याला शोधणे आवश्यक आहे.

पुढे जा.

कर्क: मला फक्त त्यास प्रतिसाद द्या. आपण जावा वर्गाचे उदाहरण नमूद केले हे विशेष आहे जे आपण म्हटल्याशिवाय माझ्या मनात आले नाही. जावा आणि वर्गांचा एक घटक आणि त्या प्रकारच्या ऑब्जेक्ट ओरिएंटेशन अशी आहे की अशा पद्धती आहेत ज्या विशिष्ट वर्गांना बांधतात. आणि हा मी खरोखर माझ्या सादरीकरणात पाहण्याचा प्रयत्न करीत होतो आणि एकदा आपल्याला या माहितीचे काही ग्रॅन्यूल समजले की - हे ज्ञान गाळे, हे टॅग्ज, भाष्ये आणि या अर्थविषयक लेबले - नंतर आपण त्यास एक पध्दत बांधू शकता. मुळात त्यांच्याकडे ही प्रतिक्रिया किंवा ही प्रतिक्रिया असते आणि पुढील वेळी आम्ही डेटा प्रवाहात पाहतो तेव्हा आपल्या सिस्टमला या गोष्टीस या प्रकारचा स्वयंचलित, सक्रिय प्रतिसाद प्रदान करा.

म्हणूनच विशिष्ट वर्गासाठी क्रिया आणि पद्धती बंधनकारक करण्याची संकल्पना खरोखर स्वयंचलित रीअल-टाइम analyनालिटिक्सच्या शक्तींपैकी एक आहे. आणि मला असे वाटते की आपण काहीतरी कशा प्रकारेतरी दाबाल.

एरिक: चांगले, चांगले, चांगले. बरं, ही चांगली सामग्री आहे. चला तर मग पाहूया, विल, मी ते आपल्याकडे परत सोपवू इच्छितो आणि प्रत्यक्ष प्रेक्षकांकडून आपल्याकडे प्रश्न विचारू इच्छितो. आम्हालासुद्धा इथे असलेल्यांपैकी काही मिळाली. आणि लोकांनो, आम्ही बराच काळ जात आहोत कारण आम्हाला या चांगल्या प्रश्नांमध्ये या उत्कृष्ट संकल्पनांपैकी काही मिळवायचे आहेत.

तर "एका व्यवसायाची बुद्धिमत्ता कारण आणि परिणामामध्ये फरक कसा करते हे मी खरोखर पहात नाही" असे म्हणत असलेल्या प्रेक्षकांपैकी एकाने मला आपल्याकडे प्रश्न विचारू द्या. दुस words्या शब्दांत, सिस्टम निरीक्षण करण्यायोग्य माहितीच्या आधारे निर्णय घेत असताना, जगाविषयी अधिक जाणून घेण्यासाठी ते नवीन मॉडेल्स कसे विकसित करतात? हा एक मनोरंजक मुद्दा आहे म्हणून मी येथे कारणास्तव-परिणाम परस्परसंबंध ऐकत आहे, मूळ कारण विश्लेषण, आणि विश्लेषकांमध्ये अशी काही उच्च पातळीची सामग्री आहे ज्याबद्दल आपण लोक पारंपारिक बीआयच्या विरोधात बोलता, जे खरोखर आहे फक्त एक प्रकारचा अहवाल देणे आणि काय घडले हे समजून घेण्याचा प्रकार. आणि नक्कीच, आपली संपूर्ण दिशा, येथे फक्त आपल्या स्लाइडकडे पहात आहे, त्या निर्णय घेण्याकडे किंवा कमीतकमी त्या शिफारशी करण्याच्या त्या भावी क्षमतेकडे वाटचाल करत आहे, बरोबर? तर अशी कल्पना आहे की आपण अगोदर काय चालले आहे या संपूर्ण श्रेणीची सेवा देण्याचा प्रयत्न करीत आहात आणि आपण समजून घेत आहात की की, खरी जादू ही उजवीकडील विश्लेषक ध्येय घटकात आहे.

होईल: पूर्णपणे.मला वाटते की हा प्रश्न भविष्यात काहीसा डोकावत आहे, या अर्थाने डेटा विज्ञान, जसे मी मी आधी नमूद केले आहे, आम्ही डेटा वैज्ञानिकांच्या आवश्यकतेसह स्लाइड पाहिली; एखाद्याने असणे ही एक अतिशय आव्हानात्मक भूमिका आहे. त्यांना आकडेवारी आणि विज्ञानाचे परिपूर्ण ज्ञान असणे आवश्यक आहे. आपले गणिताचे ज्ञान डोमेनवर लागू करण्यासाठी आपल्याकडे डोमेन ज्ञान असणे आवश्यक आहे. तर आपण आज जे पहात आहोत ते असे की बॉक्स ऑफ द बॉक्सची पूर्वानुमान साधने नाहीत ज्याप्रमाणे एखादा व्यवसाय वापरकर्ता एक्सेलमध्ये खेचू शकेल आणि आपोआपच त्यांचे भविष्य सांगू शकेल, बरोबर?

या टेकनॉलॉजीला तंत्रज्ञानाची आवश्यकता आहे. आता भविष्यात एखाद्या दिवशी कदाचित असे असेल की या प्रणालींपैकी काही या स्केल-आउट सिस्टम संवेदनशील बनतील आणि काही वन्य गोष्टी करण्यास सुरवात करतील. परंतु मी या टप्प्यावर असे म्हणेन की मॉडेल बनविणे सुरू ठेवण्यासाठी आपल्याकडे अद्याप मध्यभागी डेटा वैज्ञानिक असणे आवश्यक आहे, हे मॉडेल नाही. डेटा खनन आणि या सभोवतालची ही भविष्यवाणी मॉडेल्स अत्यंत वैज्ञानिकपणे तयार केलेली आहेत आणि डेटा वैज्ञानिकांनी बनविली आहेत. मी काय म्हणायचे आहे हे आपल्याला जर माहित असेल तर ते स्वतःहून तयार केलेले नाहीत.

एरिक: होय, अगदी ते अगदी बरोबर आहे. आणि माझ्या ओळांपैकी एक म्हणजे "मशीन्स खोटे बोलत नाहीत, किमान अद्याप नाही."

होईल: अद्याप नाही, अगदी

एरिकः मी एक लेख वाचला - मला या विषयी काहीतरी लिहावे लागेल - विद्यापीठामध्ये काही प्रयोग केले गेले जेथे ते म्हणाले होते की या संगणक प्रोग्राम खोटे बोलणे शिकले आहेत, परंतु मला सांगण्यात आले, माझा यावर खरोखर विश्वास नाही . लोकांनो आम्ही यावर काही संशोधन करू.

आणि शेवटच्या टिप्पणीसाठी, म्हणून रॉबिन मी तुम्हाला या वेबअॅक्शन प्लॅटफॉर्मवर कटाक्ष आणण्यासाठी परत आणीन, कारण ही खूप मनोरंजक आहे. मला संपूर्ण जागेबद्दल हेच आवडते की आपल्याला अशा भिन्न दृष्टीकोनातून आणि विविध विक्रेतांनी घेतलेल्या भिन्न कोनातून अतिशय विशिष्ट गरजा पूर्ण केल्या जातात. आणि मला आमच्या शोसाठी हे स्वरूप आवडते कारण आम्हाला खरोखरच चार मनोरंजक विक्रेते मिळाले जे खरोखरच एकमेकांच्या पायाचे बोट अजिबात पाऊल ठेवत नाहीत. कारण आम्ही सर्व गोष्टी पूर्ण करण्यासाठी विश्लेषणे वापरण्याची गरज असलेल्या वेगवेगळ्या तुकडे आणि समान गरजांचे तुकडे करीत आहोत.

परंतु मला फक्त या विशिष्ट व्यासपीठावर आणि त्यांच्या आर्किटेक्चरवर आपला दृष्टीकोन मिळवायचा आहे. ते गोष्टी कशा करीत आहेत. मला ते खूपच आकर्षक वाटले. तुला काय वाटत?

रॉबिन: ठीक आहे, मी म्हणालो, स्ट्रीमिंग डेटाच्या अत्यंत वेगवान परिणामाकडे ते निदर्शनास आहे आणि शोध म्हणून आपल्याला त्यासाठी आर्किटेक्ट करावे लागेल. मला म्हणायचे आहे की आपण काहीही करून, पळून जात नाही आहात हौशी, कारण आम्हाला त्यापैकी कोणतीही वस्तू मिळाली आहे. हे ऐकणे मला खूप आवडते आणि मला वाटते की आपण भूतकाळात ज्या गोष्टी पाहिल्या त्यातील एक; मी म्हणालो, मला वाटते की आपण आणि मी, गेल्या दोन वर्षांत आपले जबडा अधिकाधिक कमी होत चालला आहे आणि आम्ही पाहिले आहे की जास्तीत जास्त वेगवान, विलक्षण स्मार्ट आणि बरेचसे अभूतपूर्व असे काहीतरी दिसते.

हे उघड आहे, वेबअॅक्शन, बोलणे हे हे पहिले रोडियो नाही. हे खरंच खरंच काही प्रमाणात नावे घेऊन बाहेर पडत आहे. म्हणून मी पाहत नाही परंतु आर्किटेक्चर बर्यापैकी बदलले आहे, परंतु ते नक्कीच आहे याबद्दल आम्हाला आश्चर्य वाटले पाहिजे.

एरिक: ठीक आहे, मी काय सांगेन, लोकांना. आम्ही येथे एका 82 मिनिटांच्या घनतेतून जाळले. म्हणजे, संपूर्ण वेळ ऐकत राहिलेल्या सर्व लोकांना धन्यवाद. आपल्याकडे असे काही प्रश्न असल्यास ज्याचे उत्तर दिले गेले नाही, लाजाळू नका, खरोखर आपल्यासाठी. आमच्याकडून कोठेतरी पडून असावे. आणि एक मोठा, मोठा आज आमच्या दोन्ही सादरकर्त्यांचे, डॉ. कर्क बोर्न आणि डॉ. रॉबिन ब्लॉर यांचे आभार.

कर्क, मी कदाचित आपल्याबरोबर अशा काही अर्थपूर्ण गोष्टी एक्सप्लोर करू इच्छितो, कदाचित भविष्यातील वेबकास्टमध्ये. कारण मला असे वाटते की आम्ही आता अगदी नवीन आणि मनोरंजक अवस्थेच्या सुरूवातीस आहोत. लोक ज्या कल्पनांचा उपयोग करतात आणि त्यातून ते अधिक सहजतेने घडवून आणण्यास आम्ही सक्षम आहोत कारण, सॉफ्टवेअर कमी खर्चीक होत आहे, याचा अंदाज लावा, मी म्हणायला हवे. हे अधिक वापरण्यायोग्य होत आहे आणि आम्हाला या सर्व भिन्न स्त्रोतांकडून फक्त हा डेटा मिळत आहे. आणि मला वाटते की पुढील काही वर्षांत हा एक अतिशय मनोरंजक आणि आकर्षक प्रवास होईल कारण ही सामग्री खरोखर काय करू शकते आणि यामुळे आपल्या व्यवसायात सुधारणा कशी होऊ शकते याचा शोध घेत आहोत.

टेन्कोपीडियाचे आणि आमच्या प्रायोजकांचे - पेंटाहो, वेबएक्शन, मार्कलॉजिक आणि ट्रेझर डेटाचे खूप मोठे आभार. आणि लोकहो, व्वा, आम्ही या निष्कर्षाप्रमाणे येणार आहोत, परंतु आपला वेळ आणि लक्ष दिल्याबद्दल धन्यवाद. पुढील शोसाठी आम्ही आपल्याला सुमारे दीड महिन्यात पकडू. आणि अर्थातच, ब्रीफिंग रूम चालूच आहे; रेडिओ चालूच आहे; आमच्या इतर सर्व वेबकास्ट मालिका लोकांना रॉक करणे आणि रोलिंग करणे चालू ठेवा. खूप खूप धन्यवाद. पुढच्या वेळी आम्ही आपल्याला पकडू. बाय-बाय.