सर्वत्र एम्बेड ticsनालिटिक्स: सिटीझन डेटा सायंटिस्ट सक्षम करणे

लेखक: Lewis Jackson
निर्मितीची तारीख: 12 मे 2021
अद्यतन तारीख: 23 जून 2024
Anonim
सर्वत्र एम्बेड ticsनालिटिक्स: सिटीझन डेटा सायंटिस्ट सक्षम करणे - तंत्रज्ञान
सर्वत्र एम्बेड ticsनालिटिक्स: सिटीझन डेटा सायंटिस्ट सक्षम करणे - तंत्रज्ञान

टेकवे: होस्ट रेबेका जोझवियाक एम्बेडेड ticsनालिटिक्स आणि नागरिक डेटा वैज्ञानिकांच्या घटनेविषयी डॉ. रॉबिन ब्लॉर, डेझ ब्लांचफिल्ड आणि डेव्हिड स्वीनर यांच्यासह चर्चा करतात.



व्हिडिओ पाहण्यासाठी आपण या कार्यक्रमासाठी नोंदणी करणे आवश्यक आहे. व्हिडिओ पाहण्यासाठी नोंदणी करा.

रेबेका जोझवियाक: स्त्रिया व सज्जनो, नमस्कार आणि हॉट टेक्नॉलॉजीजमध्ये आपले स्वागत आहे. “सर्वत्र एम्बेड करा: नागरिक डेटा वैज्ञानिक सक्षम करणे” हा आजचा आपला विषय आहे. मी तुझ्या नेहमीच्या होस्टसाठी भरत आहे, ही एरिका कवानागची रेबेका जोझवियाक भरत आहे. होय, हे वर्ष गरम आहे. विशेषत: “डेटा वैज्ञानिक” या शब्दाकडे लक्ष वेधले जात आहे जरी आम्ही त्यांना “सांख्यिकीशास्त्रज्ञ” किंवा “विश्लेषक तज्ज्ञ” सारख्या कंटाळवाण्या नावाने संबोधत असलो तरी त्याच प्रकारचे क्रियाकलाप हाताळत पण त्याला एक नवीन नाव मिळाले आहे आणि ते आहे खूप लक्ष वेधून घेणे. ते कामाच्या ठिकाणी असणे इष्ट आहेत, संस्थेसाठी फायदेशीर आहेत आणि प्रत्येकाला ते हवे आहे. परंतु ते आहेत: 1) महाग, 2) शोधणे कठीण. आपणास माहित आहे की डेटा वैज्ञानिकांच्या कौशल्याची कमतरता याबद्दल सर्व बातमी सर्वत्र पसरली आहे, होय, परंतु तरीही ते त्या संस्थेला अतुलनीय मूल्य ऑफर करतात आणि डाईम ड्रॉप न करता ते मूल्य कसे मिळवायचे हे शोधण्यासाठी लोक एक प्रकारचे कौतुक करतात. बोला.


पण चांगली बातमी ही आहे की आम्ही साधने आणि सॉफ्टवेअर येत असल्याचे पाहत आहोत जे त्या कमतरतेची भरपाई करतात. आमच्याकडे ऑटोमेशन, मशीन लर्निंग, एम्बेड केलेले ticsनालिटिक्स आहेत, जे आपण आज शिकत आहोत आणि या प्रकाराला “नागरिक डेटा वैज्ञानिक” या नवीन संज्ञेला जन्म देईल आणि याचा अर्थ काय आहे? नाही, ते आपले प्रशिक्षित डेटा वैज्ञानिक नाही, ते आपला व्यावसायिक वापरकर्ता, आपला बीआय तज्ज्ञ, आयटीमधील कोणीतरी असू शकेल, ज्याची पार्श्वभूमी आहे परंतु कदाचित तज्ञ असणे आवश्यक नाही.परंतु हे काय करते, ही साधने आणि सॉफ्टवेअर, अधिक खोल लोकांना कोडींग माहित नसतानाही त्या स्मार्ट सोल्यूशन्समध्ये प्रवेश देते. परंतु आपण प्रत्येकास त्या विश्लेषणात्मक विचारांवर थोडासा अधिक प्रवेश देता तेव्हा हे एकूणच कार्यप्रदर्शन सुधारण्यात मदत करते. आपल्याकडे असे कुतूहल आहे ज्याचे प्रकार आपल्या कंपनीसाठी चांगले अंतर्दृष्टी आणू शकेल असे प्रशिक्षण घेण्याची गरज नाही.

आज आमच्याबरोबर आमचे स्वतःचे रॉबिन ब्लॉर, ब्लॉर ग्रुपचे मुख्य विश्लेषक आहेत, स्वतःच मायावी डेटा वैज्ञानिक, डेझ ब्लँकफिल्ड कॉल करीत आहेत आणि त्यानंतर आमच्याकडे डेल स्टॅटिस्टीका येथील डेव्हिड स्वीनर आज एक सादरीकरण देणार आहेत. आणि त्यासह मी हे रॉबिन ब्लॉरकडे पाठवणार आहे.


रॉबिन बूर: ठीक आहे, त्या प्रस्तावनेबद्दल धन्यवाद. मी एक ऐतिहासिक फसवणूक या बद्दल एक प्रकारचा विचार. आम्ही येथे पहात आहोत ते म्हणजे लिओनार्डो दा विंचीच्या डिझाईन्सपैकी एक म्हणजे एक माणूस त्याच्या पाठीवर ठेवू शकतो. ते प्रत्यक्षात कार्य करेल की नाही याची मला कल्पना नाही. मी त्यात प्रवेश करणार नाही, असे मला म्हणायचे आहे. तथापि, दा विंची, जेव्हा जेव्हा मी दा विंचीबद्दल विचार करतो, तेव्हा मी त्याला आजवर अस्तित्त्वात असलेल्या सर्वात जिज्ञासू आणि विश्लेषणात्मक लोकांपैकी एक म्हणून विचार करतो. आणि आपण त्या ग्लायडरकडे फक्त पक्ष्याच्या पंखांच्या आधारावर डिझाइन केलेले पाहिले असल्यास आणि त्या तयार करण्यासाठी त्याने पक्षांच्या फ्लाइटचा एक प्रकारे किंवा दुसर्‍या प्रकारे अभ्यास केला असेल तर हे अगदी स्पष्ट आहे.

जर आपण ऐतिहासिक दृष्टीकोन घेतला तर - मी प्रत्यक्षात या गोष्टीकडे पाहिले - विश्लेषणे ही गणिताची सर्वात जुनी ओळख आहे. अशी जनगणने आहेत जी किमान बॅबिलोनियन काळाची आहेत. आम्हाला याबद्दल माहित आहे कारण मुळात काही कनिफार्म टॅब्लेट असतात ज्यात त्यासारखे डेटा असतात. आधी असे काही आहे की नाही हे माहित नाही. परंतु सर्वात स्पष्ट गोष्ट म्हणजे आपण स्वत: ला मोठ्या संख्येने लोकसंख्येसह एक सभ्यता प्राप्त केली आहे, त्यास प्रत्यक्षात नियोजन करण्याची आवश्यकता आहे आणि आपण कशासाठी योजना आखत आहात आणि त्या लोकांच्या आवश्यकता काय आहेत हे जाणून घेणे चांगले आहे.

आणि येथूनच संगणकाची सुरुवात झाली आणि संगणकाची सुरवात झाली, त्याचप्रमाणे संगणकाची सुरूवात झाली, सुरुवातीच्या मेकॅनिकल संगणक प्रत्यक्षात होते, मला वाटते की सर्वप्रथम हॉलरीथने तयार केलेली जनगणना होती, जी आयबीएम झाली, असा माझा विश्वास आहे. हे सर्व पुढे गेले आहे. कदाचित १ 1970 s० आणि आजच्या काळादरम्यान काही प्रकारचे अंतर घडले आहे, जिथे इतर अनुप्रयोग आणि विश्लेषणे मोठ्या संख्येने आहेत, आपण म्हणू शकता की मागची जागा घेतली. होय, तेथे विश्लेषणे चालू होती - हे मोठ्या संस्था, विशेषत: बँका आणि विमा कंपन्या आणि प्रत्यक्षात जनरल इलेक्ट्रिक आणि टेलको आणि अशा गोष्टींमध्ये घडत होते - परंतु हे सामान्यपणे व्यवसायामध्ये वापरले जात नव्हते आणि आता सामान्यपणे संपूर्णपणे त्याचा वापर सुरू झाला आहे. व्यवसाय आणि खरोखर हा खेळ बदलला आहे. मला वाटले की प्रथम मी लक्ष वेधून घेतले आहे ती म्हणजे डेटा पिरामिड, जो मला विशेषतः आवडतो. याचा अर्थ असा आहे की मी यापैकी एक 20 वर्षांपूर्वी काढला - किमान 20 वर्षांपूर्वी - प्रयत्न आणि समजून घेण्यासाठी, त्या वेळी, मी द्वितीय (बीआय) आणि काही प्रारंभिक डेटा खाण समजून घेण्याचा प्रयत्न करीत होतो. मी येथे काय परिभाषित केले ते म्हणजे डेटाची कल्पना आणि उदाहरणे म्हणजे संकेत, मोजमाप, रेकॉर्डिंग, घटना, व्यवहार, गणना, एकत्रीकरण, माहितीचे वैयक्तिक गुण. आपण कदाचित त्यांना माहितीचे रेणू मानू शकता, परंतु ते वैयक्तिक मुद्दे आहेत. हे कोन झाल्यावर माहिती होते. दुवा साधलेला डेटा, संरचित डेटा, डेटाबेस, डेटाचे व्हिज्युअलायझेशन, प्लॉटर्स, स्कीमर आणि ऑटोलॉजीज - ते सर्व माहिती म्हणून माझ्या मनात पात्र ठरतात कारण आपण जे काही केले ते एकत्रितपणे बरेच विविध आहे आणि डेटा पॉईंटपेक्षा बरेच काही तयार केले आहे, प्रत्यक्षात एक आकार, गणिताचा आकार

त्याउलट आम्हाला ज्ञान आहे. आम्ही माहितीचे परीक्षण करून असे शिकू शकतो की तेथे बरेच नमुने आहेत आणि नियम, धोरणे, मार्गदर्शक तत्त्वे, कार्यपद्धती तयार करून आपण त्या नमुन्यांचा फायदा घेऊ शकतो आणि मग ते ज्ञानाचे रूप घेते. आणि सर्व संगणक प्रोग्राम जे काही करीत आहेत ते एक प्रकारचे ज्ञान आहे कारण ते डेटा विरूद्ध कार्य करीत आहेत आणि त्यांना नियम लागू करतात. आमच्याकडे हे तीन स्तर आहेत आणि थरांमध्ये वाढणारी परिष्करण आहे. आणि या आकृतीच्या डाव्या बाजूला आपण नवीन डेटा प्रविष्ट करीत दर्शविला आहे, म्हणून या बर्‍याच गोष्टी स्थिर आहेत. डेटा जमा होत आहे, माहिती जमा होत आहे आणि ज्ञान संभाव्यत: वाढत आहे. वरच्या बाजूस आपल्याकडे “समज” आहे आणि मी ते सांगेल की ते तात्त्विक वाद असूनही समज फक्त मनुष्यांतच असते. जर मी त्याबद्दल चुकत असेल तर आपण सर्व वेळोवेळी संगणकाद्वारे बदलले जाऊ. परंतु वादविवाद करण्याऐवजी मी पुढील स्लाइडवर जात आहे.

जेव्हा मी या गोष्टीकडे पाहिले तेव्हा ही मजेशीर गोष्ट म्हणजे ही एक अलीकडील गोष्ट आहे, मनोरंजक गोष्ट म्हणजे विश्लेषक म्हणजे काय ते शोधून काढणे. आणि अखेरीस वेगवेगळ्या आकृत्या रेखाटून आणि यासारखे दिसणारे शेवटपर्यंत मी निष्कर्षापर्यंत पोचलो, खरं सांगायचं तर विश्लेषिकी विकास म्हणजे गणितीय सूत्राच्या कितीतरी प्रमाणात सॉफ्टवेयर डेव्हलपमेंट. डेटा विषयी नवीन ज्ञान निर्माण करण्यासाठी आपण प्रत्यक्षात बर्‍याच, अनेक भिन्न मॉडेल्स घेतील आणि त्यांची तपासणी कराल या अर्थाने सॉफ्टवेअर डेव्हलपमेंटमध्ये थोडा वेगळे आहे. परंतु एकदा आपण ते व्युत्पन्न केल्‍यानंतर, ते मला निष्क्रीय निर्णयाचे समर्थन म्हणून जे वाटते त्यानुसार अंमलात आणले जाते, जी वापरकर्त्यास भरलेली माहिती आहे; परस्परसंवादी निर्णय समर्थन, जी ओएलएपी सारख्या गोष्टी आहेत जिथे वापरकर्त्यास डेटाची रचनात्मक रचना दिली जाते ज्यामध्ये ते उपलब्ध असलेल्या विविध साधनांचा वापर करुन स्वत: साठी गोष्टी तपासून व वजा करू शकतात. बरीच व्हिज्युअलायझेशन अशी आहे. आणि मग आमच्याकडे ऑटोमेशन आहे जर आपण अंमलात आणल्या जाणार्‍या नियमांच्या संचामध्ये आपण एकत्रित केलेले काही विश्लेषणात्मक अंतर्दृष्टी बदलू शकत असाल तर आपल्याला त्यात सामील होण्याची गरज नाही. जेव्हा मी हे सर्व केले तेव्हा मी त्याकडे पाहण्याचा हा प्रकार होता. आणि मला विविध गोष्टी येऊ लागल्या. क्रियाकलापाचे क्षेत्र एकदा, आपण असे म्हणू शकतो की एकदा एखाद्या डेटाचे डोमेन प्रत्यक्षपणे खणले गेले, नख खाणले गेले, प्रत्येक संभाव्य दिशेने नखून शोधले गेले तर अखेरीस ते फक्त स्फटिकरुप बीआय बनतात. आविष्कार केलेले ज्ञान असे ज्ञान होण्यास सुरवात होते जे विविध वापरकर्त्यांना विविध मार्गांनी माहिती देते आणि त्यांची क्षमता खरोखरच ते करत असलेली कार्य करण्याची क्षमता वाढवते.

माझ्या लक्षात असलेल्या गोष्टींपैकी एक आणि मी अंदाजे पाच वर्षे विश्लेषक विश्लेषणे पाहिली आहेत, परंतु भाकित विश्लेषणे म्हणजे बीआय बनत आहेत, या अर्थाने की हे लोकांना खायला देण्यासाठी केवळ उपयुक्त माहितीमध्ये रुपांतर करीत आहे आणि मी आधीच सांगितले आहे की, स्वयंचलित द्विपक्षीय अहवाल आहे, बीआय शोषक आहे, बीआय आहे, त्याचे बरेच भिन्न श्रेणीकरण आहे आणि भविष्यसूचक विश्लेषण प्रत्यक्षात सर्व तिन्ही दिशेने जात आहे. आणि मी सांगितल्याप्रमाणे विश्लेषणात्मक प्रक्रिया सॉफ्टवेअर डेव्हलपमेंटपेक्षा इतकी वेगळी नाही, जशी काही वेगळी कौशल्ये असलेल्या लोकांद्वारे केली जाते. मला असे वाटते की मी यावर जोर दिला पाहिजे की खरोखर चांगले डेटा वैज्ञानिक बनविण्यासाठी आवश्यक कौशल्ये प्राप्त करण्यास वर्षे लागतील. ते सहजपणे संपादन केलेले नाहीत आणि मोठ्या संख्येने लोक हे करू शकत नाहीत, परंतु हे काय आहे की काय मान्य आहे आणि काय वैध नाही हे जाणून घेण्यासाठी अत्यंत अत्याधुनिक पातळीवर गणित समजून घेणे समाविष्ट आहे. विश्लेषक विकास, नवीन ज्ञानाचा शोध, विश्लेषणे रोपण, हे ज्ञान कार्यान्वित करण्याबद्दल आहे. मी संपूर्ण विश्लेषणाकडे पाहत असलेल्या पार्श्वभूमीचा हा प्रकार आहे. हे एक विशाल क्षेत्र आहे आणि त्यास बरीच, अनेक परिमाणे आहेत, परंतु मला असे वाटते की सामान्यीकरण प्रत्येक गोष्टीवर लागू होते.

मग व्यवसायात अडथळा निर्माण झाला आहे, जसे मी सांगितल्याप्रमाणे बर्‍याच संस्था आहेत, फार्मास्युटिकल कंपन्या आणखी एक आहेत, त्यांच्या डीएनएमध्ये त्यांचे विश्लेषण आहे. परंतु बर्‍याच संस्था आहेत ज्यांचे खरोखरच ते त्यांच्या डीएनएमध्ये नसते आणि आता त्यांच्याकडे क्षमता आहे, आता सॉफ्टवेअर आणि हार्डवेअर पूर्वीपेक्षा किती स्वस्त आहे, आता त्यांच्याकडे हे शोषण करण्याची क्षमता आहे. मी असंख्य गोष्टी सांगेन. पहिली गोष्ट म्हणजे विश्लेषक म्हणजे बर्‍याच उदाहरणांमध्ये ते अनुसंधान व विकास आहे. आपण कदाचित संस्थेच्या विशिष्ट क्षेत्रासाठी विश्लेषणे वापरत असाल आणि कदाचित आपण एखाद्या मार्गाने किंवा ग्राहकांच्या ऑर्डरचे पुन्हा एकदा विविध दृष्टिकोनातून विश्लेषण करत आहात आणि त्यास अन्य डेटासह त्यात सामील केले पाहिजे असे कदाचित वाटत असेल. परंतु विश्लेषणे ही संस्था संपूर्णपणे पाहण्याची आणि संस्थेमध्ये चालू असलेल्या विशिष्ट क्रियाकलापांचे आणि संपूर्ण उपक्रमांच्या संपूर्ण साखळीचे विश्लेषण करण्याची शक्यता निर्माण करतात. परंतु एकदा आपण त्या क्षेत्रामध्ये जाल तर, मी हे अनुसंधान व विकास करीत आहे. आणि मला असा प्रश्न पडला आहे की मला दोन वेळा विचारले गेले आहे, “एखाद्या कंपनीने विश्लेषकांवर किती खर्च करावा?” आणि मला असे वाटते की उत्तर देण्याबद्दल विचार करण्याचा उत्तम मार्ग म्हणजे अनुसंधान आणि विकास म्हणून विचार करणे. , आणि फक्त विचारा, "व्यवसायाच्या कार्यक्षमतेच्या क्षेत्रात आपण आर अँड डी वर किती खर्च कराल?"

आणि विश्लेषक नसलेले व्यवसाय, त्यांच्याकडे नसलेल्या बर्‍याच गोष्टी आहेत. सर्व प्रथम, ते कसे करावे हे त्यांना माहिती नाही. सामान्यत: जर ते प्रत्यक्षात एखाद्या मार्गावर जात असतील किंवा दुसर्‍या संस्थेमध्ये विश्लेषणे स्वीकारत असतील तर - त्यांच्याकडे खरोखर सल्लामसलत करण्याशिवाय काही पर्याय नाही ज्यामुळे त्यांना ते करण्यास मदत होईल कारण, बहुतेकांसाठी हे अशक्य किंवा खरोखरच अवघड आहे. व्यवसाय प्रत्यक्षात एखादा डेटा वैज्ञानिक ठेवण्यासाठी, एखादा शोधण्यासाठी, एखाद्याला मोबदला देण्याचा आणि आपण त्यांना इच्छित असलेल्या गोष्टींवर खरोखर विश्वास ठेवण्यास उद्युक्त करतो. खूप कठीण हे व्यवसाय प्रत्यक्षात कसे करावे यासाठी बहुतेक व्यवसायांना कर्मचार्‍यांना कसे कामावर घ्यावे किंवा कसे शिकवायचे हे माहित नसते आणि त्यामागील कारण हे आहे की ते अद्याप त्यांच्या डीएनएमध्ये नाहीत, म्हणूनच ते त्यांच्या नैसर्गिक व्यवसाय प्रक्रियेचा भाग नाहीत. हे पुढील बिंदूमध्ये फीड करते. त्यांना व्यवसाय प्रक्रिया कशी करावी हे माहित नाही. तसे करण्याचा उत्तम मार्ग म्हणजे, औषधी कंपन्या आणि विमा कंपन्या काय पहातात, कॉपी करणे आणि आरोग्य सेवा केंद्रातील काही कंपन्या, विश्लेषक कसे वापरायचे ते पहा आणि त्याची कॉपी करा. कारण ही एक व्यवसाय प्रक्रिया आहे. हे कसे करावे ते माहित नाही किंवा त्याचे ऑडिट कसे करावे हे माहित नाही. खरोखरच, आता खासकरुन की बर्‍याच सॉफ्टवेअर कंपन्यांनी अशी उत्पादने तयार केली आहेत जी अत्यंत वाईट विश्लेषणे स्वयंचलित करतात. लेखा परीक्षण करण्याचा मुद्दा महत्त्वाचा आहे, जेव्हा आपल्याकडे सल्लामसलत किंवा साइटवरील कोणीतरी असेल तेव्हा कोणत्याही विश्लेषक गणनाचा परिणाम काय आहे हे समजून घेण्यावर विश्वास ठेवला जाऊ शकतो, हा आपल्याला निवड करण्याचा एक प्रकार आहे, परंतु आपण खरोखर शक्तिशाली विश्लेषणात्मक साधने घातल्यास लोकांचे विश्लेषण जे विश्लेषणे योग्यरित्या समजत नाहीत, ते कदाचित योग्य नसतील अशा निष्कर्षांकडे जाण्याची शक्यता आहे. आणि मी म्हटल्याप्रमाणे, कंपन्यांना त्याचे बजेट कसे करावे हे माहित नाही.

हे विश्लेषणाचे फ्लेवर्स आहेत, मी त्यांच्याद्वारे चालत राहीन. सांख्यिकी विश्लेषणे आणि सांख्यिकी मॉडेलिंग अंदाजे विश्लेषणेपेक्षा लक्षणीय भिन्न आहेत, त्यापैकी बहुतेक मार्ग वक्र-फिटिंग आहेत. मशीन लर्निंग त्या गोष्टींपेक्षा भिन्न आहे, पथ विश्लेषणे आणि वेळ मालिका, मुळात स्थिती प्रवाहांवर केल्या गेलेल्या गोष्टी पुन्हा भिन्न आहेत. आलेख विश्लेषणे पुन्हा भिन्न आहेत आणि विश्लेषणे आणि अर्थविषयक विश्लेषण पुन्हा भिन्न आहेत. ही केवळ एक बहु-शैलीतील वस्तू असल्याचे दर्शवित आहे. असे नाही, आपण analyनालिटिक्स करणे प्रारंभ करत नाही, आपण आपल्यास असलेल्या समस्यांकडे पहात आहात आणि विश्लेषणेची विविध साधने आणि विविध स्वाद शोधत आहात. आणि शेवटी, नेट नेट. हार्डवेअर आणि सॉफ्टवेअर उत्क्रांतीमुळे, माझ्या मते विश्लेषक अगदी बालपणात आहे. अजून बरेच काही आहे, अजून येणे बाकी आहे आणि येत्या काही वर्षांत ते उलगडताना आपण पाहू. मला वाटते की मी आता चेंडू डेझकडे जाऊ शकतो.

डेझ ब्लांचफिल्ड: होय, अनुसरण करण्यासाठी कठोर कृत्याबद्दल बोला, रॉबिन. मी या विषयावर माझ्या एका आवडत्या कोनातून थोडक्यात भेट देणार आहे, जे मानवी कोन आहे. आपल्या दैनंदिन जीवनात बरेच बदल होत आहेत. आमच्या दैनंदिन जीवनात सर्वात मोठा अडथळा, सध्या माझ्या दृष्टीने, फक्त रोजचे काम. नोकरीकडे वळत आहात आणि आपण ज्या नोकरीवर घेत आहात ते करण्याचा प्रयत्न करीत आहात आणि आपण दररोजच्या व्यक्तीकडून एका सुपरहिरोकडे जात असल्याची वाढती अपेक्षा आणि संघटनांच्या सभोवताल वाहून जाणा information्या आणि माहितीच्या प्रमाणात, अगदी द्रुतपणे, हे एक महत्त्वपूर्ण आव्हान आहे आणि अधिकाधिक आणि ज्ञान व माहितीच्या प्रवाहाचा सामना करण्यासाठी आणि लोकांना सामोरे जाण्यासाठी आम्हाला अधिक चांगली आणि चांगली साधने उपलब्ध करुन दिली आहेत आणि म्हणून मी विचार केला आहे की मी थोडीशी मजेदार कोनातून प्रयत्न करेन. . परंतु, हे नेहमी मला धडपडत असते की आपल्याकडे हे उच्च मन किंवा फ्लॅश मॉब कसे आहे आणि हे पुढे आहे जे विश्लेषणे म्हणून आपण ज्या गोष्टींबद्दल बोलतो त्याकडे आपले लक्ष वेधून घेतात परंतु आपण ज्याबद्दल बोलत आहोत त्या लोकांना माहिती उपलब्ध करुन देत आहेत आणि त्यांना त्यास संवाद साधण्याची आणि असे करणे अशक्य करा की हे नैसर्गिक आहे आणि ते सामान्य आहे.

आणि खरं तर, ते मला एका लहान मुलाच्या, लहान मुलाच्या, YouTube च्या व्हिडिओची आठवण करून देते आणि ते तेथे बसून आयपॅडसह खेळत आहे आणि ते फडफडत आहे, चिमटे काढत आहे, प्रतिमा बाहेर काढत आहे आणि स्क्रीनवर खेळत आहे, तेथील डेटा. आणि मग पालक आईपॅड काढून मुलाच्या मांडीवर एक मॅगझिन, एड मॅगझिन ठेवतात. आणि हे मूल कदाचित दोन वर्षांपेक्षा जास्त वयाचे असेल. मुलाने मासिकाच्या स्क्रीनसह स्वाइप करण्यास आणि पिचणे आणि पिळणे सुरू केले आणि मॅगझिन प्रतिसाद देत नाही. मुलाने आपले बोट वर केले आणि त्याकडे बघितले आणि विचार करते, “हं, मला माझ्या बोटाचे कार्य होत नाही असे वाटत नाही,” आणि ते स्वत: च्या हाताने वेढते आणि विचार करते, “अहो, माझ्या बोटाचे काम मला माझ्या हाताने जाणवते आणि ते चांगले दिसते आहे, ”आणि ते बोटाला चिकटवते आणि बोटाने सुरकुती मारली आणि प्रतिसाद दिला. होय नंतर ते मासिकाशी पुन्हा संवाद साधण्याचा प्रयत्न करते आणि कमी करते आणि पाहते की तो चिमूट काढत नाही आणि पिळून पडत नाही आणि स्क्रोल करत नाही. मग ते मासिका काढून घेतात आणि आयपॅड परत त्याच्या मांडीवर ठेवतात आणि अचानक सर्व गोष्ट कार्य करते. आणि म्हणूनच येथे एक मूल आहे की ज्यांना विश्लेषणात्मक साधन किंवा करमणुकीसाठी थेट प्रवाह साधन वापरण्याचे प्रशिक्षण दिले गेले आहे आणि ते मासिक कसे कार्य करावे आणि पृष्ठे झटकन कसे कार्य करू शकत नाहीत.

आणि ही स्वतः एक रुचीपूर्ण संकल्पना आहे. परंतु जेव्हा मी संस्थांभोवती फिरत असलेले ज्ञान आणि डेटा कसा वाहतो आणि लोक कसे वागतात याबद्दल विचार करतो तेव्हा बहुतेकदा मी लोकांना फ्लॅश मॉब असल्याचे काय शिकले आहे या संकल्पनेबद्दल विचार करते, ही एक घटना आहे जिथे आहे आणि कोणती सोशल मीडिया बनवते हे करणे यापेक्षा सुलभ, या वेळी या तारखेस आणि कृतीवर या ठिकाणी जाण्याची कल्पना या व्हिडिओ पहा आणि हे नृत्य जाणून घ्या किंवा या रंगीत टोपी घालून उत्तरेला एक वाजता निर्देशित करा. आणि आपण हे आपल्या नेटवर्कद्वारे पुढे ढकलता, आणि संपूर्णपणे संपूर्ण लोक, शेकडो लोक, एकाच ठिकाणी एकाच वेळी समान कार्य करतात आणि हे वाहण्याचे घटक आहेत, जसे की, "पवित्र गाय, ती होती खरोखर प्रभावी! ”परंतु प्रत्यक्षात ही एक सोपी कल्पना आहे, आणि एक सोपी संकल्पना फक्त आमच्या नेटवर्कद्वारे बाहेर ढकलली जात आहे आणि आम्हाला हा परिणाम प्राप्त होतो जो एक नेत्रदीपक आणि प्रभावीपणे प्रभावी आहे. आणि जेव्हा आपण एखाद्या संस्थेबद्दल विचार करता, लोक कसे वागावे आणि आपली माहिती सिस्टम आणि ग्राहकांशी कसे वागावे अशी आमची इच्छा आहे, हे सहसा सोपे असते, ही एक कल्पना किंवा संकल्पना किंवा सांस्कृतिक किंवा वर्तणुकीचे गुण आपण पार करण्याचा प्रयत्न करतो साधने आणि माहितीद्वारे आणि सक्षम बनविणे.

अडीच दशकांहून अधिक काळ मी असा हा मंत्र ठेवला आहे आणि तो म्हणजे, जर आपल्या कर्मचार्‍यांना त्यांचे काम करण्याची गरज नसल्यास ते साधने किंवा माहिती असेल तर ते चाक पुन्हा नव्याने घडवतील. आणि म्हणूनच हे आता एक सतत वाढणारे आव्हान आहे, जिथे आम्हाला बरेच ज्ञान आणि बरेचसे माहिती आणि खूप वेगवान हालचाली मिळाल्या आहेत, आम्हाला लोकांना चाक पुन्हा चालू करणे थांबवायचे आहे. आणि जेव्हा आपण आमच्या कामकाजाच्या वातावरणाबद्दल विचार करतो, लोकांच्या अंगाकडे परत जाऊ, जे माझ्या आवडीचे एक आहे, जेव्हा मला आश्चर्य वाटले तेव्हा आश्चर्यचकित झाले की क्यूबिकल्स चांगल्या परिणामासाठी अनुकूल वातावरण नाहीत किंवा आम्ही या भयानक गोष्टींसारख्या गोष्टी तयार केल्या. इथली चित्रे आणि ती फारशी बदलली नाही, फक्त भिंती खाली केल्या आणि त्यांना मोकळ्या जागेची जागा म्हणा. परंतु मध्यभागी त्यांच्याभोवती पिवळ्या पळवाट असलेले दोन लोक ज्ञानाची देवाणघेवाण करतात. आणि तरीही, आपण उर्वरित खोली पाहिल्यास ते स्क्रीनवर माहिती ठेवून तेथे सर्व कर्तव्यदक्षपणे तेथे बसले आहेत. आणि बर्‍याचदा नाही, खरोखरच ज्ञान आणि डेटाची देवाणघेवाण केली जात नाही आणि यासाठी अनेक कारणे आहेत. परंतु तेथे पिवळ्या वर्तुळात डाव्या बाजूला मजल्याच्या मध्यभागी असलेला संवाद, तेथे दोन लोक तेथे गप्पा मारत आहेत, ज्ञान अदलाबदल करीत आहेत आणि कदाचित काहीतरी शोधण्याचा प्रयत्न करीत आहेत, असे म्हणण्याचा प्रयत्न करीत आहेत, “हा अहवाल कोठे आहे हे आपणास माहित आहे काय? हा डेटा शोधण्यासाठी मी कोणते साधन वापरतो? "आणि हे कदाचित कार्य केले नाही म्हणून त्यांना काहीही मिळाले नाही, आणि मजल्यावरील भटकंती केली, क्यूबिकल ऑफिस स्पेसचा नियम मोडला आणि वैयक्तिकरित्या केला.

आणि आमच्याकडे ऑफिसच्या आसपास असे वातावरण आहे जे आम्ही विनोदीपणे विनोद करतो, परंतु वास्तविकता अशी आहे की ते बरेच शक्तिशाली आणि प्रभावी आहेत. आणि माझ्या आवडींपैकी एक म्हणजे मोबाइल किंवा फिक्स्ड analyनालिटिक्स प्लॅटफॉर्म, ज्याला वॉटर कूलर म्हटले जाते, जिथे लोक तिथे उठतात आणि तेथे चॅट-गप्पा मारतात आणि ज्ञान स्वॅप करतात आणि कल्पनांची तुलना करतात आणि वॉटर कूलरवर उभे राहून विश्लेषणे करतात. जेव्हा आपण त्यांचा विचार करता तेव्हा त्या खूपच शक्तिशाली संकल्पना असतात. आणि आपण त्या आपल्या सिस्टम आणि साधनांमध्ये अनुवादित करू शकत असाल तर आपणास आश्चर्यकारक परिणाम मिळतो. आणि आम्हाला सर्वांगीण आवडते प्राप्त झाले आहेत जे मुख्यत: ऑफिसचे सर्वात शक्तिशाली डेटा वितरण केंद्र आहे, अन्यथा रिसेप्शन डेस्क म्हणून ओळखले जाते. आणि जर आपल्याला काही सापडले नाही तर आपण कोठे जात आहात? बरं तुम्ही ऑफिसच्या समोर जा आणि रिसेप्शनला गेलात आणि म्हणाल, “एक्स, वायड, झेड कोठे आहे हे तुम्हाला ठाऊक आहे काय?” आणि मी कुणाला तरी सांगायला हिम्मत करतो की त्यांनी हे काम कमीतकमी एकदा नवीन केले नाही नोकरी किंवा एखाद्या वेळी जेव्हा त्यांना फक्त काहीच सापडत नाही. आणि आपणास स्वतःला विचारावे लागले आहे की ते असे का करतात? ते इंट्रानेटवर किंवा कुठल्याही साधनावर किंवा जे काही असू शकते. ते शोधणे सोपे आहे.

आणि म्हणून जेव्हा डेटा आणि विश्लेषणे आणि आम्ही आमच्या कर्मचार्‍यांना त्यांचे कार्य करण्यासाठी प्रदान केलेल्या साधनांबद्दल आणि मानवांनी नोकरीशी कसा संवाद साधण्याचा मार्ग वापरला आहे तेव्हा, विश्लेषक साधने आणि मोठ्या डेटा प्लॅटफॉर्मच्या अलिकडच्या उदयास येण्यापूर्वी माझे मत आहे. , किंवा “डेटा प्रोसेसिंग” तसेच याला जुन्या शाळेत कॉल करणे, रिपोर्टिंग आणि ज्ञान सामायिकरण हे डायनॅमिक किंवा सहयोगी किंवा मुक्त नव्हते, आणि आपण ज्या प्रकारच्या यंत्रणेद्वारे लोकांच्या नोकरीची अपेक्षा करतात त्याबद्दल विचार करता तेव्हा आमच्याकडे शास्त्रीय होते, काय लोक आता वारसा म्हणतात, परंतु वास्तविकता अशी आहे की तो केवळ एक वारसा आहे जो आजवर आहे आणि तो आजही येथे आहे आणि म्हणून हा खरोखर वारसा नाही. परंतु पारंपारिक एचआर सिस्टम आणि ईआरपी सिस्टम - मानव संसाधन व्यवस्थापन, एंटरप्राइझ संसाधन नियोजन, एंटरप्राइझ डेटा व्यवस्थापन आणि आम्ही कंपनी चालविण्यासाठी माहिती व्यवस्थापित करण्यासाठी वापरत असलेल्या सिस्टम. हे कायमच चालेल.आणि वरच्या टोकापासून, विभागीय इंट्रानेट्स सारख्या सोप्या प्लॅटफॉर्मवर, गोष्टी कोठे आहेत आणि त्या कशा मिळवायच्या आणि त्या जागेवरील ज्ञानाशी कसा संवाद साधता येईल याविषयी संवाद साधण्याचा प्रयत्न करणे. आम्ही आमच्या इंट्रानेटवर पॉप अप करतो. तेवढे चांगले ठेवण्यासाठी लोक वेळ घालवतात आणि प्रयत्न करतात, अन्यथा ते आपल्या डोक्यातच शिल्लक असते. किंवा आपल्याकडे अन्न साखळीच्या तळाशी कॉर्पोरेट एसएएन आणि त्यातील प्रत्येक गोष्टीत सर्वत्र बसलेला डेटा मिळाला आहे, म्हणून हे स्टोरेज एरिया नेटवर्क फायली आणि डेटाने परिपूर्ण आहे परंतु ते कोठे शोधावे हे कोणाला माहित नाही.

बर्‍याच वेळा नाही, आम्ही हे बंद डेटा प्लॅटफॉर्म किंवा बंद सिस्टम तयार केले आहेत आणि म्हणून लोक त्या ठिकाणची माहिती देण्यासाठी स्प्रेडशीट आणि पॉवरपॉइंट्सच्या आवडीकडे परत गेले आहेत. परंतु अलीकडेच माझ्या मनात एक मनोरंजक गोष्ट घडली आणि ती म्हणजे मोबाइल डिव्हाइस आणि इंटरनेट सामान्यतः कार्य करते ज्यायोगे गोष्टी प्रत्यक्षात अधिक चांगल्या होऊ शकतात या कल्पनेनुसार. आणि प्रामुख्याने ग्राहकांच्या जागेत. आणि ही एक रोचक गोष्ट आहे की आपल्याकडे दररोजच्या जीवनात इंटरनेट बँकिंगसारख्या गोष्टी दिसू लागल्या आहेत. त्यांच्याशी संवाद साधण्यासाठी आम्हाला प्रत्यक्ष बँकेत जाण्याची गरज नव्हती, आम्ही फोनद्वारे हे करू शकू. मुळात ते गुंतागुंतीचे होते पण नंतर इंटरनेट जवळ आले आणि आमच्याकडे एक वेबसाइट होती. आपल्याला माहिती आहे आणि अलीकडे आपण आपल्या बँकेत किती वेळा वास्तव्य केले आहे? दुसर्‍या दिवशी मी याबद्दल संभाषण केले आणि मला माझ्या बँकेत गेल्या वेळी आठवत नाही, ज्यामुळे मला खूप धक्का बसला, मला वाटले की हे आठवणे मला सक्षम असले पाहिजे, परंतु ते खूप लांब होते पूर्वी मी तिथे गेल्यावर मला आठवत नाही. आणि म्हणून आता आपल्याकडे ही गॅझेट मोबाईल आणि फोन, टॅब्लेट आणि लॅपटॉपच्या रूपात आहेत, आम्हाला नेटवर्क आणि साधने आणि सिस्टीममध्ये प्रवेश मिळाला आहे आणि ग्राहकांच्या जागी आम्ही शिकलो आहोत की गोष्टी अधिक चांगल्या होऊ शकतात. एंटरप्राइझ आणि वातावरणात अधिक सुस्त आणि हिमनगर बदलणार्‍या ग्राहकांच्या जागेत होणारा वेगवान बदल, आम्ही हा बदल दिवसा-दररोज कार्यरत जीवनात घेतलेला नाही.

आणि आपण हार्डकोपीवर थेट डेटा प्रवाह करू शकत नाही या वस्तुस्थितीवर मला गंमत आवडली. या प्रतिमेत येथे एक व्यक्ती काही विश्लेषणे पाहत बसली आहे जी सादर केली गेली आहे, आणि एक सुंदर आलेख आहे जो एखाद्याने तयार केला आहे ज्याला कदाचित सांख्यिकी किंवा एखादे कार्यगृह म्हणून खूप पैसे दिले जात आहेत आणि ते तिथे बसून बसण्याचा प्रयत्न करीत आहेत हार्डकॉपीवर विश्लेषणे आणि त्याकडे लक्ष वेधून घेणे. परंतु येथे माझ्यासाठी सर्वात भयानक गोष्ट आहेः उदाहरणार्थ, या मीटिंग रूममधील हे लोक आणि मी हे उदाहरण म्हणून वापरेन, ते आता ऐतिहासिक असलेल्या डेटाशी संवाद साधत आहेत. आणि जेव्हा ती वस्तू तयार केली गेली आणि त्यानंतर एड केले तेव्हापासून ते इतके जुन्या आहे, म्हणून कदाचित हा एक आठवडा जुना अहवाल असेल. आता ते इतका वाईट डेटा नाही परंतु जुन्या डेटावर निर्णय घेत आहेत, जे कायमच खराब डेटा असू शकतात. ते आज ऐतिहासिक गोष्टींच्या आधारे निर्णय घेत आहेत, जे खरोखरच एक वाईट स्थान आहे. आम्ही ते हार्डकॉपी टॅब्लेट आणि फोनच्या आवडीसह पुनर्स्थित करण्यास व्यवस्थापित केले कारण आम्ही ग्राहकांच्या जागेत खूप जलद काम केले आणि आता आम्ही एंटरप्राइझच्या जागी कार्य केले आहे, ही वास्तविक वेळ अंतर्दृष्टी आहे वास्तविक वेळ मूल्य.

आणि आम्ही त्यात चांगले आणि चांगले होत आहोत. आणि हे मला रॉबिनने पूर्वी उभा केले त्या टप्प्यावर आणते, हीच नागरिक डेटा वैज्ञानिकांची संकल्पना आणि या संकल्पनेची चालना होती. माझ्या दृष्टीने, एक नागरिक डेटा वैज्ञानिक फक्त एक नियमित लोक आहेत ज्यात योग्य साधने आणि लोकांच्या आवडीची माहिती असते. त्यांना गणित करण्याची गरज नाही, त्यांना अल्गोरिदम माहित नाहीत, त्यांना अल्गोरिदम आणि नियम डेटा कसा वापरावा हे माहित नाही, त्यांना इंटरफेस कसे वापरावे हे माहित असणे आवश्यक आहे. आणि हे मला माझ्या परिचयात आणि तिथे एका मुलाची संकल्पना व आयपॅड विरूद्ध मॅगझिन विरूद्ध आयपॅड बसवून आयपॅड बसवून घेऊन आला. एखादा गेम, स्ट्रीमिंग मीडिया किंवा व्हिडिओ असला तरीही, मुलास माहितीमध्ये डुंबण्यासाठी आणि त्याच्याशी संवाद साधण्यासाठी एखाद्या आयपॅडचा इंटरफेस कसा वापरायचा हे सहजतेने शिकू शकते. परंतु मॅगझिन बारमधून आणि पृष्ठानंतर फक्त फ्लॅशिंग पृष्ठाद्वारे समान प्रतिसाद किंवा परस्परसंवाद त्यांना मिळू शकला नाही, जे फारसे आकर्षक नाही, विशेषत: जर आपण आयपॅडसह वाढलेले लहान मूल असल्यास. साधने आणि गोष्टी कशा चालविता येव्यात हे आम्ही द्रुतगतीने पाहतो आणि शिकू शकतो आणि आम्ही त्यांना मोबाइल डिव्हाइस आणि विशेषत: मोठ्या प्रमाणात स्क्रीन असलेले टॅब्लेट आणि स्मार्टफोन सारखे इंटरफेस प्रदान केले असल्यास आणि आपण संवाद साधू शकता तर त्यांच्या संपर्कात, बोटाच्या हालचालींसह, अचानक आपणास नागरिक डेटा वैज्ञानिक याची ही कल्पना येते.

एखादी व्यक्ती जो योग्य साधनांसह डेटा विज्ञान लागू करू शकते परंतु प्रत्यक्षात ते कसे करावे हे जाणून घेतल्याशिवाय. आणि माझ्या मनामध्ये हे बरेच काही आहे, जसे मी म्हणालो होतो की ते ग्राहकांच्या प्रभावामुळे चालत आले आणि ते मागणी व उद्योगात बदलले. खरोखर त्वरित उदाहरणे दोन. आम्ही, बर्‍याचजण आमच्या ब्लॉग्स आणि वेबसाइट्ससह गोष्टी करण्यास सुरवात करतो जसे की लहान जाहिराती दिल्या जातात किंवा ट्रॅकिंग आणि हालचाली पाहणे, आम्ही Google ticsनालिटिक्स सारख्या साधनांचा वापर करतो आणि आम्ही आमच्या ब्लॉगवर आणि छोट्या वेबसाइटवर जागृत होतो आम्ही तिथे कोडचे थोडेसे बिट्स ठेवू शकलो आणि कोण वेबसाइटला कधी भेट देत आहे, केव्हा आणि कुठे आणि कसे याविषयी Google आम्हाला रीअल-टाइम अंतर्दृष्टी देईल. आणि रिअल टाइममध्ये आम्ही लोकांना वेबसाइटवर दिसणारी वास्तविकते पाहिली, पृष्ठांमधून जा आणि नंतर नाहीसे होऊ शकले. आणि हे आश्चर्यकारक होते. मला अजूनही असे करणे आवडते, जेव्हा मी लोकांना गूगल अ‍ॅनालिटिक्स प्लगइन असलेली वेबसाइट दर्शविण्यासाठी फक्त तेच खाली घालवितो आणि वेबसाइटना मारणार्‍या लोकांशी थेट संवाद साधतो आणि त्यांना विचारतो, “कल्पना करा की नाही रिअल टाइममध्ये आपल्या व्यवसायात अशा प्रकारचे अंतर्दृष्टी आपल्याकडे आहेत. "

किरकोळ उदाहरण घ्या आणि कदाचित एक फार्मास्युटिकल, मला असे वाटते की आपण याला अमेरिकेत एक ड्रग स्टोअर म्हटले आहे, एक फार्मसी जेथे आपण चालत आहात आणि डोकेदुखीच्या गोळ्यापासून सन क्रीम आणि हॅट्स पर्यंत सर्व काही विकत घेत आहात. रीअल-टाइम माहितीशिवाय ती संस्था चालवण्याचा प्रयत्न करणे ही एक भयानक संकल्पना आहे आता आम्हाला जे माहित आहे ते माहित आहे. उदाहरणार्थ, आपण फूट रहदारीचे मोजमाप करू शकता, आपण स्क्रीनच्या एका बाजूला हसर्‍या चेहर्‍यासह स्टोअरच्या आसपास साधने ठेवू शकता कारण आपण आनंदी आहात, आणि उजवीकडे एक दु: खी लाल आणि मध्यभागी काही भिन्न छटा दाखवा. आणि आजकाल "हॅपी किंवा नॉट" नावाचे एक व्यासपीठ आहे, जिथे आपण दुकानात जाल आणि आपल्या थेट ग्राहकांच्या प्रतिसादावर अवलंबून आपण आनंदी चेहरा किंवा दु: खी चेहरा बँग करू शकता. आणि हे वास्तविक वेळेसह परस्परसंवादी असू शकते. आपण थेट मागणी-आधारित किंमत मिळवू शकता. जर तेथे बरेच लोक असतील तर आपण किंमती थोडी वाढवू शकाल, आणि आपण स्टॉकची उपलब्धता करू शकता आणि लोकांना सांगू शकता, उदाहरणार्थ - एअरलाइन्स वेबसाइटवर आता किती जागा उपलब्ध आहेत हे लोकांना सांगेल. फ्लाइट बुक करत असताना, आपण फक्त यादृच्छिकपणे डायल करू नका आणि आशा आहे की आपण अप करता आणि उड्डाण करू शकता. थेट एचआर डेटा, लोक सांगतात आणि केव्हा बंद होतात ते आपण सांगू शकता. खरेदी, आपण खरेदी करत असल्यास आणि आपल्याकडे थेट डेटा असल्यास, आपण आपला पुढील स्टॉक खरेदी करण्यासाठी अमेरिकन डॉलरच्या किंमतीविरूद्ध एका तासाची प्रतीक्षा करणे आणि हेलकावेचा ट्रक लोड करणे यासारख्या गोष्टी करू शकता.

जेव्हा मी लोकांना Google ticsनालिटिक्स दर्शवितो आणि मी अशा प्रकारचे किस्सा दाखवतो, तेव्हा हा युरेका मुहूर्त, हा “ए-हा!” क्षण, हा प्रकाश त्यांच्या मनासारखा निघून जातो, “हं, मला असे अनेक ठिकाणी दिसू शकतात जेथे मी हे करू शकत होतो. . फक्त माझ्याकडे साधने असती आणि फक्त जर मला त्या ज्ञानाचा प्रवेश असेल तर. ”आणि आम्ही हे आता सोशल मीडियामध्ये पहात आहोत. जाणकार सोशल मीडिया वापरकर्त्यांपैकी कोणीही फक्त त्यांच्या न्याहारीची छायाचित्रे दाखविण्याशिवाय, त्यांना किती पसंती मिळतात आणि किती रहदारी मिळते आणि किती मित्र मिळतात हे पाहण्याकडे झुकत आहे आणि ते त्यासह करतात toolनालिटिक्स साधन म्हणून आवडते, म्हणा. आपण टूल वापरण्यासाठी. कॉम वर जाऊ शकता, परंतु आपण Google ticsनालिटिक्स डॉट कॉममध्ये टाइप करा किंवा वरच्या उजव्या बटणावर क्लिक करा आणि मेनू खाली खेचून घ्या, आपल्याला किती सुंदर ट्वीट्स सांगणारे हे सुंदर, लाइव्ह आलेख मिळतील. आपण स्वतः करत आहात आणि त्यांच्याशी किती परस्परसंवाद आहेत. आणि फक्त आपल्या वैयक्तिक सोशल मीडियावर रिअल-टाइम विश्लेषणे. आमच्याकडे गूगल ticsनालिटिक्स आणि लिंक्डइन आणि, ईबे आकडेवारी आपल्याकडे येत असल्यास, परंतु आपल्या कार्य वातावरणात असल्यास आपल्या आवडी असल्यास कल्पना करा.

आता आमच्या बोटांच्या टोकावर आम्हाला थेट वेब आणि मोबाइलचा प्रकार मिळाला आहे, ही एक पॉवर संकल्पना बनली आहे. आणि म्हणूनच मला माझ्या निष्कर्षापर्यंत आकर्षित केले आणि मला असे आढळले आहे की साधने व तंत्रज्ञानाचा लवकर फायदा घेणा organizations्या संघटनांनी त्यांच्या प्रतिस्पर्ध्यांचा इतका महत्त्वपूर्ण फायदा मिळविला की कदाचित प्रतिस्पर्धी कधीच पकडणार नाहीत. आणि आम्ही हे पाहत आहोत की आता नागरिक डेटा वैज्ञानिकांच्या विरोधाभासासह. जर आम्ही लोकांना कौशल्यांबरोबर, ज्या कामासाठी आम्ही त्यांना कामावर घेतले आहोत ते घेऊ शकतो आणि आम्ही त्यांना योग्य साधने देऊ शकतो, विशेषत: वास्तविक-वेळ डेटा पाहण्याची आणि डेटा शोधण्याची क्षमता आणि क्यूबिकल्सभोवती फिरण्याशिवाय कोठे आहे हे जाणून घेण्याची क्षमता आणि लोकांसह काही तुलनात्मक विश्लेषण करण्यासाठी जाण्यासाठी आणि वॉटर कूलरवर उभे रहाणे किंवा निर्देशांक कोठे आहे याचा रिसेप्शन विचारण्यासाठी मोठ्याने प्रश्न विचारा. जर ते ते त्यांच्या बोटांच्या टोकावर करू शकतील आणि ते त्यांच्याबरोबर त्यांच्या सभांमध्ये घेतील आणि हार्डकोपीऐवजी रिअल टाइममध्ये पडद्यावर बसणार्‍या एका बोर्डरूममध्ये बसू शकतील, तर अचानक ज्या कर्मचार्‍यांना वास्तविक नसण्याची गरज आहे अशा सर्व प्रकारच्या कर्मचार्‍यांना आम्ही अचानक अधिकार दिला आहे. डेटा वैज्ञानिक, परंतु प्रत्यक्षात डेटा विज्ञान वापरण्यासाठी आणि संस्थांसाठी आश्चर्यकारक परिणाम चालविण्यासाठी. आणि मला वाटतं की आम्ही आतापर्यंत पोहोचलेला हा टिपिंग पॉईंट जिथे ग्राहक एंटरप्राइझमध्ये जाईल तेथे हे आव्हान आहे की आम्ही ते एंटरप्राइझ कसे प्रदान करू आणि आजच्या चर्चेचा माझा असा अंदाज आहे. आणि त्यासह, मी माझा तुकडा गुंडाळणार आहे आणि आम्ही ते कसे सोडवू शकेन हे ऐकण्यासाठी देईन. डेव्हिड, तुझ्यावर अवलंबून आहे.

डेव्हिड स्वीनरः ठीक आहे, छान धन्यवाद, अगं, आणि धन्यवाद रॉबिन. तुला माहिती आहे, रॉबिन, मी तुझ्या मूळ मूल्यांकनाशी सहमत आहे. विश्लेषणात्मक प्रक्रिया, सॉफ्टवेअर डेव्हलपमेंटपेक्षा ती खरोखर वेगळी नाही. मला असे वाटते की एखाद्या संस्थेमधील आव्हान खरोखरच होते, आपल्याला माहिती आहे, कदाचित गोष्टी चांगल्या परिभाषित केल्या जात नाहीत, कदाचित त्यामध्ये एखादा शोध घटक आणि त्यामध्ये एक सर्जनशील घटक असेल. आणि डेज, तुम्हाला माहिती आहे, मी तुमच्याशी सहमत आहे, चाक पुन्हा नव्याने बनवित आहे, आणि तुम्हाला माहिती आहे, आज मी ज्या संघटनेत जात आहे तेथे नाही, तुम्ही विचारता, हे असे का करीत आहात? व्यवसाय अशा प्रकारे का चालतो? आणि हे प्रश्न करणे सोपे आहे आणि बर्‍याच वेळा आपण एखाद्या संस्थेमध्ये असता तेव्हा ते बदलणे अवघड असते. मला उपमा आवडतात, गोष्टींचा उपभोग होतो. आणि म्हणून आता मी विमानतळावर जाताना आणि माझी जागा बदलू इच्छित नाही - मी हे सेलफोनवर करतो. मला बूथवर एजंटकडे जाण्याची गरज नाही आणि त्या एजंटला मोट्रोक्रोम मॉनिटरवर माझे आसन असाइनमेंट बदलण्यासाठी 15 मिनिटांसाठी काहीतरी टाइप केलेले पहा. मी फक्त माझ्या फोनवर हे करणे पसंत करतो आणि म्हणूनच हा एक मनोरंजक विकास आहे.

आज आपण सामूहिक बुद्धिमत्तेबद्दल थोडेसे बोलणार आहोत. ज्यांना माहिती नाही त्यांच्यासाठी, स्टॅटिस्टीका हे अग्रगण्य विश्लेषक प्लॅटफॉर्म आहे, हे सुमारे 30 वर्षांपासून आहे. विश्लेषक उद्योगातील काही प्रकाशने आपण पाहिली तर ती सर्वात अंतर्ज्ञानी आणि वापरण्यास सुलभ प्रगत softwareनालिटिक्स सॉफ्टवेअर पॅकेज म्हणून सर्वात वर येते. म्हणून आम्ही मागील काही वर्षे एकत्रितपणे बुद्धिमत्ता म्हणून ओळखल्या जाणार्‍या संकल्पनेवर काम केले आणि आम्ही ते पुढच्या स्तरावर घेत आहोत. मला हे संभाषण यासह प्रारंभ करायचे होते: आपल्या संस्थेमध्ये कार्य कसे होते?

आणि येथे दोन प्रतिमा आहेत. डावीकडील एक 1960 ची प्रतिमा आहे आणि मी 1960 च्या दशकात माझी कारकीर्द सुरू केली नाही, परंतु उजवीकडील प्रतिमा ही आहे - ही मी सेमीकंडक्टर कारखाना आहे जिथे मी काम करणे सुरू केले. आणि मी त्या काळ्या इमारतीत, वरच्या डाव्या बाजूला काळ्या छतावर काम केले. परंतु त्यांनी सेमीकंडक्टर सामग्री बनविली. हे गूगल इमेज मधील अलीकडील चित्र आहे. परंतु जेव्हा आपण डावीकडील 1960 च्या दशकाच्या प्रतिमेकडे परत जाता तेव्हा ते खूप मनोरंजक असते. आपल्याकडे हे लोक एका रांगेत बसले आहेत आणि ते तयार करीत आहेत, आपल्याला माहिती आहे, समाकलित सर्किट्स आणि अर्धसंवाहक. परंतु तेथे मानकीकरण आहे, गोष्टी करण्याचा एक मानक मार्ग आहे आणि तेथे एक परिभाषित प्रक्रिया देखील आहे. आपणास माहित आहे की कदाचित हे लोक सर्वच मुक्त वातावरणात बसले आहेत म्हणून कदाचित काही सहयोग असेल. मला असे वाटते की आम्ही ज्ञान वर्कफोर्समध्ये थोडेसे गमावले.

जेव्हा मी त्या इमारतीमध्ये वरच्या डाव्या बाजुला बसलो होतो, मला कोणाबरोबर सहयोग करायचे असेल तर ते उघडलेले नव्हते. ही कार्यालये होती, कदाचित पथकातील काही लोक दूरचे होते किंवा कदाचित मला या कॅम्पसमधून जावे लागेल; ती 25 मिनिटांची चाल होती आणि मला अगदी उजवीकडे इमारतीतल्या कोणाशी तरी बोलले पाहिजे. मला वाटतं आपण वाटेवर काहीतरी गमावले. आणि म्हणूनच, तुम्हाला माहिती आहे, मला असाच विचार आला होता, लोक का करतात - किती लोक आपल्या संस्थेमध्ये चाक पुन्हा चालू ठेवत आहेत? मला वाटते, तुम्हाला माहिती आहे, संपूर्णपणे संघटनांनी १ 1990 1990 ० आणि २००० च्या दशकात सीआरएम आणि डेटा वेअरहाउसिंगद्वारे चांगले काम केले आणि काही प्रमाणात बीआय. काही कारणास्तव, विश्लेषणे थोडीशी मागे पडली आहेत. डेटा वेअरहाउसिंग, आणि प्रमाणित करणे आणि आपला डेटा सामान्य करण्यात आणि या सर्व गोष्टींमध्ये आणि सीआरएममध्ये लक्षणीय गुंतवणूक झाली आहे, परंतु विश्लेषक काही कारणास्तव मागे पडले आहेत. आणि मी आश्चर्यचकित आहे की असे का. कदाचित तेथे एक सर्जनशील असेल - कदाचित आपली प्रक्रिया योग्य प्रकारे परिभाषित केलेली नसेल, कदाचित आपल्या व्यवसायात गोष्टी बदलण्यासाठी आपण काय निर्णय घेत आहात किंवा लीव्हर बदलत आहात हे आपल्याला माहित नाही. जेव्हा आपण आज संस्थांमध्ये जातो तेव्हा बरेच लोक स्प्रेडशीटमध्ये व्यक्तिचलितपणे गोष्टी करत असतात.

आणि आपणास माहित आहे की मी आज सकाळी एका स्टॅटकडे पाहिले, मला असे वाटते की असे म्हटले आहे की 80, 90 टक्के स्प्रेडशीटमध्ये त्रुटी आहेत आणि त्यापैकी काही फार लक्षणीय असू शकतात. व्हेल मधील एका प्रमाणे, जेथे स्प्रेडशीटच्या त्रुटींमुळे जेपी मॉर्गन चेस अब्जावधी आणि अब्जावधी डॉलर्स गमावत आहे. म्हणून माझ्या मते माझ्याकडे आहे, गोष्टी करण्यासाठी आणखी एक चांगला मार्ग असावा. आणि आम्ही सांगितल्याप्रमाणे आमच्याकडे हे डेटा वैज्ञानिक आहेत. हे लोक महागडे आहेत आणि त्यांना शोधणे कठीण आहे. आणि कधीकधी ते एक विचित्र बदके असतात. पण मला वाटतं, तुम्हाला माहिती आहे, जर मी डेटा वैज्ञानिक काय आहे याचा सारांश लावला असता, कदाचित हा एखादा असा आहे जो डेटा समजतो. मला वाटते की हे गणित समजणारा कोणीतरी आहे, ज्याला समस्या समजली आहे. आणि खरोखर, कोणीतरी जे परीणामांविषयी बोलू शकतात. आणि जर आपण एखादा डेटा वैज्ञानिक आहात तर तुम्ही सध्या आत्ता खूप भाग्यवान आहात, कारण गेल्या काही वर्षांत तुमचा पगार कदाचित दुप्पट झाला आहे.

पण खरं सांगायला पाहिजे, बर्‍याच संस्था, त्यांच्याकडे हे डेटा वैज्ञानिक नाहीत, पण तुमच्या संस्थेत स्मार्ट लोक आहेत. आपल्याकडे एक संस्था आहे, आपल्याकडे बरेच स्मार्ट लोक आहेत आणि ते स्प्रेडशीट वापरतात. तुम्हाला माहिती आहे, आकडेवारी आणि गणित ही त्यांची प्राथमिक नोकरी नाही, परंतु व्यवसाय पुढे नेण्यासाठी ते डेटाचा वापर करतात. खरोखर, आम्ही आव्हान देत आहोत की आपण कसे आहात, आपण एखादे डेटा शास्त्रज्ञ किंवा सांख्यिकीशास्त्रज्ञ किंवा दोन किंवा दोन मिळविण्यास भाग्यवान असाल तर आपण ते कसे घेऊ शकता आणि त्या लोकांमध्ये आणि आपल्यात असलेले सहयोग कसे सुधारू शकता? आपल्या संस्थेतील इतर व्यक्ती? आमची संघटना कशी संरचित केली गेली या प्रकारावर जर आपण एक नजर टाकली तर मी सुरूवात करीत आहे, आणि मी उजवीकडून डावीकडे जात आहे. आणि मला माहित आहे की ही मागे आहे, परंतु आमच्याकडे व्यवसाय वापरकर्त्यांची ही ओळ आहे.

हे आपल्या ज्ञान कामगार लोकसंख्येपैकी एक आहे आणि या लोकांना आपणास आपल्या व्यवसाय अनुप्रयोगांच्या ओळीत विश्लेषणे एम्बेड करण्याची आवश्यकता आहे. कदाचित त्यांना कॉल सेंटर स्क्रीनवर किंवा कशावर तरी विश्लेषक उत्पादन दिसले असेल आणि ते ग्राहकाला देण्याची पुढील सर्वोत्तम ऑफर सांगत आहेत. कदाचित हा वेब पोर्टलवरील ग्राहक किंवा पुरवठादार असेल आणि तो त्वरित त्यांना क्रेडिट देते किंवा त्यासारख्या गोष्टी. परंतु कल्पना अशी आहे की ते विश्लेषक वापर करीत आहेत. जर आपण मध्यभागी गेलो तर हे हे ज्ञान कर्मचारी आहेत. हे असे लोक आहेत जे आज स्प्रेडशीटसह गोष्टी करीत आहेत, परंतु स्प्रेडशीट त्रुटी-प्रवण आहेत आणि काही वेळा ते गॅस संपवितात. हे नागरिक डेटा वैज्ञानिक, जसे आम्ही त्यांना कॉल करतो, आपल्याला माहिती आहे की आम्ही त्यांच्यासाठी काय करीत आहोत ते म्हणजे ऑटोमेशनची पातळी वाढवते.

आणि आपण tics० ते percent ० टक्के काम डेटा प्रेप पीसमध्ये असून विश्लेषणाने हे ऐकले आहे, आणि हे वास्तविक गणित नाही, परंतु ते डेटा प्रेप आहे. आम्ही ते स्वयंचलित करण्याचा प्रयत्न करीत आहोत, आपण ते करीत असलात तरी आणि आमच्याकडे विझार्ड्स आणि टेम्पलेट्स आणि पुन्हा वापरल्या जाणार्‍या गोष्टी आहेत आणि आपल्याला आपल्या वातावरणातील मूलभूत पायाभूत सुविधांचे खरोखर ज्ञान असणे आवश्यक नाही. आणि मग जर आपण डावीकडे पाहिले तर आपल्याकडे हे डेटा वैज्ञानिक आहेत. आणि मी सांगितल्याप्रमाणे, त्यांना कमी पुरवठा आहे. आणि आम्ही त्यांना अधिक उत्पादक बनविण्यासाठी जे काही करण्याचा प्रयत्न करीत आहोत ते म्हणजे या नागरिक डेटा वैज्ञानिकांनी करू शकतात अशा गोष्टी तयार करण्याची त्यांना परवानगी आहे. याचा लेगो ब्लॉकप्रमाणे विचार करा, म्हणून हे डेटा वैज्ञानिक नागरिक डेटा वैज्ञानिक वापरू शकतील अशी पुन्हा वापरण्यायोग्य मालमत्ता तयार करु शकतात. एकदा ते तयार करा म्हणजे आम्हाला चाक पुन्हा चालू ठेवण्याची गरज नाही.

आणि नंतर देखील, या लोकांना काळजी वाटू शकते की आम्ही डेटाबेसमध्ये काही करू शकतो किंवा नाही आणि आपल्या कंपनीने विद्यमान तंत्रज्ञान गुंतवणूकीचा फायदा घेऊ शकता. आपणास माहित आहे की, जगभरातील डेटा आणि त्यामध्ये बदल करणे या दिवसाचे आणि वयात अर्थ नाही. म्हणून जसे मी नमूद केले त्याप्रमाणे आम्ही स्टॅटिस्टीकाकडे पाहिले तर हे एक व्यासपीठ आहे जे बर्‍याच दिवसांपासून आहे. आणि हे एक अतिशय नाविन्यपूर्ण उत्पादन आहे. डेटा मिश्रित करणे, तेथे एखादा डेटा स्रोत नव्हता ज्यामध्ये आपण प्रवेश करू शकत नाही. आमच्याकडे आपल्याकडे असलेल्या सर्व डेटा शोध आणि व्हिज्युअलायझेशन गोष्टी आहेत; आम्ही हे रिअल टाइममध्ये करू शकतो. आणि कदाचित हे आहे - मला वाटते की सॉफ्टवेअर टूलमध्ये १ 16,००० पेक्षा जास्त विश्लेषणात्मक कार्ये आहेत, जेणेकरून मी कधीही वापरण्यापेक्षा किंवा समजण्यापेक्षा हे अधिक गणिताचे असू शकते, परंतु आपल्याला याची आवश्यकता असल्यास तिथे आहे.

आमच्याकडे खरोखर एखादा व्यवसाय निर्णय घेण्यासाठी व्यवसाय नियम आणि विश्लेषक कार्यप्रवाह दोन्ही एकत्र करण्याची क्षमता आहे. आपण न्याय्य पलीकडे जात आहात, येथे एक अल्गोरिदम आहे, येथे एक कार्यप्रवाह आहे, परंतु आपल्याकडे व्यवसाय नियम आहेत जे आपल्याला नेहमीच सामोरे जावे लागतात. आम्ही कारभारामध्ये खूपच सुरक्षित आहोत. एफडीए आमच्यावर विश्वास ठेवते म्हणून आम्ही बरीच फार्मास्युटिकल ग्राहकांमध्ये वापरली जाते. आपणास माहित आहे की सांजा येथे फक्त पुरावा आहे की आमच्याकडे त्यांच्याद्वारे स्वीकारले जाण्याची नियंत्रणे आणि ऑडिट क्षमता आहे. आणि शेवटी, आपणास माहित आहे की आम्ही मुक्त आणि लवचिक आणि विस्तारणीय आहोत, म्हणून आपल्याला एक व्यासपीठ तयार करण्याची आवश्यकता आहे ती म्हणजे आपला डेटा शास्त्रज्ञ उत्पादक व्हावा अशी आपली इच्छा आहे, आपल्या नागरिक डेटा वैज्ञानिकांनी उत्पादक व्हावे अशी आपली इच्छा आहे, आपण सक्षम होऊ इच्छित आहात हे विश्लेषणात्मक आउटपुट आपल्या संस्थेतील कामगारांकरिता तैनात करण्यासाठी.

जर आपण यावर एक नजर टाकली तर येथे काही व्हिज्युअलायझेशनचे उदाहरण आहे. परंतु आपले विश्लेषणात्मक आउटपुट व्यवसाय-वापरकर्त्यांकडे वितरित करण्यात सक्षम आहे, म्हणून डावीकडील पहिले उदाहरण म्हणजे ते नेटवर्क ticनालिटिक्स डायग्राम. आणि कदाचित आपण फसवणूक करणारे अन्वेषक आहात आणि ही जोडणी कशी केली जातात हे आपल्याला माहिती नाही आणि हे लोक असू शकतात, ही संस्था असू शकतात, हे करार असू शकतात, खरोखर काहीही. परंतु आपण हे आपल्या माऊसने हाताळू शकता आणि खरोखरच समजून घेण्यासाठी त्याच्याशी संवाद साधू शकता - आपण कोणास फसवणूकीचा शोध घेत असाल तर कोणाकडे चौकशी करावी याची प्राथमिकता समजून घ्यावी, कारण आपण प्रत्येकाशी बोलू शकत नाही, म्हणून आपल्याकडे आहे प्राधान्य देणे.

एखाद्या भविष्यवाणीच्या देखभाल डॅशबोर्डसाठी आम्ही उजवीकडील प्रतिमा पाहिल्यास ही खरोखर एक मनोरंजक समस्या आहे. कदाचित आपण विमानतळाचे मालक असाल आणि तेथे आपल्याकडे हे बॉडी स्कॅनर आहेत. हे बॉडी स्कॅनर, जर तुम्ही विमानतळावर गेला तर तिथे काही घटक आहेत ज्यात जवळपास नऊ महिन्यांच्या शेल्फ लाइफ आहे. आणि या गोष्टी खरोखरच, खरोखर महागड्या आहेत. माझ्याकडे अनेक एन्ट्री पॉईंट्स, माझ्या विमानतळावरील अनेक स्कॅनर, प्रथम क्रमांकावरील प्रत्येक प्रवेशद्वारावर मी योग्य रीतीने स्टाफ आहे आणि स्कॅनरमध्ये असलेल्या भागासाठी मला ते देखील ऑर्डर करायचे नाहीत, याची खात्री करायची आहे. लवकर, आणि ते ब्रेक होण्यापूर्वी मला त्यांच्याकडे घ्यायचे आहे. आमच्याकडे क्षमता आहे, कदाचित आपल्याकडे विमानतळ असल्यास, या गोष्टी कधी मोडतील आणि कर्मचार्‍यांच्या पातळीचा अंदाज लावतील हे सांगण्यास सक्षम असेल.

जर आपण खालच्या उजवीकडे पाहिले तर हे आपण उत्पादन वातावरणात असाल तर हे केवळ उत्पादन प्रवाहाचे ग्राफिकल प्रतिनिधित्व आहे. आणि हे पाहणे थोडे कठिण आहे, परंतु या प्रक्रियेच्या वेगवेगळ्या क्षेत्रांवर लाल आणि हिरव्या रहदारी दिवे आहेत आणि म्हणून मी अभियंता आहे तर तिथे अतिशय अत्याधुनिक गणित येत आहे, परंतु मी त्या विशिष्ट प्रक्रियेच्या क्षेत्रात अभ्यास करू शकतो आणि पाहू शकतो. पॅरामीटर्स आणि इनपुट जे कदाचित नियंत्रणाबाहेर गेले. जर आपण आमच्या नागरिक डेटा वैज्ञानिकांकडे पाहिले तर आपले ध्येय खरोखरच नागरिक डेटा वैज्ञानिकांना सुलभ करणे आहे. आमच्याकडे विझार्ड्स आणि टेम्पलेट्स आहेत आणि मला वाटणारी एक गोष्ट खरोखर मनोरंजक आहे, आमच्याकडे हे स्वयंचलित डेटा हेल्थ चेक नोड आहे? आणि खरोखर हे काय करते, त्यात अंतर्निहित स्मार्ट आहेत.

मी डेटा प्रीपचा उल्लेख केला - डेटा एकत्रीकरण आणि तयार करणे यामध्ये बराच वेळ लागतो. पण समजा माझ्याकडे माझ्याकडे डेटा आहे, मी हे डेटा हेल्थ चेक नोडद्वारे चालवू शकतो, आणि हे अतिक्रमण, विरळपणा आणि बाह्यकर्माची तपासणी करते आणि या सर्व गोष्टी, ते हरवलेल्या मूल्यांमध्ये भरतात आणि हे बरेच काही गणित करते मला समजत नाही, म्हणून मी एकतर डीफॉल्ट स्वीकारू शकतो, किंवा मी जरा जास्त हुशार असल्यास, मी त्यांना बदलू शकतो. पण मुद्दा असा आहे की आम्हाला ती प्रक्रिया स्वयंचलित करायची आहे. ही गोष्ट साफ केलेल्या डेटा सेटवर सुमारे 15 भिन्न तपासणी आणि निकाल देते. आम्ही हे करीत आहोत जे लोकांसाठी हे वर्कफ्लो तयार करणे सुलभ करतात.

येथे आपण डेटा वैज्ञानिक आणि नागरिक डेटा वैज्ञानिक यांच्यातील सहकार्याबद्दल बोलत आहोत. जर आम्ही या प्रतिमा उजवीकडे पाहिल्या तर आम्हाला हा डेटा प्रीप वर्कफ्लो दिसतो. आणि कदाचित हा अतिशय परिष्कृत असेल, कदाचित हा आपल्या कंपनीचा गुप्त सॉस आहे, मला माहित नाही, परंतु आम्हाला माहित आहे की आपल्या संस्थेमधील कोणीतरी आमच्याकडे असलेल्या या डेटा सिलोमध्ये एक किंवा अधिक प्रवेश करू शकतो. आम्हाला प्रथम क्रमांकावर, त्यांना पकडण्यासाठी आणि एकत्र जोडण्यासाठी आणि दुसर्‍या क्रमांकावर जाण्याची गरज आहे. कदाचित आमच्याकडे अशी काही प्रक्रिया आहे जी ती आमच्या डेटा आरोग्य तपासणीच्या पलीकडे आहे आणि ती आपल्या कंपनीचा गुप्त सॉस आहे. मी हा कार्यप्रवाह आमच्या संस्थेमध्ये तयार करू शकतो आणि हे नोड म्हणून कोसळते. बाण खाली दिशेला जाताना तुम्ही पाहत आहात, ते फक्त एक नोड आहे आणि आपल्याकडे या संघटनांमध्ये शंभर वस्तू असू शकतात. अशी कल्पना आहे की आपल्याकडे असे लोक आहेत ज्यांना एका विशिष्ट जागेबद्दल काहीतरी माहिती आहे, ते कार्यप्रवाह तयार करू शकतात आणि दुसरा कोणीतरी त्याचा पुनर्वापर करू शकतो. आम्ही चाकांचे नवीन शोध कमी करण्याचा प्रयत्न करीत आहोत.

आणि विश्लेषक मॉडेलिंग वर्कफ्लोसह आपण हेच करू शकतो. या प्रकरणात उजवीकडे, हा कार्यप्रवाह, कदाचित तेथे 15 भिन्न अल्गोरिदम असतील आणि मला या कार्यासाठी सर्वोत्कृष्ट निवडायचे आहे. आणि त्या कोळीच्या वेब गोंधळात काय घडत आहे ते नागरिक डेटा वैज्ञानिक म्हणून मला समजून घेण्याची गरज नाही, परंतु ते फक्त एका नोडमध्ये कोसळते आणि कदाचित ते नोड फक्त म्हणते, “क्रेडिट जोखिम स्कोर मोजा.” “संधीची गणना करा. सर्जिकल साइटच्या संसर्गाचे, ”आपल्याकडे काय आहे. “एखादी वस्तू फसव्या व्यवहाराची शक्यता आहे याची गणना करा.” नागरिक डेटा वैज्ञानिक म्हणून मी हे अत्यंत अत्याधुनिक गणित दुसर्‍याने तयार केले आहे, कदाचित या शास्त्रज्ञांनी माझ्या संस्थेमध्ये तयार केले असेल.

डेटा सायन्सच्या दृष्टीकोनातून, तुम्हाला माहिती असेल की मी कोड लिहायला आवडत असलेल्या डेटा वैज्ञानिकांशी बोललो आहे आणि कोड लिहिण्यास तिरस्कार करणा data्या डेटा वैज्ञानिकांशी मी बोललो आहे. आणि ते ठीक आहे, म्हणून आमच्याकडे खूप व्हिज्युअल, ग्राफिकल यूजर इंटरफेस आहे. आम्ही आपला डेटा हस्तगत करू शकतो, आम्ही आमची स्वयंचलित डेटा आरोग्य तपासणी करू शकतो आणि कदाचित मला कोड लिहायचा आहे. मला पायथन आवडतो, मला आर आवडतात, परंतु कल्पना आहे की हे डेटा शास्त्रज्ञ आहेत, त्यांना कमी पुरवठा आहे आणि त्यांना एका विशिष्ट भाषेत कोड आवडतो. आपल्याला कोणत्या भाषेमध्ये कोड घ्यायचा आहे हे आमच्याकडे विशेषतः प्राधान्य नाही, म्हणून आपण आर करू इच्छित असल्यास, आर करा; तुम्हाला पायथन करायचे असल्यास पायथन करा. ते छान आहे आपण आपले विश्लेषण अझूरला फोडू इच्छित असल्यास, आपले विश्लेषण मेघावर फोडा. आणि म्हणून आपले डेटा शास्त्रज्ञ जितके उत्पादनक्षम असतील तितके उत्पादनक्षम बनविण्यासाठी लवचिकता आणि पर्याय देणे हे येथे लक्ष्य आहे.

आता डेटा वैज्ञानिक, ते खूपच हुशार लोक आहेत, परंतु कदाचित ते प्रत्येक गोष्टीत तज्ञ नसतील आणि कदाचित त्यांच्यात काय फरक पडेल. आणि जर आपण उद्योगात लक्ष दिल्यास, तेथे अस्तित्त्वात असलेल्या बर्‍याच विश्लेषक बाजारपेठे उपलब्ध आहेत. हे याचे एक उदाहरण आहे, कदाचित मला प्रतिमा ओळखण्याची आवश्यकता असेल आणि माझ्याकडे ते कौशल्य नाही, कदाचित मी अल्गोरिथिमियाला जाऊ आणि प्रतिमा ओळख अल्गोरिदम मिळवा. कदाचित मी अपर्विटाला जाऊ शकेन आणि एक अतिशय खास आरोग्यसेवा अल्गोरिदम घेऊ. कदाचित मला अझूर मशीन शिक्षण ग्रंथालयात काहीतरी वापरायचे आहे. मला मुळ स्टॅटिस्टीका प्लॅटफॉर्मवर काहीतरी वापरायचे आहे.

पुन्हा, येथे कल्पना आहे की आम्ही जागतिक विश्लेषक समुदायाचा लाभ घेऊ इच्छितो. कारण आपल्याकडे आपल्या चार भिंतींमध्ये सर्व कौशल्ये नसतील, म्हणून आम्ही सॉफ्टवेअर कसे तयार करू - आणि आम्ही हे करीत आहोत - जे आपल्या डेटा वैज्ञानिकांना विविध बाजारपेठांमधील अल्गोरिदम वापरण्याची परवानगी देते. आम्ही बर्‍याच दिवसांपासून आर आणि पायथनसह करत होतो, परंतु हे अस्तित्त्वात असलेल्या या अ‍ॅप मार्केटप्लेसपर्यंत ते विस्तारित करते. आणि आपण येथे ज्याच्या शीर्षस्थानी पहात आहात तेच आम्ही स्पार्कवर H2O वापरत आहोत, म्हणून तेथे बरेच विश्लेषक अल्गोरिदम आहेत. आपण हे सुरवातीपासून तयार करण्यावर लक्ष केंद्रित करण्याची गरज नाही, मुक्त स्त्रोत समुदायामध्ये राहणा these्यांचा याचा पुन्हा वापर करूया आणि हे लोक शक्य तितके उत्पादक व्हावे अशी आमची इच्छा आहे.

पुढील चरण, आमच्याकडे आमचे नागरिक डेटा वैज्ञानिक आणि डेटा वैज्ञानिक आहेत, आपण खरोखरच या जाहिरातींचा प्रचार कसा करता आणि आपण या उत्कृष्ट पद्धतींचे वितरण कसे करता? आमच्याकडे आमच्या सॉफ्टवेअरमध्ये तंत्रज्ञान आहे जे आपल्याला कोठेही विश्लेषणे वितरीत करण्यास अनुमती देते. आणि हे मॉडेल व्यवस्थापन दृश्यापेक्षा अधिक आहे परंतु मी यापुढे तुळसा किंवा तैवान किंवा कॅलिफोर्नियामध्ये किंवा आपल्याकडे असलेले चार भिंती किंवा विशिष्ट स्थापनेद्वारे बांधलेले नाही. हे एक जागतिक व्यासपीठ आहे आणि आमच्याकडे असे बरेच ग्राहक आहेत जे एकाधिक साइटद्वारे ते वापरात तैनात आहेत.

आणि खरोखरच, मुख्य गोष्टी म्हणजे, जर आपण तैवानमध्ये काहीतरी करत असाल आणि आपण त्या ब्राझीलमध्ये बनवू इच्छित असाल तर ते छान आहे. तेथे जा, पुन्हा वापरता येण्याजोग्या टेम्प्लेट हस्तगत करा, तुम्हाला हवे असलेले वर्कफ्लो हस्तगत करा. हे मानक आणि गोष्टी करण्याचा सामान्य मार्ग तयार करण्याचा प्रयत्न करीत आहे, म्हणून आम्ही सर्वत्र गोष्टी पूर्णपणे भिन्न करत नाही. आणि याचा दुसरा मुख्य घटक म्हणजे आपल्याला गणिताला जिथे डेटा राहतो तेथे नेणे आवडते. आपल्याला माहित आहे, कॅलिफोर्निया आणि तुळसा आणि तैवान आणि ब्राझील दरम्यान आपल्याला डेटा बदलण्याची आवश्यकता नाही. आमच्याकडे तंत्रज्ञान आहे जे आम्हाला गणितास डेटाकडे नेण्याची परवानगी देते आणि आमच्याकडे त्या विषयावर आणखी एक हॉट टेक्नॉलॉजी वेबकास्ट असणार आहे.

परंतु आम्ही या आर्किटेक्चरला कॉल करतो आणि येथे एक डोकावून पहा, नेटिव्ह डिस्ट्रिब्युटेड ticsनालिटिक्स आर्किटेक्चर. यामागची मुख्य कल्पना आपल्याकडे स्टॅटिस्टीका हा एक व्यासपीठ आहे आणि मी एक अणू म्हणून विश्लेषक कार्यप्रवाह निर्यात करू शकतो. आणि मी एक मॉडेल किंवा संपूर्ण कार्यप्रवाह करू शकतो, जेणेकरून काही फरक पडत नाही. परंतु मी हे तयार करू आणि लक्ष्य व्यासपीठासाठी योग्य भाषेत निर्यात करू शकते. याच्या डाव्या बाजूला बरेच लोक असे करतात, परंतु ते स्त्रोत प्रणालीमध्ये स्कोअरिंग करतात. ते ठीक आहे, आम्ही स्कोअरिंग करू शकतो आणि आम्ही डेटाबेसमध्ये मॉडेल बिल्डिंग करू शकतो, जेणेकरून ते मनोरंजक आहे.

आणि मग उजवीकडे, आमच्याकडे बूमी आहे. हे एक सहकारी तंत्रज्ञान आहे, आम्ही या सर्वांसह कार्य करतो. परंतु आम्ही हे कार्यप्रवाह देखील घेऊ शकतो आणि जगात कोठूनही ते मूलत: नेऊ शकतो. आयपी पत्ता असलेली कोणतीही गोष्ट. आणि मला सार्वजनिक किंवा खाजगी मेघावर स्टॅटिस्टीका स्थापित करण्याची गरज नाही. जेव्हीएम चालवू शकेल काहीही, आम्ही यापैकी कोणत्याही लक्ष्य प्लॅटफॉर्मवर ही विश्लेषक कार्यप्रवाह, डेटा प्रीप वर्कफ्लो किंवा फक्त मॉडेल चालवू शकतो. ते माझ्या सार्वजनिक किंवा खाजगी ढगात असो, ते माझ्या ट्रॅक्टरमध्ये असेल, माझी कार आहे, माझे घर आहे, माझे लाईटबल्ब आहे, माझे सामान्यांचे इंटरनेट आहे, आमच्याकडे तंत्रज्ञान आहे जे आपल्याला त्या वर्कफ्लोस जगात कुठेही नेण्याची परवानगी देते.

चला पुनरावलोकन करूया. आपणास माहित आहे की आमच्याकडे व्यावसायिक वापरकर्त्यांची ओळ आहे, म्हणूनच या लोकांना, आमच्याकडे तंत्रज्ञान आहे ज्यामुळे ते आरामात असतात अशा स्वरूपात आउटपुट वापरतात. आमच्याकडे नागरिकांचे डेटा वैज्ञानिक आहेत आणि आम्ही प्रयत्न करीत आहोत की सहयोग वाढविणे, त्यांना कार्यसंघाचा एक भाग बनविणे होय? आणि म्हणूनच आमची इच्छा आहे की लोकांनी चाक पुन्हा चालू करणे थांबवावे. आणि आमच्याकडे हे डेटा वैज्ञानिक आहेत, तेथे एक कौशल्य अंतर असू शकते, परंतु ते त्यांना इच्छित भाषेत कोड देऊ शकतात, ते विश्लेषक बाजारात जाऊ शकतात आणि तेथे अल्गोरिदम वापरू शकतात. आणि यासह, आपण असे समजू शकत नाही की यासह सर्व काही आश्चर्यकारक आहे? हे परिपूर्ण आहे, हे आपण करीत आहोत. आम्ही पुन्हा वापरण्यायोग्य वर्कफ्लो तयार करीत आहोत, आम्ही लोकांना सूचना देत आहोत, आम्ही त्यांना लेगो ब्लॉक देत आहोत जेणेकरून ते या पराक्रमी किल्ले तयार करु शकतील आणि जे काही त्यांना करायचे आहे. याचा सारांश असे की, आमच्याकडे एक व्यासपीठ आहे जे व्यवसाय वापरकर्ते, नागरिक डेटा वैज्ञानिक, प्रोग्रामर डेटा शास्त्रज्ञांची सबलीकरण करते - आम्ही कोणत्याही प्रकारचे आयओटी एज ticsनालिटिक्स वापर प्रकरण हाताळू शकतो आणि आम्ही सामूहिक बुद्धिमत्तेची ही कल्पना सक्षम करीत आहोत. त्यासह, मला वाटते की आम्ही कदाचित हे प्रश्नांसाठी उघडेल.

रॉबिन ब्लॉर: बरं ठीक आहे. मला वाटते की पहिले - माझे म्हणणे खरे आहे, म्हणजे मला डेल स्टॅटिस्टीका यापूर्वी सांगितले गेले होते आणि खरं सांगायचं झालं तर मला सादरीकरणात आपण पुढे आणले आहे हे मला ठाऊक नसलेल्या गोष्टींबद्दल मला खरोखर आश्चर्य वाटले . आणि मला असे म्हणायचे आहे की एक गोष्ट म्हणजे ती विश्लेषणेच्या अंगभूततेमुळे माझ्यासाठी एक बगबियर बनली आहे, म्हणजेच, आपल्याला माहिती आहे की साधने मिळवणे म्हणजे नाही, तुम्हाला माहिती आहे? तेथे एक अफाट साधने आहेत, तेथे मुक्त स्त्रोत साधने आणि इतर बरेच काही आहेत, आणि अर्ध-प्लॅटफॉर्मवर मी कॉल करतो असे बरेच आहेत. परंतु मला वाटते की आपल्यात काय फरक आहे, मी विशेषतः काही वर्कफ्लोवर प्रभावित झाले.

परंतु फरक असा आहे की आपण शेवटपर्यंत प्रदान करीत आहात. हे असे आहे की विश्लेषणे ही एक अत्याधुनिक व्यवसाय प्रक्रिया आहे जी डेटा अधिग्रहणापासून सुरू होते आणि नंतर डेटा किती धडपडते यावर अवलंबून ती संपूर्ण चरणांच्या संपूर्ण मालिकेतून जाते आणि नंतर ते वेगवेगळ्या गणितीय हल्ल्यांच्या संपूर्ण मालिकेत बाहेर पडते. डेटा. आणि मग परिणाम एका मार्गाने उद्भवतात आणि त्यास कृती करण्याची आवश्यकता असते. मी जिथे बरीच मोठी कामे केली होती तिथे विश्लेषणेची प्रचंड संख्या आहे परंतु त्यावर कृती करण्यास काहीच नाही. आणि आपल्याकडे जे आवश्यक आहे त्यापैकी एक भरपूर आहे असे दिसते. ते किती व्यापक आहे हे मला माहित नाही, परंतु हे माझ्या अपेक्षेपेक्षा अधिक व्यापक आहे. मी त्यावर आश्चर्यकारकपणे प्रभावित आहे.

मी तुम्हाला स्प्रेडशीटवर टिप्पणी देऊ इच्छित आहे. आपण आधीच काहीतरी सांगितले आहे, परंतु मी लक्षात घेतलेल्या गोष्टींपैकी एक आणि मी वर्षानुवर्षे लक्षात घेतले आहे, परंतु हे अधिक आणि अधिक स्पष्ट झाले आहे, ते म्हणजे सावली प्रणाली आहे आणि खरोखर मला वाटते स्प्रेडशीट, म्हणजे जेव्हा ते ओळखले गेले तेव्हा हे आश्चर्यकारक साधन होते आणि बर्‍याच प्रकारे वेगवेगळ्या मार्गांनी हे आश्चर्यकारक होते, परंतु हे एक सामान्यीकृत साधन आहे, ते खरोखर हेतूसाठी योग्य नाही. हे निश्चितपणे बीआय कॉनमध्ये फारसे चांगले नाही आणि मी असे मानतो की ते विश्लेषक दृष्टीने अत्यंत वाईट आहे. आणि मला आश्चर्य वाटले की आपल्याकडे याबद्दल काही सांगायचे असेल तर असे म्हणू द्या की उदाहरणे कुठे आहेत, आपल्याला माहिती आहे की स्टॅटिस्टीका बाहेर गेली आहे, जास्त स्प्रेडशीट वापरली गेली आहे किंवा आपण याबद्दल काही प्रतिक्रिया देऊ इच्छित आहात?

डेव्हिड स्वीनरः होय मला असे वाटते की, आपल्याला माहिती आहे, आपण प्रसिद्ध स्प्रेडशीट चुका पाहू शकता. Google किंवा आपण जे काही शोध इंजिन वापरत आहात ते परिणामांच्या लीटेनीसह परत येईल. मला असे वाटत नाही की आपणास माहित आहे की आम्ही कधीही स्प्रेडशीट पुनर्स्थित करु. हा आमचा हेतू नाही, परंतु मी ज्या अनेक संस्थांकडे जात आहे, तेथे यापैकी काही स्प्रेडशीट विझार्ड्स किंवा निन्जा आहेत किंवा आपण त्यांना ज्याला कॉल करू इच्छित आहात, परंतु त्यांच्याकडे ही अतिशय अत्याधुनिक स्प्रेडशीट आहेत आणि आपण विचार करायचा आहे, जेव्हा हे होते तेव्हा काय होते लोक लोट्टो जिंकतात आणि ते परत येत नाहीत? आणि म्हणूनच आम्ही करण्याचा प्रयत्न करीत आहोत, आम्हाला माहित आहे की स्प्रेडशीट अस्तित्त्वात आहेत जेणेकरून आम्ही त्या शोधू शकू, परंतु मला वाटते की आपण जे करण्याचा प्रयत्न करीत आहोत ते आपल्या वर्कफ्लोचे व्हिज्युअल प्रतिनिधित्व विकसित करेल जेणेकरुन ते इतर लोकांसह समजू शकेल आणि सामायिक केले जाऊ शकेल. . स्प्रेडशीट खूपच कठीण आहेत, सामायिक करणे खूपच कठीण आहे. आणि जसे की तुम्ही मला तुमची स्प्रेडशीट माझ्याकडे पाठवताच मी ती बदलली आहे आणि आता आम्ही समक्रमित झालो आहोत आणि आम्हाला वेगवेगळी उत्तरे मिळत आहेत. आम्ही जे करण्याचा प्रयत्न करीत आहोत ते म्हणजे याभोवती काही रेलिंग ठेवणे आणि गोष्टी थोडी अधिक कार्यक्षम बनविणे. आणि एकाधिक डेटा सेट एकत्रित करताना स्प्रेडशीट खरोखरच भयानक असतात, आपल्याला माहिती आहे? ते तिथेच खाली पडतात. परंतु आम्ही त्यांना पुनर्स्थित करणार नाही, आम्ही ते निपटून घेत आहोत आणि आपल्याकडे लोक बदलू लागले आहेत कारण आपल्याकडे “जोखमीची गणना करा” असे म्हणणारे नोड असल्यास हीच व्यक्ती स्प्रेडशीट वापरण्याचा प्रयत्न करीत आहे. तर ते गेले आहेत.

रॉबिन ब्लॉर: होय, मी म्हणायचे आहे की मी गोष्टीकडे ज्या दृष्टिकोनातून पाहिले आहे त्यातील एका दृष्टीकोनातून मी असे म्हणेन की माहिती तयार करण्यासाठी स्प्रेडशीट उत्कृष्ट आहेत. ते ज्ञानाची बेट तयार करण्यासाठी अगदी उत्कृष्ट आहेत, परंतु ज्ञान सामायिक करण्यासाठी ते खरोखरच वाईट आहेत. त्यांच्याकडे असे करण्याची कोणतीही यंत्रणा नाही आणि जर तुम्ही एखाद्याला एखादे स्प्रेडशीट पाठवत असाल तर असे नाही की आपण ते वाचू शकता जसे की एक लेख ज्याने ते काय करीत आहेत हे स्पष्ट केले. हे फक्त तेथे नाही. मला वाटते, आपल्याला माहिती आहे की सादरीकरणाबद्दल आणि स्टॅटिस्टीकाच्या क्षमतेबद्दल ज्या गोष्टीने मला सर्वात प्रभावित केले, ते आश्चर्यकारकपणे अज्ञेयवादी वाटत नाही. परंतु वर्कफ्लोमधून हा धागा चालत आला आहे. मी असे गृहित धरले आहे की आपण अगदी शेवटी-एंड-एंड वर्कफ्लो पाहू शकता, तुम्हाला माहिती आहे, डेटा प्राप्तिपासून ते विशिष्ट द्विपक्षीय अनुप्रयोग किंवा अगदी चालू असलेल्या अनुप्रयोगांमध्ये परिणाम अंतःस्थापित करण्यापर्यंत?

डेव्हिड स्वीनरः होय, अगदी. आणि त्यात शेवट-टू-एंड क्षमता आहे आणि काही संस्था त्या पूर्णपणे वापरतात आणि आजच्या काळात कोणतीही कंपनी एका विक्रेताकडून सर्व काही विकत घेत नाही. आमचे मिश्रण आहे. काही लोक प्रत्येक गोष्टीसाठी स्टॅटिस्टीका वापरतात आणि काही लोक हे मॉडेलिंग वर्कफ्लोसाठी वापरतात, काही लोक डेटा प्रीप वर्कफ्लोसाठी वापरतात. काही लोक अभियंत्यांकडे शेकडो अभियांत्रिकी अहवाल वितरीत करण्यासाठी वापरतात. आणि म्हणूनच आमच्यात सर्वकाही आहे. आणि हे खरोखर शेवटपर्यंत आहे आणि हे तुम्हाला माहिती आहे, अज्ञेयवादी व्यासपीठ आहे, त्यामध्ये जर तुम्हाला आर किंवा पायथन, अझर, अपर्विटा मध्ये जे काही वापरायचे आहे असे अल्गोरिदम असल्यास, त्या तुम्हाला वापरा, त्या वापरा. ते उत्तम आहे, उत्पादक व्हा, आपल्याला जे माहित आहे ते वापरा, आपण ज्याची सोयीस्कर आहात त्याचा वापर करा आणि त्या नियंत्रित आणि ऑडिट करण्यायोग्य आणि त्या सर्व प्रकारच्या गोष्टी याची खात्री करण्यासाठी आमच्याकडे यंत्रणा आहे.

रॉबिन ब्लॉर: मला ते विशेषतः आवडते. म्हणजे, आपण जे काही सांगत आहे त्यापलीकडे जे काही बोलले आहे त्यापलीकडे आपण बोलू शकता की नाही हे मला माहित नाही. म्हणजे, मी हे पाहिले आहे परंतु मी त्याकडे सर्वंकष दृष्टीने पाहिले नाही आणि नक्कीच आमच्या लायब्ररीत अनेक पायथन ग्रंथालय आहेत पण त्या चित्रात आपण आणखी काही भर देऊ शकता का? कारण मला वाटते की ही एक अतिशय मनोरंजक गोष्ट आहे, आपल्याला माहिती आहे की आपल्याकडे विश्वासार्ह घटक असतील अशी कल्पना आहे कारण आपल्याला विविध प्रकारचे लोक आणि ज्यांना आपण डाउनलोड करू शकता अशा लोकांना वापरत असलेल्या लोकांना माहित आहे. आपल्याला माहिती आहे, त्याबद्दल आपण आधीपासून काय सांगितले आहे ते समृद्ध करू शकता?

डेव्हिड स्वीनरः होय, मला वाटते काही अ‍ॅप मार्केटप्लेस, आपल्याला माहिती आहे, तेथे असलेल्या अल्गोरिदम मार्केटप्लेस. उदाहरणार्थ, तुम्हाला माहिती आहे की, आयोवा विद्यापीठात डॉ. जॉन क्रॉमवेल यांनी एक मॉडेल तयार केला आहे जो अंदाज लावेल, ज्याचा वापर रिअल टाइममध्ये केला जात आहे, ज्यावर आपण कार्यरत आहोत, तुम्हाला एक स्कोअर देईल सर्जिकल साइट संक्रमण आणि जर ही धावसंख्या पुरेसे असेल तर ते ऑपरेटिंग रूममध्ये हस्तक्षेप करतील. ते खूप मनोरंजक आहे तर कदाचित आणखी एक हॉस्पिटल असेल जेवढे मोठे नाही. बरं, अपर्विटा विश्लेषकांसाठी एक आरोग्य अ‍ॅप बाजारपेठ आहे. आपण यापैकी बर्‍याच अ‍ॅप बाजारपेठांमध्ये एखादा शोध घेऊ शकता, आपण एखादे शोधू शकता आणि त्यांचा पुन्हा वापर करू शकता आणि हा व्यवहार आपल्यामध्ये आणि ज्याच्या मालकीचा आहे त्याच्या दरम्यान आहे, परंतु आपण एकतर शोधू शकता किंवा आपण म्हणू शकता की, “येथे आहे मला काय हवे आहे. "मला वाटते की हे जागतिक समुदायाचे कार्य करीत आहे कारण आजकाल प्रत्येकजण एक विशेषज्ञ आहे आणि आपल्याला सर्व काही माहित नाही. मला वाटते आर आणि पायथन ही एक गोष्ट आहे परंतु ही कल्पना आहे की, "मला हे कार्य करायचे आहे, या अ‍ॅप बाजारपेठांपैकी एका ठिकाणी एक तपशील द्या आणि एखाद्याने आपल्यासाठी तो विकसित करावा." आणि ते कमाई करू शकतात, मला वाटते ते पूर्णपणे ओपन सोर्स मॉडेलपेक्षा खूपच रंजक आणि भिन्न आहे.

रॉबिन ब्लॉर: ठीक आहे. असं असलं तरी मी चेंडू डेझवर पुरवीन. डेझ मध्ये आपण डुकर घालू इच्छिता?

डेझ ब्लांचफिल्ड: अगदी आणि मी स्प्रेडशीटवर क्षणभर थांबू इच्छितो कारण मला वाटते की आपण येथे ज्या गोष्टींबद्दल बोलत आहोत त्या सर्वांचा योग्य उतारा त्याने मिळविला आहे. आणि रॉबिन, आपण एक टिप्पणी दिली, जुन्या स्प्रेडशीटच्या क्रमवारीपासून इलेक्ट्रॉनिक स्वरूपात बदलल्याबद्दल. आमच्याकडे एक मनोरंजक गोष्ट घडली जिथे आपल्याला माहिती आहे जेव्हा स्प्रेडशीट मूळतः एक गोष्ट होती जेव्हा ते फक्त पंक्ती आणि स्तंभांसह कागदाच्या पत्रके असतात आणि आपण व्यक्तिचलितरित्या त्या गोष्टी लिहून घेत असता तर आपण त्याद्वारे शक्ती प्राप्त करुन त्यांची गणना करू शकाल. ते आपल्या डोक्याच्या वरच्या बाजूला किंवा इतर कोणत्याही डिव्हाइससह. परंतु आपल्याकडे अद्याप हस्तलेखन चुका किंवा डिसलेक्सियामुळे त्रुटी घसरण्याची संधी आहे आणि आता त्याऐवजी टायपोजने बदलल्या आहेत. जोखीम हा आहे की स्प्रेडशीटसह जोखीम प्रोफाइल जलद आणि मोठे आहे, परंतु मला असे वाटते की स्टॅटिस्टीका सारखी साधने जोखीम पिरॅमिडला उलटा करतात.

मी बहुतेकदा हे चित्र एका व्यक्तीच्या शृंखला वरच्या बाजूला असलेल्या एका स्टिक आकृतीच्या एका चित्रावर काढतो आणि नंतर त्यातील एक संग्रह तळाशी खाली असे म्हणतो, त्या श्वेतबोर्डच्या तळाशी असलेल्या दहापैकी कल्पना करू आणि मी एक रेखाटते पिरॅमिड जेथे पिरॅमिडचा बिंदू एकट्या व्यक्तीकडे असतो आणि पिरॅमिडच्या पायाखालील लोक संग्रह. आणि मी हे शीर्षस्थानी असलेल्या एखाद्या व्यक्तीने स्प्रेडशीट केल्यास चूक केली आणि ती दहा लोकांसह सामायिक केली, ही कल्पना दृश्यमान करण्यासाठी मी हे वापरते आणि आता आपल्याकडे त्रुटीच्या दहा प्रती मिळाल्या आहेत. आपल्या मॅक्रोबद्दल खूप सावधगिरी बाळगा आणि आपण त्याकडे जात असाल तर आपल्या व्हिज्युअल बेसिकबद्दल खूप काळजी घ्या. कारण जेव्हा आम्ही स्प्रेडशीट सारखी इलेक्ट्रॉनिक साधने बनवतो तेव्हा ती खूपच शक्तिशाली असते, परंतु ती चांगल्या आणि वाईट मार्गाने देखील शक्तिशाली असते.

मला असे वाटते की स्टॅटिस्टीका सारखी साधने ती जोखीम प्रोफाइल उलटावण्याची क्षमता आणतात आणि ती म्हणजे आता आपणास त्या व्यक्तीकडे उपलब्ध असलेल्या साधनांची पुष्कळ साधने मिळू शकतील आणि ती सर्वात वरच्या टूल्सवरून जाताना मिळेल. पिरॅमिड आणि नंतर अगदी तळाशी जिथे पिरॅमिडचा बिंदू आता उलटला जात आहे तोच साधन आहे, जर आपल्याकडे अशी साधने आणि ती अल्गोरिदम तयार करणार्‍या लोकांची टीम मिळाली असेल तर. आणि डेटा वैज्ञानिकांना त्यांच्या डेटावरील रीग्रेशनल ticsनालिटिक्समध्ये तज्ञ असण्याची गरज नाही. ते कदाचित साधन वापरण्यास सक्षम असतील, परंतु आपल्याकडे कदाचित पाच किंवा सहा सांख्यिकीशास्त्रज्ञ आणि एक अभयारण्य आणि डेटा वैज्ञानिक आणि त्या गणिताचे काही गणितज्ञ, त्या मॉड्यूलवर, ते अल्गोरिदम, ते प्लग-इन आणि म्हणूनच स्प्रेडशीट पार्लन्समध्ये असतील, अशी कल्पना करा की आपण वापरत असलेले प्रकाशित प्रत्येक स्प्रेडशीट खरंच तज्ञांनी लिहिलेले आहे ज्यांनी मॅक्रोची चाचणी केली, व्हिज्युअल बेसिकची चाचणी केली, अल्गोरिदम कार्य केले याची खात्री केली, म्हणून जेव्हा आपण ते मिळवाल तेव्हा आपण त्यात डेटा पॉप करू शकता परंतु आपण त्यास तोडू शकत नाही आणि म्हणून हे नियंत्रित करणे अधिक चांगले आहे.

मला असे वाटते की बर्‍याच विश्लेषक साधने ते करीत आहेत. मला वाटते की त्या टप्प्यावर येत आहे, आपण आता शेतात हे पहात आहात काय, आपण स्प्रेडशीटमधील संक्रमण पहात आहात जे संभाव्यत: चुका आणि चुका आणि जोखीम ढकलू शकेल, ज्या बिंदूवर आपण तयार करीत आहात त्या आपल्याकडे आता प्लॅटफॉर्म, डेटा शोध वास्तविक वेळेत अचूक असल्याने आणि मॉड्यूल्स आणि अल्गोरिदम तयार करणारे लोक त्या जोखमीचे प्रोफाइल हटवत किंवा कमी करत आहेत? ग्राहक सेवा हे खर्‍या अर्थाने पहात आहेत किंवा आपल्याला असे वाटते की ते नुकतेच घडत आहे आणि त्यांना ते जाणवत नाही?

डेव्हिड स्वीनरः तुम्हाला माहिती आहे, मला असे उत्तर देण्याचे दोन मार्ग आहेत. परंतु आम्ही जे काही पहात आहोत त्या आपण कोणत्याही संस्थेमध्ये पहात आहात आणि मी नमूद केले आहे की विश्लेषणे कदाचित माझ्या मते कॉर्पोरेट गुंतवणूकीच्या दृष्टीकोनातून मागे पडली आहेत, डेटा वेअरहाउसिंग आणि सीआरएमद्वारे आम्ही काय केले. परंतु आपण काय पहात आहोत, म्हणून संघटना बदलण्यात, त्या संघटनात्मक जडत्वावर जाण्यासाठी खूप वेळ लागतो. परंतु आपण जे पहात आहोत ते म्हणजे त्यांचे स्प्रेडशीट घेणारे, त्यांचे वर्कफ्लो घेणारे आणि मी सुरक्षितता आणि कारभाराचा उल्लेख केला, “ठीक आहे, कदाचित माझ्याकडे स्प्रेडशीट आहे,” “ठीक आहे, मी हे लॉक करू शकतो आणि मी त्यावर नियंत्रण ठेवू शकतो.” आणि आम्हाला बर्‍याच संघटना दिसतात, कदाचित त्या तिथे सुरू होतील. आणि जर ते बदलले असेल तर तेथे एक वर्कफ्लो आहे आणि मी शेवटपर्यंत जात आहे, कोण बदलले आहे? त्यांनी ते का बदलले. जेव्हा त्यांनी ते बदलले. आणि मी वर्कफ्लो देखील सेट करू शकतो की हे कार्यप्रवाहात आपण परिभाषित करू इच्छित असलेल्या अनेक पक्षांचे सत्यापन आणि सत्यापन केल्याशिवाय मी हे नवीन स्प्रेडशीट उत्पादनास तयार करणार नाही. मला असे वाटते की लोक घेण्यास सुरवात करीत आहेत, आणि संस्था तिथे बाळासाठी पावले टाकण्यास सुरवात करीत आहेत, परंतु मी कदाचित पुढे जाण्यासाठी सुचवितो.

डेझ ब्लांचफिल्ड: खरोखर आणि मला वाटते की आपण सुरक्षा नियंत्रण आणि तेथील प्रशासन या दोन्ही गोष्टींमध्ये आपण इमारत तयार केली आहे, तर कामाचा ताण आपोआप त्या सर्व गोष्टी मुख्य जोखीम अधिका to्यापर्यंत स्वयंचलितपणे तयार करू शकेल, जी आता एक गोष्ट आहे. आपण त्या साधने आणि सिस्टममध्ये प्रवेश कसा केला जात आहे आणि त्यांच्याबरोबर कोण काय करीत आहे हे नियंत्रित करणे प्रारंभ करू शकता जेणेकरून ते खूप शक्तिशाली आहे. मला असे वाटते की यातल्या इतर गोष्टी म्हणजे आपण पुरविलेल्या साधनांचे प्रकार, आपण ज्या पारंपारिक स्प्रेडशीटबद्दल बोलत आहोत त्यापेक्षा मानवी वर्तनाला जास्त कर्ज देतात, जर मला लोकांची खोली मिळाली तर समान डॅशबोर्ड आणि समान डेटामध्ये प्रवेश मिळवून त्यांना वास्तविकपणे भिन्न दृश्य मिळू शकेल आणि परिणामी, त्याच माहितीवरून थोडी वेगळी अंतर्दृष्टी मिळवा, जे त्यांच्या सहयोगीकरणासाठी त्यांच्या आवश्यकतांना अनुकूल करेल. आमचा समान दृष्टीकोन आणि सर्व समान डेटा, त्याच पॉवर पॉइंटसह समान बैठकीत जाण्यापेक्षा आणि त्याच स्प्रेडशीटमध्ये संपादित केलेल्या विरूद्ध व्यवसाय आणि निर्णय घेण्याच्या प्रक्रियेशी आमचा मानवी दृष्टिकोन आणि संवाद आहे.

ज्या संघटनांमध्ये आपली साधने आता घडत आहेत तेथे दिसतात तेथे वर्तन आणि संस्कृतीत बदल दिसतो आहे, जेथे खोलीत पाच लोक समान स्प्रेडशीट पाहत आहेत असे दिसत नाहीत आणि त्यावर नोट्स बनविण्याचा प्रयत्न करीत आहेत , परंतु आता ते वास्तविकपणे डिंगबोर्ड आणि साधनांशी संवाद साधत आहेत, त्यांच्या बोटांच्या टोकावर व्हिज्युअलायझेशन आणि विश्लेषणे देऊन आणि संभाषण आणि परस्परसंवादावर पूर्णपणे भिन्न प्रवाह मिळवित आहेत, केवळ सभांमध्येच नव्हे तर संस्थेच्या सामान्य सहकार्याने. कारण ते वास्तविक वेळेत हे करू शकतात कारण ते प्रश्न विचारू शकतात आणि वास्तविक उत्तर मिळवू शकतात. या क्षणी आपण पहात असलेला हा ट्रेंड आहे किंवा अद्याप इतका घसरला नाही?

डेव्हिड स्वीनरः नाही, मला वाटतं की ते नक्कीच त्या मार्गापासून सुरू झाले आहे आणि मला वाटते की ही अतिशय मनोरंजक गोष्ट आहे, उदाहरणार्थ आपण एखाद्या कारखान्याचे उदाहरण घेतले तर. कदाचित त्या कारखान्यात ज्याच्याकडे विशिष्ट प्रक्रिया क्षेत्राचा मालक असेल त्याने हा डेटा एका विशिष्ट मार्गाने पहायचा आणि त्याच्याशी संवाद साधू इच्छित असाल. आणि कदाचित मी, सर्व प्रक्रियेकडे दुर्लक्ष करीत आहे, कदाचित ही कदाचित तळाशी असलेली ही एक गोष्ट असू शकते. मला वाटते की आपण पहात आहोत, प्रथम, लोक त्यांच्या संस्थांमध्ये व्हिज्युअलायझेशन किंवा मानक व्हिज्युअलायझेशनचा एक सामान्य संच वापरण्यास सुरवात करीत आहेत, परंतु ते ज्या भूमिकेत आहेत त्यानुसार देखील तयार आहेत. मी प्रक्रिया अभियंता असल्यास, कदाचित जो एखाद्याला पुरवठा साखळीच्या दृष्टीकोनातून पहातो त्यापेक्षा हे अगदी वेगळं मत आहे आणि मला वाटतं की ते छान आहे कारण ते तयार करणे आवश्यक आहे आणि आपल्याला आपले काम पूर्ण करण्यासाठी आवश्यक असलेल्या लेन्सद्वारे पहावे लागेल.

डेझ ब्लांचफिल्ड: माझ्या अंदाजानुसार निर्णय घेण्याची प्रक्रिया कमी होते, वेळेनुसार आणि गती, वास्तविक आणि अचूक निर्णय घेण्यासाठी देखील वेगाने वाढ होते, नाही का? कारण आपल्याकडे रिअल-टाइम ticsनालिटिक्स, रिअल-टाइम डॅशबोर्ड्स असल्यास आपल्याकडे बोटांच्या टोकावर स्टॅटिस्टीका साधने असल्यास आपल्याला जाण्यासाठी एखाद्याला जाण्यासाठी काही विचारण्यासाठी मजल्यावरील पळणे भाग पडण्याची गरज नाही. हार्ड कॉपी मध्ये. आपण एक प्रकारचे सहयोग करू शकता, संवाद साधू शकता आणि प्रत्यक्षात उड्डाणांवर निर्णय घेऊ शकता आणि तो निकाल त्वरित मिळवू शकता. मला वाटते की काही कंपन्या खरोखरच अद्याप आकांत करू शकल्या नाहीत, परंतु जेव्हा ते करतात तेव्हा हा युरेका हा क्षण असा आहे की, होय, आम्ही अद्याप आपल्या क्यूबिकल्समध्ये राहू शकतो आणि घरातही काम करू शकतो, परंतु आम्ही संवाद साधू शकतो आणि सहयोग करू शकतो आणि ते निर्णय घेतो. आम्ही सहकार्य केल्यावर त्वरित निकालांमध्ये रुपांतर करतो. पहा, मला असे वाटते की आपण आतापर्यंत काय म्हणायचे आहे हे ऐकणे आश्चर्यकारक होते आणि मी ते कोठे जाते हे पाहण्याची उत्सुकतेने वाट पाहत आहे. आणि मला माहित आहे की आम्हाला प्रश्नोत्तरामध्ये बरेच प्रश्न मिळाले आहेत, म्हणून मी त्यापैकी काही जणांमधून चालण्यासाठी रेबेकाकडे परत धावणार आहे जेणेकरून आम्ही आपल्याकडे जेवढे लवकर येईपर्यंत पोहोचू शकू. खूप खूप धन्यवाद

रेबेका जोझवियाक: धन्यवाद डेझ आणि होय डेव, आमच्याकडे प्रेक्षकांकडून काही प्रश्न आहेत. आणि तुमच्या अंतर्दृष्टीबद्दलही डेझ आणि रॉबिन यांचे आभार. मला माहित आहे की या विशिष्ट सहभागीने अगदी शेवटच्या वेळेलाच बाहेर पडावे लागले, परंतु ती एक प्रकारची विचारणा आहे, माहिती प्रणाली विभाग आपल्याला साधने प्रदान करण्यात आरामदायक राहण्याऐवजी अत्याधुनिक डेटा नियंत्रणांवर अधिक प्राधान्य देतात हे आपण पाहता? ज्ञान कामगार? म्हणजे, तेच - पुढे जा.

डेव्हिड स्वीनरः होय, मला वाटते की हे संघटनेवर अवलंबून आहे. मला वाटते की एखादी बँक, एक विमा कंपनी, कदाचित त्यांच्याकडे विपणन संस्था विरूद्ध विपणन संस्था वेगळ्या प्राथमिकता आणि गोष्टी करण्याचे मार्ग आहेत. माझ्या मते ते फक्त आपण म्हणत असलेल्या उद्योग आणि फंक्शनवर अवलंबून आहे असे म्हणावे लागेल. वेगवेगळ्या उद्योगांचे लक्ष केंद्रित आणि जोर वेगळे असते.

रेबेका जोझवियाक: ठीक आहे, याचा अर्थ प्राप्त होतो. आणि मग दुसर्‍या उपस्थितास हे जाणून घ्यायचे होते की स्टॅटिस्टीकामागील इंजिन काय आहे? ही सी ++ किंवा आपली स्वतःची सामग्री आहे का?

डेव्हिड स्वीनरः बरं, हे मला जवळपास years० वर्षांपासून झालेलं आहे आणि हे माझ्या वेळेच्या आधी विकसित झालं आहे हे मला ठाऊक नाही, परंतु तेथे विश्लेषणात्मक अल्गोरिदमची कोर लायब्ररी आहे जी स्टॅटिस्टीका अल्गोरिदम आहे. आणि आपण येथे पाहिले की आम्ही आर देखील चालवू शकतो, पायथन चालवू शकतो, अझूरला फुटू शकतो, स्पार्क येथे H2O वर चालवू शकतो, म्हणून मला वाटते की त्या प्रश्नाचे उत्तर मला द्यावे लागेल, ही इंजिनची विविधता आहे. आणि आपण कोणत्या अल्गोरिदम निवडता यावर अवलंबून, जर ती स्टॅटिस्टीका असेल तर ती अशा प्रकारे चालते, आपण एच 2 ओ आणि स्पार्कवर एखादे निवडले तर ते वापरते, आणि म्हणूनच हे त्यांच्यातील विविधता आहे.

रेबेका जोझवियाक: ठीक आहे. दुसर्‍या उपस्थितांनी विचारले की या स्लाइडकडे विशेषत: लक्ष वेधून घ्यावे, कोणत्या प्रकारचे नागरिक डेटा शास्त्रज्ञ कसे वापरू शकतील अशा टेम्पलेट्सला कसे माहित असतील? आणि मला असे वाटते की त्यामधून मी एक विस्तृत प्रश्न निर्माण करीन. ते म्हणजे, जेव्हा लाइन ऑफ-बिझिनेस वापरकर्ते किंवा व्यवसाय विश्लेषक येतात आणि जेव्हा त्यांना ही साधने वापरायची असतील, तेव्हा त्यांना निवडणे आणि धावणे किती सोपे आहे?

डेव्हिड स्वीनरः मला असे वाटते की मी याचे उत्तर देईन आणि जर आपण विंडोजशी परिचित असाल तर आपण हे वापरू शकता, विंडोज-आधारित प्लॅटफॉर्म आहे, म्हणून मी या स्क्रीनशॉटचा वरचा भाग कापला, परंतु त्याला विंडोज रिबन मिळाला. परंतु काय वर्कफ्लो वापरायचा हे त्यांना कसे कळेल? हे विंडोज एक्सप्लोररसारखे दिसते, म्हणून येथे एक वृक्ष रचना आहे आणि आपण ते कॉन्फिगर करू शकता आणि सेट करू शकता तथापि आपल्या संस्थेस ते सेट करू इच्छित आहे. परंतु असे असू शकते की आपल्याकडे फक्त हे फोल्डर्स असतील आणि आपण या फोल्डर्समध्ये हे पुन्हा वापरण्यायोग्य टेम्पलेट्स ठेवू इच्छित असाल. आणि मला असे वाटते की कदाचित आपली कंपनी एखादे नाव स्वीकारू शकेल, असे म्हणा की येथे “कॅल्क्युलेट रिस्क प्रोफाइल” आहे, येथे “या स्रोतांकडून डेटा मिळवा” आहे आणि आपण त्यांना पाहिजे त्यास नाव द्या. हे फक्त एक विनामूल्य फोल्डर आहे, आपण फक्त आपल्या कॅनव्हासवर नोट्स ड्रॅग करा. तर, खूप सोपे आहे.

रेबेका जोझवियाक: ठीक आहे. पुढच्या वेळी कदाचित एखादा डेमो असेल. त्यानंतर उपस्थित राहणारा आणखी एक प्रकार समोर आला आणि आपण आणि रॉबिन आणि डेझ ज्याच्याबद्दल चुकीच्या गोष्टींबद्दल बोलत होते, विशेषत: स्प्रेडशीटवर, परंतु कचरा / कचरा बाहेर टाकला आहे आणि जेव्हा तो येतो तेव्हा तो त्यापेक्षा अधिक गंभीर असल्याचे पाहतो विश्लेषणे करण्यासाठी. त्याचा उल्लेख केल्यासारखे, माहिती आहे की डेटाचा गैरवापर केल्यास काही दुर्दैवाने निर्णय घेऊ शकतात. आणि अधिक फेलसेफ अल्गोरिदमच्या विकासाबद्दल आपली मते काय आहेत याबद्दल तो आश्चर्यचकित आहे, मला असे वाटते की ते विश्लेषणाच्या “अत्युत्तम” शब्दाचा वापर करतात. आपणास माहित आहे की कोणीतरी आत येईल, त्यांना खरोखर उत्तेजन मिळेल, त्यांना ही प्रगत analyनालिटिक्स करायचे आहेत, त्यांना ही प्रगत अल्गोरिदम चालवायची आहेत पण कदाचित त्यांना निश्चित माहिती नसेल. तर त्या विरोधात तुम्ही कोणत्या प्रकारच्या सेफगार्डचे काम करता?

डेव्हिड स्वीनरः हं, म्हणून मी अंदाज लावतो की मी या सर्वोत्तम उत्तर देऊ शकू, परंतु माझ्या मते, सर्व काही लोक, प्रक्रिया आणि तंत्रज्ञानात खाली येते. आमच्याकडे तंत्रज्ञान आहे जे लोकांना सक्षम करण्यात मदत करते आणि आपण आपल्या संस्थेमध्ये घालू इच्छित कोणतीही प्रक्रिया सक्षम करण्यात मदत करते. कुणाला कुपन कूपन देण्याच्या उदाहरणामध्ये, कदाचित ते तितकेसे गंभीर नसते आणि जर ते डिजिटल असेल तर खरोखर ही किंमत नाही, कदाचित सुरक्षा नियंत्रणांची एक पातळी असेल आणि कदाचित आपली काळजी नाही. जर मी सर्जिकल साइट इन्फेक्शनचा अंदाज लावत असेल तर कदाचित त्याबद्दल मला थोडेसे अधिक काळजी घ्यावीसे वाटेल. किंवा जर मी औषधाची गुणवत्ता आणि सुरक्षितता आणि त्यासारख्या गोष्टींबद्दल भविष्यवाणी करीत असेल तर कदाचित त्याबद्दल मला थोडे अधिक काळजी घ्यावीसे वाटेल. आपण बरोबर आहात, कचरा कचरा / कचरा बाहेर आहे, म्हणून आम्ही जे करण्याचा प्रयत्न करीत आहोत तो एक व्यासपीठ प्रदान करतो जो आपल्याला आपल्या संस्थेने स्वीकारू इच्छित असलेल्या कोणत्याही प्रक्रियेस अनुरूप बनविण्यास परवानगी देतो.

रेबेका जोझवियाक: ठीक आहे. माझ्याकडे आणखी काही प्रश्न आहेत, परंतु मला माहित आहे की आम्ही तासभरात गेलो आहोत आणि मला आमच्या सादरकर्त्यांना सांगायचे आहे, ते छान होते. आणि आम्ही डेल स्टॅटिस्टीका कडून डेव्ह स्वीनरचे खूप आभार मानू इच्छितो. नक्कीच, डॉ रॉबिन ब्लॉर आणि डेझ ब्लांचफिल्ड, आज विश्लेषक असल्याबद्दल धन्यवाद. पुढील महिन्यात डेल स्टॅटिस्टीका बरोबर आमचे आणखी एक वेबकास्ट होणार आहे. मला माहित आहे की डेव्हने या विषयाबद्दल संकेत दिले आहेत. हे काठावरील विश्लेषणाबद्दल, आणखी एक आकर्षक विषय असेल आणि मला माहित आहे की त्या वेबकास्टवर काही अत्यंत आकर्षक वापर प्रकरणे चर्चा केली जात आहेत. आपण आज जे पाहिले ते आपल्याला आवडत असल्यास, पुढील महिन्यासाठी परत या. आणि त्या बरोबर, लोकांनो, मी तुम्हाला निरोप घेईन. खूप खूप धन्यवाद. बाय बाय.