डेटा वैज्ञानिक: टेक वर्ल्डचे नवीन रॉक स्टार्स

लेखक: Robert Simon
निर्मितीची तारीख: 24 जून 2021
अद्यतन तारीख: 1 जुलै 2024
Anonim
lecture 18 - creating threads using thread class, thread priority , synchronization.
व्हिडिओ: lecture 18 - creating threads using thread class, thread priority , synchronization.

सामग्री


स्रोत: ओनराडियो / आयस्टॉकफोटो

टेकवे:

तंत्रज्ञानाच्या भूमिकेमध्ये डेटा सायंटिस्टची भूमिका सर्वात वेगवान बनली जात आहे. न्यूयॉर्क टाईम्स कडून आपल्याला अव्वल डेटा वैज्ञानिक जॅक पोरवे यांना आपली नोकरी कशी मिळाली आणि क्षेत्रातील यशासाठी त्याच्या सल्ले याबद्दल विचारले.

डेटा सायंटिस्टची भूमिका ही तंत्रज्ञानाच्या जगात सर्वात जास्त आवश्यक असलेली करिअर बनत आहे. गूगल, Amazonमेझॉन आणि लिंक्डइन सारख्या कंपन्या डिजिटल डेटा युगातील नाविन्यपूर्ण धार कायम ठेवण्यास मदत करण्यासाठी डेटा वैज्ञानिक वापरत आहेत. आणि आता डेटा आणि तंत्रज्ञानाविषयी उत्साही डेटा शास्त्रज्ञ बनण्याची आकांक्षा दाखवतात त्याचप्रमाणे काही संगीतकार रॉक स्टार बनण्याची आस करतात. कदाचित काही लोक तंत्रज्ञानाच्या युगातील नवीन रॉक तारे म्हणून डेटा वैज्ञानिकांचा उल्लेख का करतात?

दुर्दैवाने, ही भूमिका अद्याप इतकी नवीन आहे की अद्याप याबद्दल अस्पष्टतेचे एक स्तर आहे, याचा अर्थ असा आहे की बरेच चाहते डेटा वैज्ञानिक आपल्या टूर बस चुकीच्या मार्गावर चालवत आहेत. डेटा शास्त्रज्ञ त्यांच्या रॉकस्टार प्रतिष्ठेस पात्र आहेत काय? आम्ही न्यूयॉर्क टाइम्सच्या आर अँड डी प्रयोगशाळेतील डेटा वैज्ञानिक जॅक पोरवे यांच्या मुलाखतीने डेटा सायन्सच्या जगात प्रवेश केला.


डेटा वैज्ञानिक: टेकस रॉक स्टार?

तर डेटा वैज्ञानिकांना तंत्रज्ञानाच्या जगाचे नवीन रॉक स्टार म्हणून का संबोधले जात आहे? ही समानता डेटा अल्ट्राकोलच्या आवाजाच्या तीव्रतेपेक्षा अधिक खोलवर जाते. एखाद्या रॉक स्टारप्रमाणेच डेटा वैज्ञानिकांच्या करिअरमध्ये विविधता, कलात्मक स्वातंत्र्य आणि अनुकूलता यांचा समावेश आहे. आणि करमणूक जगाच्या रॉक स्टार्सप्रमाणेच, उत्कृष्ट डेटा वैज्ञानिक देखील डेटा आणि तंत्रज्ञान उद्योगातील सर्व स्तरातील लोकांचे अनुसरण करण्यास इच्छुक आहेत.

डेटा वैज्ञानिक काय करतो हे खूप वैविध्यपूर्ण आहे; जॅझ आणि डेथ मेटलसारखे भिन्न संगीत वाद्य प्ले करण्यासाठी संगीतकार विविध वाद्ये, साधने आणि तंत्रे वापरतात, त्याचप्रमाणे डेटा वैज्ञानिक देखील विशिष्ट साधन आणि फील्डमध्ये प्रभुत्व मिळवते. त्यातही थेरेस शैली सामील आहे. आणि एकतर नोकरी करण्याचा कोणताही चुकीचा किंवा चुकीचा मार्ग नाही - हे इतर लोकांवर कामाच्या परिणामाबद्दल आहे.

जेव्हा बीटल्सने त्यांची गाणी लिहिली, तेव्हा प्रत्येक साधनातील प्रत्येक टीप कशी वाजवायची हे सांगणारी एक व्यक्ती नव्हती. ते एकत्र आले आणि जाम केले; सर्जनशील शोधाद्वारे त्यांना कार्य करणारी गाणी आढळली. डेटा शास्त्रज्ञांसाठी तेच आहे. त्यांना लय जाणवावी लागेल, खोबणीत उतरावे लागेल आणि समाधानाची सुसंगतता आणावी लागेल. क्षणाक्षणाला ज्या काही पध्दती, साधने आणि तंत्रे लक्षात येतील अशा गोष्टी करण्याचा प्रयत्न करण्यासाठी योग्य प्रमाणात कलात्मक स्वातंत्र्य आणि जेव्हा काही कळ न आलेले बदल घडवून आणण्याची चापळपणामुळेच हे शक्य आहे.


एकदा एखादा डेटा शास्त्रज्ञ मूलभूत गोष्टींवर प्राविण्य मिळविल्यानंतर, तो किंवा ती परिस्थितीशी जुळवून घेण्यास सक्षम बनतो आणि इतर क्षेत्रात समाधान प्रदान करण्याचा आत्मविश्वास वाढवतो. आम्ही नंतर या मूलभूत तत्त्वांबद्दल अधिक बोलतो. येथे मुद्दा सांगायचा मुद्दा असा आहे की एकदा आपण डेटा सायन्समध्ये प्राविण्य मिळविल्यास आपण आपल्यास पाहिजे त्या क्षेत्रात भूमिका घेऊ शकता, कारण डेटा सर्वत्र आहे.

शक्य तितक्या मोठ्या संख्येने मोठ्या संख्येने मूल्य तयार करणे हे डेटा सायंटिस्टचे अंतिम लक्ष्य आहे. एखादा डेटा शास्त्रज्ञ पडद्यामागील गोष्टी करीत असताना, मोठ्या प्रेक्षकांना हे आवडत नाही: आपण जितके चांगले काम कराल तितके लोक आपण गाठाल आणि जितके बक्षिसे आपल्याला दिसतील तितकीच.

डेटा वैज्ञानिक काय करतात?

तर डेटा शास्त्रज्ञ नेमके काय करतात? चला या उदाहरणासह जाऊ या की आपण सर्वजण संबंधित होऊ शकू.

कोणतीही दोष नाही, तणाव नाही - आपले जीवन नष्ट न करता जीवन-बदलणारे सॉफ्टवेअर तयार करण्यासाठी चरण चरण बाय चरण

जेव्हा कोणालाही सॉफ्टवेअर गुणवत्तेची काळजी नसते तेव्हा आपण आपली प्रोग्रामिंग कौशल्ये सुधारू शकत नाही.

चला आपण एका दिवसाची जाणीव करू द्या की आपल्याकडे पूर्वीसारखी उर्जा नसते. दिवसेंदिवस जास्त ऊर्जा मिळवणे यासाठी आपण स्वतःस एक ध्येय ठेवले आहे. आता ते एक खूपच विस्तृत आणि संदिग्ध ध्येय आहे. म्हणून डेटा वैज्ञानिक म्हणून पहिली पायरी म्हणजे त्यातील काही अस्पष्टता दूर करणे आणि या उद्दीष्टांचे मोजमाप मोजणे. यासाठी पद्धती आहेत. आम्ही येथे तपशीलांमध्ये जाऊ इच्छित नाही, परंतु इतकेच सांगूया की आपण पुरेसे झोप घेत नाही आहात असे सिद्धांत आणा आणि म्हणूनच प्रत्येक रात्री आपल्यास आठ तास झोप मिळण्याचे उप-लक्ष्य द्या.

जरी हे ध्येय थोडे अधिक मोजता येण्यासारखे आणि कमी अस्पष्ट असले तरीही, त्याला स्वतःची आव्हाने आहेत. एकदा झोपी गेल्यानंतर आपण खरोखर टाइमर सुरू करू शकत नाही आणि आपण अंथरुणावर झोपल्यानंतर टायमर सुरू केला तरीही आपण झोपू शकत नाही. याव्यतिरिक्त, रात्री मध्यरात्री तुम्ही उठलेल्या वेळेस हे सांगणे कठिण आहे. शेवटी, झोपेचे प्रकार, जसे की खोल झोप आणि हलकी झोप. सर्वात महत्त्वाची गोष्ट अशी आहे की झोपेचे अचूक मोजणे कठीण आहे आणि म्हणूनच आपल्या उर्जा पातळीवर त्याचा परिणाम मोजणे आणखी कठीण आहे.

मग आपण काय करू शकता? बरं, एखादा डेटा वैज्ञानिक म्हणून तंत्रज्ञानातले नवीन तंत्रज्ञान शोधून काढा आणि निद्रानाश करणारी उपकरणे आहेत हे शोधून काढा.आणि आपण आपली झोप मोजण्यासाठी आणि डिजिटलपणे रेकॉर्ड करण्यासाठी असे डिव्हाइस वापरत असल्यास, आपल्या झोपेबद्दल अधिक अचूक डेटा मिळविण्यात सक्षम व्हाल आणि वेळोवेळी आलेख तयार करण्यासाठी डेटा गोळा करा.

हे एकटेच आपल्याला काय चालू आहे याबद्दल अधिक अंतर्दृष्टी देऊ शकतात. व्हिज्युअल प्रतिनिधित्व आपल्याला जागरूकता, स्पष्टता आणि दिशा देईल. आपण रात्रीच्या आठ तासांच्या झोपेच्या उद्दीष्टापर्यंत पोहोचत आहात की नाही हे पाहण्यास सक्षम आहात आणि मुख्य म्हणजे आपण नसल्यास कारवाई करण्यास सक्षम असाल.

हे डेटा सायंटिस्टचे मूलभूत कार्य आहेः डेटा मोजण्याचे आणि प्रदर्शित करण्याचे नवीन मार्ग आणणे जेणेकरून त्याकडे पहात असलेल्यांना अधिक जागरूकता, स्पष्टता आणि दिशा प्रदान केली जाईल.

पण एक चांगला डेटा वैज्ञानिक तिथेच थांबत नाही. एकदा डेटा संकलित झाल्यावर, तो आपण दिवसभर केलेल्या कोणत्याही मोजलेल्या क्रियाकलापासह समाकलित केला जाऊ शकतो. आपल्या कार्य व्यवस्थापन प्रणालीवरील डेटावर आधारित आपल्या उत्पादकता सह हे समाकलित करा. ट्वीट्स आणि स्थिती अद्यतनांवर आधारित आपल्या मूडसह हे समाकलित करा. जिमच्या भेटीवर किंवा वजन कमी करण्याच्या आधारावर आपल्या आरोग्यासह समाकलित करा. आधीपासूनच उपलब्ध डेटा आणि त्यात सहजतेने कॅप्चर करता येण्यासह, शक्यता अनंत आहेत.

डेटा सायंटिस्ट कसा असावा

डेटा विज्ञानाच्या करियरमध्ये स्वारस्य आहे? डेटा विज्ञान इतके नवीन आहे म्हणून आम्ही या क्षेत्रातील अंतर्दृष्टीसाठी एका शीर्ष डेटा वैज्ञानिकांना विचारले. जेक पोरवे हे न्यूयॉर्क टाइम्समधील डेटा वैज्ञानिक आहेत आणि डेटाकिंडचे संस्थापक आहेत (मूळतः डेटा विथ बॉर्डर बॉर्डर्स म्हणून ओळखले जातात) जे स्वतंत्रपणे आणि प्रो-बोनो डेटा वैज्ञानिकांसह डेटा सायन्सची गरज असलेल्या ना-नफ्यांशी जुळतात. पोर्टवेकडे संगणक शास्त्रीय पार्श्वभूमी आहे आणि पीएच.डी. यूसीएलए च्या आकडेवारीत. डेटा सायन्समध्ये कसे जायचे, चांगले प्रदर्शन कसे करावे आणि क्षेत्रातील महत्त्वाच्या चुका कशा टाळाव्या याबद्दल त्यांचे काय म्हणणे होते हेरेस.

1. योग्य कौशल्ये मिळवा

पोरवेच्या मते, शेतात उतरल्यामुळे तीन महत्त्वाच्या गोष्टी उकळतात:

  • प्रॅक्टिकल संगणकीय कौशल्ये
  • सांख्यिकी कौशल्ये
  • शिकण्याची इच्छा

"आपल्याला डेटा स्क्रॅप करण्यासाठी स्क्रिप्ट लिहिणे तसेच आपल्या डोक्यात ज्या अल्गोरिदम आहेत त्याचा कोड बनविणे आवश्यक आहे," पोरवे म्हणतात. "आपण तयार करीत असलेले मॉडेल्स किंवा आपण लिहित असलेल्या अल्गोरिदम आपल्या इच्छेप्रमाणे करत आहेत की नाही हे मूल्यांकन करण्यास खरोखर सक्षम असल्यास आपण आपले मूलभूत आकडेवारी (आणि बरेच काही, आदर्शपणे) माहित असले पाहिजेत."

2. जोडणी करा

न्यूयॉर्क टाइम्स आर अँड डी प्रयोगशाळेत सामील होण्यापूर्वी पोर्टवेने मशीन लर्निंग आणि कॉम्प्युटर व्हिजनमध्ये काम केले आणि लँडमाइन्स आणि फ्लाय प्लेन ओळखण्यासाठी रोबोट्स मिळविण्यात बराच वेळ घालवला (किती छान छान आहे ते?). न्यूयॉर्क टाइम्समध्ये नोकरीला उतरुन त्याला त्रास झाला नाही की सोशल मीडियाच्या प्रकाशनातील दुवे मागोवा घेणार्‍या प्रोजेक्ट कॅसकेड या विस्तृत डेटा विज्ञान कार्यात त्याचा विस्तार व्हावा लागला.

पोर्टवे म्हणतात की, क्षेत्रात जाण्यासाठी सर्वात महत्वाची गोष्ट म्हणजे शिकणे होय.

"डेटा सायन्स प्रोजेक्ट वर जा!" पोरवे म्हणतात. "काही डेटा डाऊनलोड करा, काही आर निवडा आणि खेळायला सुरवात करा ... काही डेटा शोधून काढण्यासाठी आपल्याला मार्गदर्शन करण्यासाठी मूलभूत आकडेवारीच्या पुस्तकाबरोबर आर सारखे काहीतरी वापरण्यावर लक्ष केंद्रित करणे आवश्यक आहे. मशीन लर्निंग आणि संगणकीय कौशल्य त्यासह येईल ( अर्थात हा आपल्या भूतकाळातील अनुभवावर अवलंबून आहे - जर तुम्ही आधीच सांख्यिकीविद् असाल तर काही पायथन उचलून घ्या!) "

मग काही कनेक्शन बनवण्याची वेळ आली आहे. पोर्टवे स्थानिक भेट गट गटाची शिफारस करतो - कारण डेटा सायन्स समुदायाचा भाग असल्याने "आपल्याला काय माहित नाही हे जाणून घेण्याचा वेगवान मार्ग आहे." आणि सतत विकसित होत असलेल्या क्षेत्रात, हे महत्त्वाचे आहे.

Get. गेममध्ये जा

पोरवे येथे पीएच.डी. यूसीएलए च्या आकडेवारीत, परंतु चांगले कार्य करण्यासाठी आपल्याला एखाद्याची आवश्यकता नाही असे ते आवर्जून सांगतात.

"हे कदाचित मदत करेल, परंतु स्वत: ला डेटा वैज्ञानिक म्हणण्यास सक्षम होण्यासाठी आपल्याला आणखी पाच वर्षे शाळेत जावे लागेल, असे समजू नका," पोर्टवे म्हणाले.

डेटा विज्ञान हे तुलनेने नवीन क्षेत्र आहे. याचा अर्थ असा की ज्यांना मैदानात उतरायचे आहे त्यांनी मुक्त मनाने त्याकडे जाणे आवश्यक आहे.

"फोरस्क्वेअर येथील डेटा वैज्ञानिक गोल्डमॅन सॅक्समधील डेटा वैज्ञानिकांपेक्षा बरेच वेगळे दिसेल," पोरवे म्हणतात.

4. आपली नवीन भूमिका रॉक करा

डेटा सायन्स हे उद्दीष्टांचे स्पष्टीकरण, गृहिते तपासणे, पुराव्यांचे मूल्यांकन करणे आणि निष्कर्षांचे मूल्यांकन करणे या सर्व गोष्टी आहेत. पण तेथे कोडीचा एक छोटासा तुकडा आहे ज्याकडे बरेच लोक दुर्लक्ष करतात. आपण काय अंदाज करू शकता ते काय आहे? पोरवे यांच्या मते, गुप्त घटक ही गंभीर विचारसरणी आहे.

"हे माझ्यासाठी ख scientists्या वैज्ञानिकांकडून खरोखरच हॅकर्स वेगळे करते," पोरवे म्हणतात. "एखाद्याने मॉडेल बनवताना आणि त्याचा अहवाल योग्य प्रकारे तयार केला गेला असेल तर त्याचा डेटा कुठून आला आहे याविषयी त्यांनी विचार केला नाही याची जाणीव न करता त्यांनी किती वेळा नूतनीकरण केले हे पाहून आपण चकित व्हाल. आपण प्रत्येक चरणावर प्रश्न विचारण्यास सक्षम असणे आवश्यक आहे. आपल्या प्रक्रियेची आणि आपण आलेल्या प्रत्येक क्रमांकाची. "

द रोड टू बिग डेटा

पोरवे म्हणतात की जेव्हा मशीनना स्वत: ला शिकवण्यासाठी मोठ्या प्रमाणात डेटा वापरण्याची क्षमता समजली तेव्हा त्याने त्याचे मन उडवून दिले. त्याची आवड - आणि त्याचे शिक्षण आणि कौशल्ये - यामुळे त्याला डेटा सायन्समधील सर्वोच्च नोकरी मिळविण्यात मदत झाली. आपणास मोठा डेटा रॉक करायचा असेल तर काही पुस्तके घेऊन शिकारी काढा, काही डेटा डाउनलोड करा आणि सुमारे प्ले करणे सुरू करा. कच्च्या डेटाचे ढीग काय होईल हे आपणास माहित नाही.

मुलाखतीच्या पूर्ण उतार्‍यासाठी डेटासायंटिस्ट्स.नेटवर जा.