डेटा सायन्स की मशीन लर्निंग? हेरेस हा फरक कसा स्पॉट करायचा

लेखक: Laura McKinney
निर्मितीची तारीख: 3 एप्रिल 2021
अद्यतन तारीख: 1 जुलै 2024
Anonim
डेटा सायन्स की मशीन लर्निंग? हेरेस हा फरक कसा स्पॉट करायचा - तंत्रज्ञान
डेटा सायन्स की मशीन लर्निंग? हेरेस हा फरक कसा स्पॉट करायचा - तंत्रज्ञान

सामग्री


स्रोत: एलनूर / ड्रीमस्टाइम.कॉम

टेकवे:

डेटा विज्ञान आणि मशीन शिक्षण मुख्य मार्गांनी भिन्न आहे. काही मार्गांनी, एखाद्यास दुसर्‍याचा सबसेट म्हणून पाहिले जाऊ शकते. सध्याच्या आयटी प्रगतीमध्ये दोघेही महत्त्वाचे आहेत.

कृत्रिम बुद्धिमत्ता आणि डेटा व्यवस्थापनाच्या या नवीन जगात आयटी जगात सामान्यतः वापरल्या जाणार्‍या काही संज्ञांमुळे गोंधळात टाकणे सोपे आहे.

उदाहरणार्थ, डेटा सायन्स आणि मशीन लर्निंगचा एकमेकांशी बरेच संबंध आहे. या शास्त्राचे फक्त उत्तीर्ण ज्ञान असणार्‍या अनेकांना ते एकमेकांपेक्षा वेगळे कसे आहेत हे शोधण्यात अडचण होते हे आश्चर्यकारक नाही.

तत्त्व आणि तंत्रज्ञानाच्या दृष्टिकोनातून, डेटा शिक्षण मशीन मशीनपासून विभक्त करण्याचा उत्तम मार्ग आहे.

डेटा सायन्स अँड मशीन लर्निंग: ब्रॉड अँड नॉरो टर्मिनोलॉजी

सर्व प्रथम, डेटा विज्ञान खरोखर तंत्रज्ञानाची विस्तृत आणि विस्तृत श्रेणी आहे ज्यामध्ये अनेक प्रकारचे प्रकल्प आणि निर्मिती समाविष्ट आहेत. (डेटा सायन्स जॉबमध्ये काय समाविष्ट आहे याविषयी अधिक माहितीसाठी जॉब रोलः डेटा सायंटिस्ट पहा.)


डेटा सायन्स मूलत: मोठ्या डेटासह कार्य करण्याची प्रथा आहे. हा मूरचा कायदा म्हणून उदयास आला आणि अधिक कार्यक्षम स्टोरेज उपकरणांच्या प्रसारामुळे कंपन्या आणि अन्य पक्षांकडून बर्‍याच प्रमाणात डेटा गोळा केला गेला. त्यानंतर, हडूप सारख्या मोठ्या डेटा प्लॅटफॉर्मवर आणि साधनांनी डेटा व्यवस्थापन कसे कार्य करते हे बदलून संगणनास पुनर्निर्देशित करण्यास सुरवात केली. आता, क्लाउड आणि कंटेनरकरणासह तसेच नवीन मॉडेलसह, मोठा डेटा आम्ही कार्य करतो आणि जगतो त्या मार्गांचा प्रमुख ड्रायव्हर बनला आहे.

त्याच्या अगदी सोप्या स्वरूपात डेटा सायन्स हा आपला डेटा साफ करण्यापासून ते परिष्कृत करण्यापासून अंतर्दृष्टीच्या रूपात वापरण्यासाठी ठेवण्यापासून आम्ही व्यवस्थापित करण्याचा मार्ग आहे.

मशीन लर्निंगची व्याख्या खूपच संकुचित आहे. मशीन लर्निंगमध्ये, तंत्रज्ञान डेटा घेते आणि अल्गोरिदमद्वारे ठेवते, "शिक्षण" म्हणून वर्णन केलेल्या मानवी संज्ञानात्मक प्रक्रियेचे अनुकरण करण्यासाठी. दुसर्‍या शब्दांत, डेटा घेतला आणि त्यावर प्रशिक्षण घेतल्यामुळे संगणक स्वतःचे परिणाम प्रदान करण्यास सक्षम आहे , जिथे तंत्रज्ञानाने प्रोग्रामरने घातलेल्या प्रक्रियेतून शिकलेले दिसते.


डेटा सायन्स आणि मशीन लर्निंग स्किल सेट्स

यापैकी कोणत्याही क्षेत्रातील व्यावसायिकांसाठी सर्वात मूल्यवान असलेल्या भिन्न कौशल्यांचा शोध घेणे हा डेटा विज्ञान आणि मशीन लर्निंगचा फरक करण्याचा दुसरा मार्ग आहे.

कोणतीही दोष नाही, तणाव नाही - आपले जीवन नष्ट न करता जीवन-बदलणारे सॉफ्टवेअर तयार करण्यासाठी चरण चरण बाय चरण

जेव्हा कोणालाही सॉफ्टवेअर गुणवत्तेची काळजी नसते तेव्हा आपण आपली प्रोग्रामिंग कौशल्ये सुधारू शकत नाही.

असा एक सामान्य सहमती आहे की डेटा वैज्ञानिकांना गहन विश्लेषणात्मक आणि गणिताच्या कौशल्यांचा फायदा होतो, डेटाबेस तंत्रज्ञानाचा अनुभव आहे आणि प्रोग्रामिंग भाषेचे ज्ञान जसे अजगर किंवा इतर पॅकेजेस जे मोठ्या डेटाचे विश्लेषण करण्यासाठी वापरले जातात.

सिंपलीलेरन येथे श्रीहरी सासिकुमार लिहितात: “ज्या कोणालाही (डेटा सायन्स) सशक्त करिअर बनविण्यात रस आहे त्याने तीन विभागांमध्ये .नालिटिक्स, प्रोग्रामिंग आणि डोमेन ज्ञान कडून कौशल्य प्राप्त केले पाहिजे. “एक पातळी सखोल जाणे, खालील कौशल्ये आपल्याला डेटा वैज्ञानिक म्हणून कोनाडा तयार करण्यास मदत करतील: पायथन, एसएएस, आर (आणि) स्काला यांचे मजबूत ज्ञान, एसक्यूएल डेटाबेस कोडींगमधील अनुभव, अ-संरचित डेटासह कार्य करण्याची क्षमता व्हिडिओ आणि सोशल मीडिया सारख्या विविध स्त्रोतांना, एकाधिक विश्लेषणात्मक कार्ये समजतात (आणि) मशीन शिक्षणाचे ज्ञान. "

मशीन लर्निंगच्या बाजूने, तज्ञ बहुतेक वेळेस मशीन लर्निंग अभियंताच्या टूलकिटमधील उपयुक्त साधने म्हणून डेटा मॉडेलिंग कौशल्ये, संभाव्यता आणि आकडेवारीचे ज्ञान आणि विस्तृत प्रोग्रामिंग कौशल्यांचा उल्लेख करतात.

मशीन शिक्षण कसे स्पॉट करावे

येथे महत्त्वाची गोष्ट अशी आहे की सर्व प्रकारच्या गोष्टींमध्ये डेटा सायन्सचे कार्य असते, परंतु संगणकाच्या इनपुटमधून शिकण्यास मदत करण्यासाठी आपल्याकडे कठोर पथ्ये तयार केल्याशिवाय हे मशीन शिक्षण नाही.

जेव्हा ते त्या ठिकाणी असते, तेव्हा हे आश्चर्यकारकपणे सक्षम अशा काही सिस्टीमसाठी बनवते ज्याचा आपल्या जीवनावर व्यापक-परिणाम होऊ शकतो.

Machineमेझॉनचे संस्थापक जेफ बेझोस यांनी असे म्हटले आहे की, “मशीन मशीनद्वारे आपण जे काही करतो त्यातील बहुतेक भाग पृष्ठभागाच्या खाली होते.” “मशीन लर्निंग डिमांड अंदाज, प्रॉडक्ट सर्च रँकिंग, प्रोडक्ट अँड डील शिफारसी, मर्चेंडायझिंग प्लेसमेंट्स, फसवणूक शोधणे, भाषांतर करणे आणि बरेच काही यासाठी आमच्या अल्गोरिदम चालवते. जरी कमी दृश्यमान असले तरी, मशीन शिक्षणावरील बराचसा प्रभाव या प्रकारचा असेल - शांतपणे परंतु अर्थपूर्णपणे कोर ऑपरेशन्समध्ये सुधारणा. "

येथे सर्वात उपयुक्त उदाहरणांपैकी एक म्हणजे न्यूरल नेटवर्कचा उद्भव - ही मशीन शिक्षण प्रक्रिया स्थापित करण्याची एक सामान्य आणि लोकप्रिय पद्धत आहे.

त्याच्या सर्वात मूलभूत स्वरुपात, तंत्रिका नेटवर्क कृत्रिम न्यूरॉन्सच्या थरांनी बनलेले आहे. प्रत्येक वैयक्तिक कृत्रिम न्यूरॉनची कार्यक्षमता जैविक न्यूरॉनच्या बरोबरी असते - परंतु synapses आणि dendrites च्या ऐवजी त्यात इनपुट, एक सक्रियकरण फंक्शन आणि अंतिम आउटपुट असतात.

तंत्रिका नेटवर्क मानवी मेंदूप्रमाणे कार्य करण्यासाठी बनविलेले असते आणि मशीन शिक्षण व्यावसायिक या मॉडेलचा उपयोग मशीन लर्निंग रिझल्ट तयार करण्यासाठी करतात.

तथापि, मशीन शिक्षण करण्याचा हा एकमेव मार्ग नाही. आणखी काही प्राथमिक मशीन लर्निंग प्रोजेक्ट्समध्ये संगणकास विस्तृत छायाचित्रे दाखवणे (किंवा इतर कच्चा डेटा पुरवणे) समाविष्ट करणे, पर्यवेक्षी मशीन शिक्षण आणि लेबल डेटा वापरण्याच्या प्रक्रियेद्वारे कल्पना इनपुट करणे आणि अखेरीस संगणकात फरक करणे सक्षम करणे समाविष्ट आहे. व्हिज्युअल फील्डमधील विविध आकार किंवा आयटम. (मशीन लर्निंगच्या मूलभूत गोष्टींसाठी मशीन लर्निंग १०१ पहा.)

दोन कटिंग-एज शिस्त

शेवटी, मशीन लर्निंग डेटा सायन्सचा एक मोलाचा भाग आहे. परंतु डेटा विज्ञान वेस्टर फ्रंटियर आणि मशीन शिक्षण घेणार्‍या कोनचे प्रतिनिधित्व करते.

एक प्रकारे, आपण असे म्हणू शकता की मशीन शिक्षण मोठ्या डेटाशिवाय कधीही होणार नाही. बिग डेटाने स्वतः मशीन लर्निंग तयार केले नाही, तथापि - त्याऐवजी, आम्ही एकत्रितपणे इतका डेटा एकत्रित केला की आम्हाला त्यासह काय करावे हे जवळजवळ माहित नव्हते, वरच्या मनाने या बायो-सिम्युलेटिंग प्रक्रियेसह सुपरचार्ज केलेला मार्ग तयार केला अंतर्दृष्टी प्रदान.

येथे आणखी एक चांगली गोष्ट लक्षात ठेवणे आवश्यक आहे ती म्हणजे डेटा विज्ञान दोन प्रमुख मार्गांनी लागू केले जाऊ शकते - आम्ही मशीन शिक्षण आणि कृत्रिम बुद्धिमत्ता स्वीकारू शकतो, संगणकांनी आपल्यासाठी विचार करू देतो किंवा डेटा विज्ञान आपण मानवी-केंद्रित दृष्टिकोनातून परत आणू शकतो जेथे संगणक फक्त परिणाम सादर करतो आणि आपण माणूस म्हणून निर्णय घेतो.

हे तंत्रज्ञानाच्या कोणत्या मार्गांनी आपण वापरतो त्याविषयी अधिक सशक्त लेखांकन मागवण्यासाठी हे आजच्या काही प्रमुख नवनिर्मितींसह काही तज्ञांचे नेतृत्व करीत आहे.

"(एआय) जवळजवळ कोणालाही माहित नसलेल्यापेक्षा अधिक प्रमाणात सक्षम आहे आणि सुधारण्याचे प्रमाण घाताळ आहे," मशीन शिक्षण आणि एआय कार्यक्रमांवर देखरेखीची आवश्यकता असल्याचे चेतावणी देताना एलोन मस्क म्हणाले.

काहीही असो, डेटा विज्ञान आणि मशीन शिक्षण हे दोन्ही तंत्रज्ञान आज आपण तंत्रज्ञानात करीत असलेल्या प्रगतीचा मुख्य भाग आहेत.