डेटा मायनिंग आणि डेटा सायन्स शिकण्यासाठीच्या 7 पायps्या

लेखक: Eugene Taylor
निर्मितीची तारीख: 12 ऑगस्ट 2021
अद्यतन तारीख: 22 जून 2024
Anonim
डेटा मायनिंग आणि डेटा सायन्स शिकण्यासाठीच्या 7 पायps्या - तंत्रज्ञान
डेटा मायनिंग आणि डेटा सायन्स शिकण्यासाठीच्या 7 पायps्या - तंत्रज्ञान

सामग्री


स्रोत: पॉल फ्लीट / ड्रीमस्टाइम.कॉम

टेकवे:

डेटा सायन्स उत्तम प्रकारे शिकून केले जाते, परंतु आकडेवारीचा एक चांगला पाया आणि मशीन शिक्षण देखील महत्त्वपूर्ण आहे.

डेटा खनन आणि डेटा विज्ञान कसे शिकावे याबद्दल मला वारंवार विचारले जाते. येथे माझा सारांश आहे.

आपण डेटा खनन आणि डेटा विज्ञान चांगल्या प्रकारे शिकू शकता, म्हणून शक्य तितक्या लवकर डेटाचे विश्लेषण सुरू करा! तथापि, सिद्धांत जाणून घेण्यास विसरू नका, कारण आपण काय करीत आहात हे समजून घेण्यासाठी आणि मोठ्या डेटाच्या आवाजामध्ये मूल्यांच्या वास्तविक गाठी शोधण्यासाठी आपल्याला एक चांगला सांख्यिकीय आणि मशीन लर्निंग फाउंडेशन आवश्यक आहे.

डेटा खाण आणि डेटा विज्ञान शिकण्यासाठी येथे सात चरण आहेत. ते क्रमांकित असले तरी आपण ते समांतर किंवा वेगळ्या क्रमाने करू शकता.

  1. भाषा: आर, पायथन आणि एसक्यूएल जाणून घ्या
  2. साधने: डेटा खाण आणि व्हिज्युअलायझेशन साधने कशी वापरायची ते जाणून घ्या
  3. पुस्तके: मूलभूत गोष्टी समजण्यासाठी प्रास्ताविक पुस्तके वाचा
  4. शिक्षण: वेबिनार पहा, अभ्यासक्रम घ्या आणि प्रमाणपत्र किंवा डेटा विज्ञानाची पदवी विचारात घ्या (डेटा सायंटिस्टचे पालन पोषण कसे करावे याबद्दल बेन लॉरिकासमध्ये अधिक वाचा.)
  5. डेटा: उपलब्ध डेटा संसाधने तपासा आणि तेथे काहीतरी शोधा
  6. स्पर्धा: डेटा खाण स्पर्धांमध्ये भाग घ्या
  7. सामाजिक नेटवर्क, गट आणि मीटिंगद्वारे अन्य डेटा वैज्ञानिकांशी संवाद साधा

या लेखात मी डेटा खाण आणि डेटा विज्ञान परस्पर बदलतो. माझे सादरीकरण, Industryनालिटिक्स इंडस्ट्री विहंगावलोकन पहा, जिथे मी सांख्यिकी, ज्ञान शोध, डेटा खाण, भविष्यवाणी विश्लेषणे, डेटा विज्ञान आणि मोठा डेटा यासारख्या भिन्न संज्ञेच्या उत्क्रांती आणि लोकप्रियतेकडे पाहतो.


1. भाषा शिकणे

अलीकडील केडनूगेट्स पोलमध्ये असे आढळले की डेटा खनन करण्यासाठी सर्वात लोकप्रिय भाषा म्हणजे आर, पायथन आणि एसक्यूएल. प्रत्येकासाठी बर्‍याच स्त्रोत आहेत, उदाहरणार्थः

  • आर सह डेटा सायन्स वर नि: शुल्क ई-बुक
  • डेटा सायन्ससाठी पायथनसह प्रारंभ करणे
  • डेटा अ‍ॅनालिसिससाठी पायथन: रिअल वर्ल्ड डेटासाठी चपळ टूल्स
  • एक अनिवार्य पायथन: डेटा सायन्सला डेटा सोर्सिंग
  • डब्ल्यू 3 शाळा एस क्यू एल शिकत आहेत

२. साधने: डेटा मायनिंग, डेटा सायन्स आणि व्हिज्युअलायझेशन सॉफ्टवेअर

भिन्न कार्यांसाठी अनेक डेटा खाण साधने आहेत, परंतु डेटा विश्लेषणाच्या संपूर्ण प्रक्रियेस पाठिंबा देणारा डेटा खनन संच कसा वापरायचा हे शिकणे चांगले. आपण केएनआयएमई, रॅपिडमिनर आणि वेका सारख्या मुक्त-स्त्रोतासह (विनामूल्य) साधनांसह प्रारंभ करू शकता.

तथापि, बर्‍याच jobsनालिटिक्स जॉबसाठी आपल्याला एसएएस माहित असणे आवश्यक आहे, जे आघाडीचे व्यावसायिक साधन आहे आणि व्यापकपणे वापरले जाते. इतर लोकप्रिय ticsनालिटिक्स आणि डेटा मायनिंग सॉफ्टवेअरमध्ये मॅटलाब, स्टॅटसॉफ्ट स्टॅटिस्टीका, मायक्रोसॉफ्ट एस क्यू एल सर्व्हर, झांकी, आयबीएम एसपीएसएस मॉडेलर आणि रॅटल यांचा समावेश आहे.


कोणतीही दोष नाही, तणाव नाही - आपले जीवन नष्ट न करता जीवन-बदलणारे सॉफ्टवेअर तयार करण्यासाठी चरण चरण बाय चरण

जेव्हा कोणालाही सॉफ्टवेअर गुणवत्तेची काळजी नसते तेव्हा आपण आपली प्रोग्रामिंग कौशल्ये सुधारू शकत नाही.

व्हिज्युअलायझेशन कोणत्याही डेटा विश्लेषणाचा एक आवश्यक भाग आहे. मायक्रोसॉफ्ट एक्सेल (अनेक सोप्या कार्यांसाठी चांगले), आर ग्राफिक्स, (विशेषत: ggplot2), आणि झांकी - व्हिज्युअलायझेशनसाठी एक उत्कृष्ट पॅकेज कसे वापरावे ते शिका. इतर चांगल्या व्हिज्युअलायझेशन टूल्समध्ये टीआयबीसीओ स्पॉटफायर आणि मिनर 3 डीचा समावेश आहे.

3. पुस्तके

बरीच डेटा खाण आणि डेटा सायन्सची पुस्तके उपलब्ध आहेत, परंतु आपण या तपासू शकता:

  • डेटा खनन आणि विश्लेषण: मोहम्मद झकी आणि वॅग्नर मीरा जूनियर यांनी मूलभूत संकल्पना आणि अल्गोरिदम, विनामूल्य पीडीएफ डाउनलोड (मसुदा)
  • डेटा खननः इका विटेन, आयब फ्रँक आणि मार्क हॉल यांचे व्यावहारिक मशीन शिक्षण साधने व तंत्रे
  • ट्रेटर हॅस्टी, रॉबर्ट टिबशिरानी, ​​जेरोम फ्रीडमॅन यांनी सांख्यिकीय शिक्षण, डेटा खनन, अनुमान आणि भविष्यवाणीचे घटक. गणिताभिमुख एक उत्तम परिचय
  • लायनबुक: रॉबर्टो बट्टी आणि मॉरो ब्रुनाटो यांचे लर्निंग आणि इंटेलिजेंट ऑप्टिमायझेशन, वेबवर विनामूल्य उपलब्ध, अध्याय अध्याय
  • राजारामन, जे.उल्लमन यांनी लिहिलेल्या मासिव डेटासीट्स बुकचे मायनिंग
  • स्टॅटसॉफ्ट इलेक्ट्रॉनिक आकडेवारीच्या पुस्तकात (विनामूल्य) अनेक डेटा खाण विषयांचा समावेश आहे

Education. शिक्षण: वेबिनार, अभ्यासक्रम, प्रमाणपत्रे व पदवी

विश्लेषक, मोठा डेटा, डेटा खनन आणि डेटा विज्ञानाच्या नवीनतम विषयांवर बर्‍याच विनामूल्य वेबिनार आणि वेबकास्ट पाहून आपण प्रारंभ करू शकता.

येथे बरेच ऑनलाईन कोर्सेसदेखील आहेत, लहान व दीर्घ, त्यापैकी बरेच विनामूल्य आहेत. (केडीनगेट्स ऑनलाइन शिक्षण निर्देशिका पहा.)

हे अभ्यासक्रम विशेषत: तपासा.

  • अ‍ॅन्ड्र्यू एनजी द्वारा शिकवलेले कोर्सेरा येथे मशीन लर्निंग
  • डेटाटे एडीएक्समधून शिक्षण, कॅलटेकचे प्रोफेसर यासर अबू-मुस्तफा यांनी शिकवले
  • सिराकुज आयस्कूल वरुन अप्लाइड डेटा सायन्स मध्ये ऑनलाईन कोर्स उघडा
  • Weka सह डेटा खनन, विनामूल्य ऑनलाइन कोर्स
  • माझ्या डेटा मायनिंग कोर्सच्या विनामूल्य ऑनलाइन स्लाइड्स देखील तपासा, डेटा मायनिंगचा सेमेस्टर-लांबीचा परिचयात्मक कोर्स

अखेरीस डेटा मायनिंगमध्ये प्रमाणपत्रे आणि डेटा सायन्स किंवा मास्टर डिग्रीसारख्या प्रगत पदवी जसे की विज्ञान शाखेत पदवी मिळविण्याचा विचार करा.

5. डेटा

आपल्याला विश्लेषण करण्यासाठी डेटाची आवश्यकता असेल - डेटा मायनिंगसाठी डेटासेटची केडीग्नट्स निर्देशिका पहा, यासह:

  • सरकार, फेडरल, राज्य, शहर, स्थानिक आणि सार्वजनिक डेटा साइट्स आणि पोर्टल
  • डेटा एपीआय, हब, बाजारपेठ, प्लॅटफॉर्म, पोर्टल आणि शोध इंजिन
  • विनामूल्य सार्वजनिक डेटासेट

6. स्पर्धा

पुन्हा, आपण हे करूनच चांगले शिकू शकाल, म्हणून काग्ले स्पर्धांमध्ये भाग घ्या. नवशिक्या स्पर्धांसह प्रारंभ करा, जसे मशीन लर्निंगचा वापर करून टायटॅनिक सर्व्हायवलची भविष्यवाणी करणे.

7. संवाद: सभा, गट आणि सामाजिक नेटवर्क

आपण बर्‍याच समवयस्क गटात सामील होऊ शकता. विश्लेषणे, मोठा डेटा, डेटा खनन आणि डेटा विज्ञानासाठी शीर्ष 30 लिंक्डइन समूह पहा.

Ticनालिटिकाब्रिज हा विश्लेषण आणि डेटा विज्ञानासाठी सक्रिय समुदाय आहे.

आपण विश्लेषणे, बिग डेटा, डेटा खनन, डेटा विज्ञान आणि ज्ञान शोध यावर बर्‍याच मीटिंग्ज आणि परिषदांमध्ये उपस्थित राहू शकता.

तसेच, एसीएम सिग्केडीडीमध्ये सामील होण्याचा विचार करा, जे वार्षिक केडीडी परिषद - क्षेत्रातील अग्रगण्य संशोधन परिषद आयोजित करते.

हा लेख केडीनुगेट्स डॉट कॉमवरून आला आहे. हा लेखकाच्या परवानगीने वापरला गेला आहे.