कुडू: हडूप इकोसिस्टममधील गेम चेंजर?

लेखक: Roger Morrison
निर्मितीची तारीख: 21 सप्टेंबर 2021
अद्यतन तारीख: 5 मे 2024
Anonim
कुडू: हडूप इकोसिस्टममधील गेम चेंजर? - तंत्रज्ञान
कुडू: हडूप इकोसिस्टममधील गेम चेंजर? - तंत्रज्ञान

सामग्री


स्रोत: sगॅन्ड्र्यू / ड्रीमस्टाइम.कॉम

टेकवे:

कुडू हा एक मुक्त-स्रोत प्रकल्प आहे जो स्टोरेज अधिक कार्यक्षमतेने व्यवस्थापित करण्यात मदत करतो.

कुडू हा एक नवीन मुक्त-स्रोत प्रकल्प आहे जो अद्यतनित करण्यायोग्य संचयन प्रदान करतो. हे एचडीएफएस / एचबेसचे पूरक आहे, जे अनुक्रमिक आणि केवळ-वाचनीय स्टोरेज प्रदान करते. कुडू वेगवान डेटावरील वेगवान विश्लेषणासाठी अधिक योग्य आहे, जे सध्या व्यवसायाची मागणी आहे. तर कुडू हा आणखी एक हडूप इकोसिस्टम प्रोजेक्ट नाही तर त्याऐवजी बाजार बदलण्याची क्षमता आहे. (हॅडोपच्या अधिक माहितीसाठी, आपल्याला जाणून आणि समजून घेण्याची आवश्यकता असलेल्या 10 अत्यंत महत्त्वाच्या हडूप अटी पहा.)

कुडू म्हणजे काय?

कुडू ही एक विशेष प्रकारची स्टोरेज सिस्टम आहे जी संरचित डेटा सारण्यांच्या रूपात संग्रहित करते. प्रत्येक सारणीमध्ये पूर्वनिर्धारित केलेल्या स्तंभांची संख्या असते. त्या प्रत्येकाकडे एक प्राथमिक की असते जी प्रत्यक्षात त्या टेबलच्या एक किंवा अधिक स्तंभांचा समूह असते. ही प्राथमिक की निर्बंध जोडण्यासाठी आणि स्तंभ सुरक्षित करण्यासाठी तयार केली आहे आणि अनुक्रमणिका म्हणून देखील कार्य करते, जे अद्ययावत करणे आणि हटविणे सुलभ करते. या सारण्या टॅब्लेट नावाच्या डेटा सबटची एक मालिका आहेत.


कुडूस सद्य स्थिती काय आहे?

कुडू खरोखरच विकसित झाला आहे आणि बर्‍याच वैशिष्ट्यांसह यापूर्वी बनला आहे. तथापि, अद्याप त्यास काही पॉलिशिंगची आवश्यकता असेल, जे वापरकर्त्यांनी सुचवल्यास आणि काही बदल केल्यास ते अधिक सहजतेने केले जाऊ शकते.

कुडू पूर्णपणे ओपन सोर्स आहे आणि त्यात अपाचे सॉफ्टवेअर परवाना 2.0 आहे. हे अपाचे सबमिट करण्याच्या उद्देशाने आहे, जेणेकरून ते अपाचे इनक्यूबेटर प्रकल्प म्हणून विकसित केले जाऊ शकेल. हे त्याच्या विकासास आणखी वेगवान गतीने आणि पुढे त्याचे प्रेक्षक वाढविण्यास अनुमती देईल. ठराविक वेळेनंतर, कुडूचा विकास सार्वजनिक आणि पारदर्शकपणे केला जाईल. अ‍ॅटस्केल, झिओमी, इंटेल आणि स्प्लिस मशीन सारख्या बर्‍याच कंपन्या कुडूच्या विकासात हातभार लावण्यासाठी एकत्र आल्या आहेत. कुडूचा देखील एक मोठा समुदाय आहे, जिथे मोठ्या संख्येने प्रेक्षक आधीच त्यांच्या सूचना आणि योगदान देत आहेत. तर, हेच लोक आहेत जे कुडूच्या विकासास पुढे नेत आहेत.

कुडू एचडीएफएस / एचबेसची पूर्तता कशी करू शकेल?

कुडू म्हणजे एचडीएफएस / एचबेसची बदली होणार नाही. हे वास्तविकतः एचबेस आणि एचएफडीएस या दोहोंचे समर्थन करण्यासाठी आणि त्यांची वैशिष्ट्ये वाढविण्यासाठी त्यांच्या बाजूने चालविण्यासाठी डिझाइन केलेले आहे. याचे कारण असे की एचबॅस आणि एचडीएफएसमध्ये अद्याप बरीच वैशिष्ट्ये आहेत जी विशिष्ट मशीनवरील कुडूपेक्षा अधिक शक्तिशाली बनवतात. एकूणच, अशा यंत्रांना या प्रणालींकडून अधिक लाभ मिळतील.


कुडू फ्रेमवर्कची वैशिष्ट्ये

कुडू फ्रेमवर्कची मुख्य वैशिष्ट्ये खालीलप्रमाणे आहेतः

  • सारणीच्या स्तंभांचे अत्यंत वेगवान स्कॅन - पार्क्वेट आणि ओआरसीफाईल सारख्या उत्कृष्ट डेटा स्वरुपासाठी सर्वोत्तम स्कॅनिंग प्रक्रियेची आवश्यकता असते, ज्यास कुडू यांनी अचूकपणे संबोधित केले. अशा स्वरूपांना द्रुत स्कॅन आवश्यक आहेत जे केवळ स्तंभ डेटा योग्यरित्या एन्कोड केल्यावरच उद्भवू शकतात.
  • कार्यक्षमतेची विश्वसनीयता - हडूपमधील बर्‍याच त्रुटी आणि अंतरांमुळे कुडू फ्रेमवर्क हडूपची संपूर्ण विश्वासार्हता वाढवते.
  • हडूप - सोबत सहज कार्य करणे - अधिक कार्यक्षमतेसाठी कुडू सहजपणे हडूप आणि त्याच्या भिन्न घटकांसह समाकलित केले जाऊ शकते.
  • पूर्णपणे ओपन सोर्स - कुडू ही अपाचे 2.0 परवान्यासह मुक्त-स्रोत प्रणाली आहे. यात विविध कंपन्या आणि पार्श्वभूमीवरील विकसकांचा मोठा समुदाय आहे जो नियमितपणे अद्यतनित करतो आणि बदलांसाठी सूचना प्रदान करतो.

कुडू हडूप इकोसिस्टम कसा बदलू शकेल?

कुडू हडूपच्या इकोसिस्टममध्ये बसण्यासाठी आणि तिची वैशिष्ट्ये वर्धित करण्यासाठी तयार केली गेली होती. हे मॅड्रिड्यूस, एचबेस आणि एचडीएफएस सारख्या हडूपच्या काही प्रमुख घटकांसह देखील समाकलित होऊ शकते. नकाशाच्या कामात एकतर डेटा प्रदान केला जाऊ शकतो किंवा कुडू सारण्यांमधून डेटा घेतला जाऊ शकतो. ही वैशिष्ट्ये स्पार्कमध्ये देखील वापरली जाऊ शकतात. स्पेशल लेयर स्पार्क एसक्यूएल आणि डेटाफ्रेम सारख्या काही स्पार्क घटकांना कुडूवर प्रवेश करण्यायोग्य बनवते. या वैशिष्ट्यांऐवजी कुडू इतका विकसित झाला नसला तरी, असा अंदाज आहे की काही वर्षांनंतर, तसे करण्यास पुरेसे विकसित केले जाईल. तोपर्यंत, हडूप आणि कुडू यांच्यामधील एकत्रिकरण खरोखर उपयुक्त आहे आणि हदोपच्या इकोसिस्टममधील मोठी पोकळी भरू शकेल. (अपाचे स्पार्कबद्दल अधिक जाणून घेण्यासाठी, अपाचे स्पार्क रॅपिड अनुप्रयोग विकासात कशी मदत करते ते पहा.)

कुडू विविध ठिकाणी लागू केले जाऊ शकते. अशा ठिकाणांची काही उदाहरणे खाली दिली आहेत:

कोणतीही दोष नाही, तणाव नाही - आपले जीवन नष्ट न करता जीवन-बदलणारे सॉफ्टवेअर तयार करण्यासाठी चरण चरण बाय चरण

जेव्हा कोणालाही सॉफ्टवेअर गुणवत्तेची काळजी नसते तेव्हा आपण आपली प्रोग्रामिंग कौशल्ये सुधारू शकत नाही.

  • नजीकच्या काळात स्ट्रीमिंग इनपुट - ज्या ठिकाणी इनपुटला शक्य तितक्या लवकर प्राप्त करणे आवश्यक आहे, कुडू एक उल्लेखनीय कार्य करू शकते. अशा ठिकाणचे उदाहरण व्यवसायांमध्ये आहे, जिथे विविध स्त्रोतांमधून मोठ्या प्रमाणात गतीशील डेटा पूर येतो आणि वास्तविक वेळात द्रुतपणे उपलब्ध करुन देण्याची आवश्यकता असते.
  • वेगवेगळ्या अ‍ॅक्सेस नमुन्यांसह टाइम-सिरीज़ अनुप्रयोग - कुडू वेळ-मालिका-आधारित अनुप्रयोगांसाठी योग्य आहे कारण टेबल सेट करणे आणि त्याचा वापर करून ते स्कॅन करणे सोपे आहे. अशा वापराचे उदाहरण डिपार्टमेंट स्टोअरमध्ये आहे, जिथे जुन्या डेटाची द्रुत शोधणे आवश्यक आहे आणि भविष्यात उत्पादनांच्या लोकप्रियतेचा अंदाज लावण्यासाठी त्यावर प्रक्रिया केली पाहिजे.
  • लीगेसी सिस्टम - बर्‍याच कंपन्या ज्या विविध स्त्रोतांकडून डेटा मिळवतात आणि वेगवेगळ्या वर्कस्टेशन्समध्ये ती साठवतात त्यांना कुडूसह घरी वाटेल. कुडू अत्यंत वेगवान आहे आणि सर्व मशीनवरील डेटावर प्रक्रिया करण्यासाठी इम्पालाशी प्रभावीपणे समाकलित होऊ शकतो.
  • भविष्यवाणी करणारे मॉडेलिंग - मॉडेलिंगसाठी चांगले व्यासपीठ हवे असलेले डेटा शास्त्रज्ञ कुडू वापरू शकतात. त्यात भरलेल्या प्रत्येक डेटामधून कुडू शिकू शकतो. काय होते हे पाहण्यासाठी शास्त्रज्ञ वारंवार मॉडेल चालवू आणि पुन्हा चालवू शकतात.

निष्कर्ष

जरी कुडू अद्याप विकासाच्या अवस्थेत आहे, एचडीएफएस आणि एचबेस सारख्या मानक हडूप घटकांसाठी चांगली अ‍ॅड-इन होण्याची पर्याप्त क्षमता आहे. सर्व अंतर भरून आणि आणखी काही वैशिष्ट्ये जोडून हडूप इकोसिस्टममध्ये पूर्णपणे बदल करण्याची क्षमता आहे. हे खूप वेगवान आणि सामर्थ्यवान देखील आहे आणि डेटाचे मोठ्या सारण्यांचे त्वरित विश्लेषण आणि संचय करण्यात मदत करू शकते. तथापि, अधिक कार्यक्षमतेने वापरण्यासाठी अजून काही कामे बाकी आहेत.