जीनोम सिक्वेंसिंगसाठी हॅडॉप एक परिपूर्ण सामना का आहे

लेखक: Roger Morrison
निर्मितीची तारीख: 19 सप्टेंबर 2021
अद्यतन तारीख: 5 मे 2024
Anonim
जीनोम सिक्वेंसिंगसाठी हॅडॉप एक परिपूर्ण सामना का आहे - तंत्रज्ञान
जीनोम सिक्वेंसिंगसाठी हॅडॉप एक परिपूर्ण सामना का आहे - तंत्रज्ञान

सामग्री


स्रोत: A3701027 / ड्रीम्सटाईल.कॉम

टेकवे:

जीनोम सिक्वेन्सींगला त्याचा सर्व डेटा हाताळण्यासाठी शक्तिशाली तंत्रज्ञानाची साधने आवश्यक आहेत आणि हॅडॉप हे कार्य करत आहे.

क्लिनिकल जीनोमिक्स हा एक आकर्षक विषय आहे, जेथे द्रुत आणि अचूक निकालावर प्रक्रिया करण्यासाठी लोक अत्याधुनिक तंत्रज्ञानावर काम करत आहेत. बाजारात बरेच जीनोम सिक्वेंसर उपलब्ध आहेत आणि ते सीक्वेन्स डेटाची पेटबाइट्स तयार करीत आहेत, आणि सिक्वेन्सींगमधील वाढीस नजीकच्या काळात डेटाची एक्साबाईट उत्पादन होणार आहे. येथे जटिल जेनोमिक्सच्या कार्याच्या प्रक्रियेसाठी हॅडूप एक योग्य व्यासपीठ आहे. हडूप मोठ्या प्रमाणात माहिती संग्रहित आणि क्रमवारीत ठेवू शकतो आणि अर्थपूर्ण विश्लेषण देखील प्रस्तुत करू शकतो. (यात खरोखर किती डेटा समाविष्ट आहे याची केवळ कल्पना मिळवण्यासाठी अंडरस्टँडिंग बिट्स, बाइट्स आणि त्यांचे गुणाकार वाचा.)

जेनोमिक्सचे वर्तमान आणि भविष्य

आज जीनोम मॅपिंग विकासाच्या शिखरावर पोहोचली आहे. जीनोमिक्स उद्योगाशी संबंधित बर्‍याच लोक उत्सुकतेने फुटत आहेत आणि नवीन संधी स्वत: हून सादर करत असताना उत्तम तंत्रज्ञान ही काळाची गरज आहे. जीनोम सिक्वेंसींग हे खूपच पुनरावृत्ती आणि संसाधन-केंद्रित काम आहे. एकट्या 2013 मध्ये, सुमारे 15 पेटाबाइट डेटा तयार केला गेला आणि केवळ 2 हजार अनुक्रमांकांनी या जबडा-सोडण्याच्या रकमेमध्ये 300 केबी अनुक्रमित मानवी जीनोम डेटाचा समावेश आहे. डेटा उत्पादनांच्या या दरावर, असा अंदाज लावला जाऊ शकतो की २०१ by पर्यंत जवळपास एक एक्बाबाईट डेटा तयार केला जाईल. हे सिक्वेंसरच्या वाढीमुळे होईल, जे प्रति धाव अधिक आणि अधिक डेटा तयार करेल. दुसरे कारण म्हणजे अत्यंत शक्तिशाली आणि कमी किंमतीच्या जीनोम सिक्वेंसींग मशीनचे आगमन. २०० 2008 पासून या मशीनची किंमत सातत्याने कमी होत आहे. हे मार्केटमध्ये धावणा powerful्या पुढील पिढीतील शक्तिशाली मशीनमुळे आहे.


जीनोम मॅपिंग उद्योगाची गरज

कॉम्प्लेक्स अल्गोरिदम मानवी जीनोममधून गोळा केलेल्या डेटाच्या प्रक्रियेसाठी वापरले जातात. मग, ही माहिती संग्रहित करणे आवश्यक आहे. मूळ डेटाच्या तुलनेत भविष्यात त्याचे पुनरावलोकन केले जाऊ शकते. 100 जीबी डेटावर प्रक्रिया करणे आणि संग्रहित करणे हे फार कठीण नाही, विशेषत: जेव्हा आपण अनुक्रम केंद्रांवर कार्यरत शक्तिशाली मशीनसह करत असाल. अभ्यासावरून असे दिसून आले आहे की या प्रकारच्या डेटावर केवळ 1000 सीपीयू तासांवर प्रक्रिया केली जाऊ शकते, म्हणून हे अगदी सोपे आहे. तांत्रिक प्रगतीच्या या दराने, जीनोम उद्योग लवकरच काही सेकंदात हजारो गिगाबाइटवर प्रक्रिया करेल हे उघड आहे.

तथापि, डेटा व्यवस्थापन आणि संचयन तंत्र तितक्या लवकर विकसित होत नाही, त्या मुळे, मौल्यवान डेटाचे मोठ्या प्रमाणात नुकसान होण्याची अपेक्षा आहे. हे खरोखर अवांछनीय आहे, कारण ते मानवी जीनोमिक्समध्ये केलेल्या प्रगतीस गंभीरपणे अडथळा आणेल. तर, कार्यक्षम डेटा व्यवस्थापन तंत्राची आवश्यकता, जी सहजतेने अद्ययावत केली जाऊ शकते, खूप जास्त आहे. हे विशेषतः नजीकच्या भविष्यात प्रभावी ठरू शकते, जिनोम मॅपिंग शक्तिशाली संगणकांसह मोठ्या लॅबमधून लहान रुग्णालये आणि लॅबमध्ये जाईल.


समाधानामध्ये काय अपेक्षित आहे?

ज्या वेगाने नवीन जीनोमिक अनुक्रम तंत्र शोधले जात आहेत आणि विकसित केले आहेत त्याची गती अत्यंत उच्च आहे. मोठी गती दूर करण्याच्या दिशेने एक शक्तिशाली पाऊल म्हणून ही वेग वैद्यकीय शास्त्रासाठी फायदेशीर ठरू शकते. तथापि, ही वेगवान आव्हानात्मक देखील असू शकते.

अनुक्रम प्रकल्पांद्वारे उत्पादित मोठ्या प्रमाणात डेटा व्यवस्थापित करण्याच्या रूपात हे आव्हान आहे. तर, एक प्रभावी निराकरण आवश्यक आहे जे मोठ्या डेटाच्या संचयन आणि प्रक्रियेस मदत करेल. हे समाधान स्वस्त आणि वेगवान असले पाहिजे, तसेच अनुकूलक असतानाही. या समाधानाद्वारे प्रदान केलेले विश्लेषण देखील अचूक आणि स्थिर असले पाहिजे. तर, समस्येचे निराकरण काय आहे? निःसंशयपणे ते हडूप आहे. (हॅडूपच्या वापराबद्दल अधिक माहितीसाठी, सेवा म्हणून बिग डेटा (हडूप) विषयी 5 अंतर्दृष्टी पहा.)

जीनोम सिक्वेंसींगसाठी हाडॉप हा सर्वोत्तम समाधान का आहे

जेनोमिक्स इंडस्ट्रीला काय आवश्यक आहे हा एक उत्कृष्ट समाधान आहे जो डेटा प्रभावीपणे व्यवस्थापित करण्यात, त्यावर प्रक्रिया करण्यास आणि भविष्यातील वापरासाठी ते संचयित करण्यात मदत करू शकतो. हा सोल्यूशन हॅडॉप सॉफ्टवेयरशी एक परिपूर्ण सामना असल्याचे दिसते. तर, हडूपला परिपूर्ण मोठे डेटा व्यवस्थापन सॉफ्टवेअर मानले जाऊ शकते जे जीनोमिक्स उद्योगातील सध्याच्या डेटा संग्रहण तंत्रामध्ये मोठ्या प्रमाणात सुधारणा करू शकते.

हॅडोपच्या रीअल-टाइम क्षमता जीनोम सिक्वेंसरना रिअल टाइममध्ये एकाच वेळी मोठ्या प्रमाणात डेटाचे विश्लेषण आणि संचय करणे शक्य करते. हे डेटाचा भविष्यातील वापर देखील सक्षम करते. हॅडूप बर्‍याच वारसा प्रणाल्यांना विजय मिळवू शकतो, कारण त्यांच्यापेक्षा ते अधिक वेगवान आणि विश्वासार्ह आहे.

कोणतीही दोष नाही, तणाव नाही - आपले जीवन नष्ट न करता जीवन-बदलणारे सॉफ्टवेअर तयार करण्यासाठी चरण चरण बाय चरण

जेव्हा कोणालाही सॉफ्टवेअर गुणवत्तेची काळजी नसते तेव्हा आपण आपली प्रोग्रामिंग कौशल्ये सुधारू शकत नाही.

हडोप काय करू शकते?

हॅडूपमुळे जीनोमिक्स आणि जनुक अनुक्रम क्षेत्रात मोठ्या संख्येने शक्यता आणि संधी उघडल्या आहेत. हॅडॉप समांतर संगणकीय पर्याय ऑफर करते ज्यामुळे वेगवान अनुक्रम शक्य आहे. तसेच, हडोपच्या मॅपरेड्यूस फंक्शनचा वापर करून, मोठ्या संख्येने जीन्स मॅप केल्या जाऊ शकतात. यामुळे, हॅडूप बरोबर अनुक्रम खरोखर "नेक्स्ट-जनर" होईल आणि बरेच कमी क्लिष्ट होईल.

हडूपसाठी संधी

हॅडोपला जीनोम उद्योगात बर्‍याच संधी आहेत, परंतु जीनस अँड डेव्हलपमेंट या जर्नलमधील लिन्डा चिनच्या “कर्करोगाच्या जीनोमिक डेटाची भावना निर्माण करणे” या लेखातून सर्वांत उत्तम आहे. या लेखात, तिने चर्चा केली की आधुनिक जीनोमिक्सने नवीन दरवाजे कसे उघडले आहेत आणि यामुळे कर्करोगाबद्दल जीनोमिक माहिती शोधण्यासारखे बरेच सकारात्मक परिणाम प्राप्त झाले आहेत. यामुळे, आम्ही कर्करोगाचाच उपचार शोधण्याच्या अगदी जवळ आहोत. तथापि, या क्षेत्रात अधिक चांगले संशोधन क्षमता यासाठी थोडे अधिक लक्ष आणि एक शक्तिशाली डेटा व्यवस्थापन अनुप्रयोग आवश्यक आहे. हाडूपला त्याची वेग, सामर्थ्य आणि अचूकता सिद्ध करण्याची ही उत्तम संधी असू शकते.

क्रॉसबो: नेक्स्ट-जनरेशन डेटा मॅनेजमेंट प्लॅटफॉर्म

जीनोम री-सिक्वेंसींगच्या विश्लेषणासाठी बनवलेली सॉफ्टवेअर पाइपलाइन, क्रॉसबो ही एक उत्तम उपाय आहे. हाडिओपमधील अनुक्रमित डेटा संरेखित करण्यासाठी वेगवान अल्गोरिदम दरम्यान एकत्रीकरणाचा परिणाम होता, ज्यास बॉटी म्हणतात, आणि अनुक्रमित डेटाची तुलना आणि परीक्षण करणारी एक शक्तिशाली अल्गोरिदम, म्हणजेच सोपएसएनपी नावाच्या जीनोटाइपर. हे अपाचे हॅडॉपवर तयार केले गेले आहे आणि ते मॅपरेड्यूस फ्रेमवर्कच्या अंमलबजावणीवर आधारित आहे. क्रॉसबो पोर्टेबल, स्केलेबल आहे आणि क्लाउड कंप्यूटिंग टूल म्हणून देखील उपयुक्त आहे.

या शक्तिशाली एकत्रीकरणासह, 10 नोड्स असलेल्या स्थानिक क्लस्टरवर फक्त एक दिवसात संपूर्ण जीनोमची तपासणी केली जाऊ शकते. 40-नोड क्लस्टरसह, प्रक्रिया आणखी वेगवान आहे आणि एकूण किंमतीची किंमत 100 डॉलरपेक्षा कमी असलेल्या तीन तासांत पूर्ण होते! क्रॉसबोच्या अचूकतेची चाचणी घेण्यासाठी केलेल्या अभ्यासात असे दिसून आले आहे की ते प्रत्येक जीनोमची तुलना 99 टक्के अचूकतेसह करू शकते. क्रॉसबोची आणखी एक उपयुक्त वैशिष्ट्य म्हणजे ती ढगांवर चालते. अशा प्रकारे, क्रॉसबो कोणत्याही शक्तिशाली, महागड्या संगणक आणि तंत्रज्ञानाची आवश्यकता नसतानाही हजारो भावी क्रमांकाची केंद्रे जसे की रुग्णालयांप्रमाणे मोठ्या प्रमाणात जीनोम डेटा अनुक्रमित करण्यास सक्षम करेल.

इतर हडूप-आधारित जेनोमिक्स सॉफ्टवेअर

जीनोमिक्सचे जग बदलण्यात हडूपची शक्ती बर्‍याच कंपन्यांनी ओळखली आहे. प्रगत जीनोम अनुक्रमांच्या संभाव्यतेमध्ये टॅप करण्यासाठी त्यांनी हडोपमध्ये योग्य ते बदल केले आहेत. प्रसिद्ध हडोप-आधारित जीनोम सिक्वेंसींग सोल्यूशन्सची काही उदाहरणे खाली दिली आहेत:

  • हडोप-बीएएमः हे एक शक्तिशाली डेटा मॅनेजमेंट टूल आहे जे जीनोमिक्सशी संबंधित विविध क्रियाकलापांसाठी जीनोटाइपिंग सारख्या हॅडोपच्या मॅपड्रिड्यूस फंक्शनचा उपयोग करते. हे बायनरी संरेखन / नकाशा स्वरूपनात कार्य करते.
  • क्लाउडबर्स्टः हे हडूप-आधारित समाधान २०० in मध्ये तयार केले गेले होते. जीनोम अनुक्रमांची तुलना करणे आणि वैयक्तिक जनुकांची मॅपिंग करणे हे अत्यंत कार्यक्षम आहे. हे या हेतूसाठी डिझाइन केलेले प्रथम हडूप-आधारित अनुप्रयोगांपैकी एक आहे.

निष्कर्ष

बिग डेटा आणि जीनोमिक्स इंडस्ट्रीमधील एकीकरण आधुनिक काळात एक वरदान असल्याचे सिद्ध होत आहे. कर्करोगासारख्या अनेक आजारांच्या उपचारांच्या शोधामध्ये हे व्यासपीठ प्रभावी आहेत. जीनोम मॅपिंगद्वारे आढळणारा डेटा अशा रोगांच्या प्रतिबंधात्मक माहितीच्या निर्मितीसाठी वापरला जाऊ शकतो. मोठ्या डेटाच्या आगमनाने जीनोमिक्सच्या जगात एक महत्त्वपूर्ण वळण म्हणून ओळखले जाऊ शकते आणि जर माहितीचा हुशारीने वापर केला गेला तर शक्यतो आरोग्य क्षेत्राच्या व्यापक क्षेत्रातही याचा उपयोग केला जाऊ शकतो. या क्षेत्राचा उन्नत करण्याचा एकमेव मार्ग म्हणजे हडूप सारख्या योग्य डेटा व्यवस्थापन साधनांचा वापर.