आवाज ओळख तंत्रज्ञान: उपयुक्त किंवा वेदनादायक?

लेखक: Judy Howell
निर्मितीची तारीख: 28 जुलै 2021
अद्यतन तारीख: 1 जुलै 2024
Anonim
स्मार्ट हाउस {मजेदार व्यावसायिक}
व्हिडिओ: स्मार्ट हाउस {मजेदार व्यावसायिक}

सामग्री


टेकवे:

संभाषणात्मक इलेक्ट्रॉनिक्सशी संवाद साधणे हे सामान्यपणे - आणि आवश्यक होत आहे. परंतु आतापर्यंत, निकाल निश्चितपणे मिसळलेले आहेत.

आपण कधी मदत मागण्यासाठी किंवा आपले बिल भरण्यासाठी एखाद्या कंपनीला बोलविले आहे का, केवळ आपल्याशी संभाषण करू इच्छित असलेल्या आनंददायक रेकॉर्ड केलेल्या आवाजाने स्वागत केले आहे - परंतु आपण जे बोलत आहात त्यातील निम्मे ते समजू शकत नाही? किंवा कदाचित आपल्याकडे आयफोन आहे आणि सिरी प्रथम चांगली सहयोगी असल्यासारखी वाटत होती, परंतु आपल्या लक्षात आले की कधीकधी (ठीक आहे, प्रामाणिकपणे बोलू द्या, बहुतेक वेळा) तिला ते मिळत नाही? व्हॉईस रेकग्निशन टेक्नॉलॉजी (व्हीआरटी), ज्याला स्पीच-टू- म्हणून ओळखले जाते, एक सामान्य सापळ्यात पडते: यात आश्चर्यकारकपणे थंड होण्याची क्षमता असते (आणि मुलगा, आम्ही त्यासाठी मूळ आहे), परंतु बर्‍याचदा, दात-पीसण्याचा व्यायाम निराशा मध्ये.

एकदा विज्ञान कल्पनेच्या क्षेत्राशी संबंधित असलेली कल्पना, आवाज प्रयोग ओळख १ recognition s० च्या दशकापासूनच वाढली आहे, जेव्हा बेल प्रयोगशाळा ऑड्रे सिस्टम एकाच आवाजात बोलले जाणारे अंक ओळखण्यासाठी डिझाइन केली गेली होती, आता आपण संभाषणात्मक इलेक्ट्रॉनिक्सच्या आधुनिक नेटवर्कवर दररोज - मिश्रित परिणामांसह.

मानवाशी बोलण्यासाठी, कृपया 0 दाबा

आजचे बरेच व्यवसाय आता ग्राहक सेवा कॉल हाताळण्यासाठी इंटरएक्टिव व्हॉईस रिस्पॉन्स (आयव्हीआर) नावाच्या सिस्टम वापरतात. सर्वात सामान्य वापर व्हॉइस-नेव्हिगेटेड मेनूसाठी आहे, परंतु काही कंपन्या आयव्हीआर सिस्टम वापरतात ज्या ग्राहकांच्या खात्यात माहिती मिळवू शकतात आणि किरकोळ प्रश्नांची उत्तरे देऊ शकतात. मेनू आयव्हीआर सॉफ्टवेअरमध्ये सामान्यत: मर्यादित शब्दसंग्रह असते, जी "होय," "नाही" आणि संख्या मर्यादित असू शकते. अधिक क्लिष्ट सिस्टम कंपनी-विशिष्ट शब्द आणि वाक्ये ओळखू शकतात.

या प्रणाली अधिक लोकप्रिय होत आहेत - किमान व्यवसायांसाठी - एका सोप्या कारणास्तव: ते स्वस्त आहेत. वॉल स्ट्रीट जर्नलच्या २०१० च्या अहवालानुसार एजंटपर्यंत पोहोचणारा सामान्य ग्राहक कॉलची किंमत $ 3 ते $ 9 च्या दरम्यान असते, तर स्वयंचलित सिस्टमद्वारे हाताळलेल्या कॉलची किंमत फक्त पाच ते सात सेंट असते. आणि अर्थातच, संगणक प्रोग्राम कंटाळवाणे, आजारी पडणे किंवा कॉल करणे किंवा ग्राहकांमुळे निराश होणे (ग्राहक नक्कीच त्यांच्यापासून निराश झाले आहेत!).

सुदैवाने याचा अर्थ असा नाही की आयव्हीआर लोकांकडून नोकरी काढून घेते - किंवा किमान सर्व लोक कॉल सेंटरमधून गायब होत आहेत. हे व्हॉईस-सक्रिय सहाय्यक मानवी ग्राहक सेवा प्रतिनिधींना कॉलचे निर्देश देऊन आणि सोप्या प्रश्नांची उत्तरे देऊन अधिक उत्पादनक्षम बनवितात.

या तंत्रज्ञानाशी संवाद साधणार्‍या मानवी वापरकर्त्यांसाठी हे नेहमीच सहजप्रवाह नसते. तंत्रज्ञानामुळे आयव्हीआर तंत्रज्ञानातील सामान्य समस्या सुधारण्यास मदत होत आहे, जसे अॅक्सेंटमध्ये त्रास, परंतु स्वयंचलित प्रणाली काढून टाकणे अद्याप एक सामान्य थीम आहे. व्हॉईस ओळखीने सुसज्ज लिफ्टबद्दल या विनोदी स्किटची तपासणी करा, जे आयव्हीआर सिस्टममधील गैरप्रकारांमुळे उद्भवू शकणारी निराशा अधोरेखित करते.

वैयक्तिक फोन अॅप्स: सिरी, गूगल नाऊ

बरेच लोक स्मार्टफोनसाठी व्हॉईस रेकग्निशनशी परिचित असतात. २०११ मध्ये Appleपलने आयफोन S एससाठी हळूवारपणे व्यंग्यात्मक, आवाज-सक्रिय "वैयक्तिक सहाय्यक" सिरीची ओळख करून दिल्यावर बहुतेक नवीन फोन मॉडेल्स व्हीआर सह येताना, त्यांची लोकप्रियता - आणि बदनामी वाढली. Google लवकरच थेट प्रतिस्पर्धी तयार केले: गूगल आता Android जेली बीन ओएस साठी. दोन्ही सिस्टममध्ये महिला आवाज आणि अत्याधुनिक ओळख वैशिष्ट्ये आहेत जी वापरकर्त्यांना त्यांच्या फोनवर प्रासंगिक भाषा वापरुन "बोलू" देतात.

परंतु या प्रणाली त्यांच्या पूर्ववर्तींपेक्षा अधिक सुसंस्कृत आणि कार्यक्षम आहेत, परंतु तंत्रज्ञानामध्ये अद्याप बराच पल्ला गाठायचा आहे हे देखील ते दर्शवित आहेत. सिरिसच्या अपयशाबद्दल विनोद लोकप्रिय इंटरनेट मेम बनले आहेत. एका व्यक्तीने सिरीसच्या क्षमतांविषयी चुकीच्या जाहिरातींसाठी Appleपल विरूद्ध दावा देखील केला.

कदाचित Appleपलने सिरी प्रगत आणि माहितीपूर्ण होण्यासाठी तयार केले असेल तर व्हीआर सॉफ्टवेअर देखील सेसीच्या बाजूने थोडेसे आहे. उदाहरणार्थ, जर आपण 1968 च्या “2001: अ स्पेस ओडिसी” या चित्रपटाच्या सिनेमाच्या इतिहासातील सर्वात कुप्रसिद्ध बुद्धिमत्ता तंत्रज्ञानापैकी एखादी ओळखी बोलली तर - सीरी या चित्रपटाच्या उत्तर रेषेसह उत्तर देईल, " मला माफ करा (आपले नाव), मला हे करण्याची भीती वाटत नाही, "किंवा अधिक व्यंग्यात्मक," आम्ही गुप्तहेर एजंट हे कायमचे जगू शकणार नाही, वरवर पाहता. "

आपल्याला नावाने कॉल करणे ही एक अशी कार्ये आहे जी सिरी वर प्रेम करणे अधिक सुलभ करण्याचा प्रयत्न करते आणि थोडे अधिक मानवी. व्हीआर सहाय्यक कॉल करणे, हुकूमशहा घेणे आणि त्यांचे कार्य करणे, माहितीसाठी इंटरनेट शोध करणे, जवळपासची स्टोअर शोधणे, ड्रायव्हिंग दिशानिर्देश देणे आणि बरेच काही, काहीही स्पर्श न करता, व्हॉईस आदेशांचे अनुसरण करू शकतात. उत्तरे एकाच वेळी फोनद्वारे बोलल्या जातात आणि स्क्रीनवर प्रदर्शित केल्या जातात.

अँड्रॉइड जेली बीन प्लॅटफॉर्मचा गूगल नाऊ हा व्हीआर भाग सिरीप्रमाणेच आहे. कमांडमध्ये प्रासंगिक भाषणाचे भाषांतर करून सिस्टम समान व्यापक ओळख क्षमता प्रदान करते जे वापरकर्त्यांना कॉल करू, एस, शोध चालवू, गणना आणि रूपांतरण करू, शब्दांची व्याख्या पकडा, गजर वाजवा, गाणी वाजवा आणि नकाशे आणि दिशानिर्देश मिळवा.

सिरी आणि गूगल नाऊ यासारख्या वैयक्तिक व्हॉईस सहाय्यकांसह, त्याचे फायदे स्पष्ट आहेत. कॉल करणे आणि शोधण्यापासून ते करमणूक करणे या सर्व गोष्टी वेगवान आणि सुलभ आहेत. आपल्याला काय हवे आहे तेच सांगा आणि (बहुतेक वेळा) व्हीआर अॅप आपल्यासाठी ते घेते. वाहन चालविताना व्हीआर चे हँड्स ऑफ तंत्रज्ञान विशेषतः उपयुक्त आहे. आणि बर्‍याच लोकांनी सिरिसच्या त्रुटी दूर केल्या आहेत आणि लेखकांनी असा युक्तिवाद केला आहे की वापरकर्त्यांनी आवश्यकपणे जीवन जगण्याची Google Nows क्षमता थोडी अपमानास्पद आहे, बहुतेक लोकांना असे वाटते की ही भविष्य तंत्रज्ञान मस्त आहे.

अर्थात, सिरी आणि गूगल नाऊ सारखे वैयक्तिक फोन अॅप्स परिपूर्ण आहेत - जरी हे दर्शविते की भविष्यात या तंत्रज्ञानाची नेमणूक कोठे होऊ शकते. याचा अर्थ असा आहे की जेव्हा सिरीने चुकीचे उत्तर दिलं तरीही पुढच्या आवृत्तीत बरेच चांगले होईल हे जाणून तिला हसून क्षमा करावी लागेल.

जिथे व्हीआर फॉल्स फ्लॅट

जेव्हा आपण व्यवसायासाठी कॉल करता तेव्हा आपल्यास कधीही आयव्हीआरचा सामना करावा लागला असेल तर कदाचित आपल्यास संवादामध्ये काही अडथळे असतील. काही प्रोग्राम्स रोबोटिक-टू-स्पीच व्हॉईस वापरतात जे शब्दांचा चुकीचा अर्थ लावतात आणि गोष्टी समजण्यास कठीण करतात. इतरांना संवेदनशीलता समस्या उद्भवतात ज्याचा परिणाम असा होतो की जर आपण खूपच जोरदार, खूप मऊ किंवा काळजीपूर्वक इशारा देत नाही तर सॉफ्टवेअर काय सांगत आहे यावर प्रक्रिया करण्यास अक्षम आहे.

याव्यतिरिक्त, बरेच लोक अद्याप मशीनशी बोलण्यास आरामदायक वाटत नाहीत. आपण आयव्हीआर वर काही शोध चालवल्यास, आपल्यास आढळेल की लोकांनी आयव्हीआर सिस्टमला बायपास करण्याचे आणि "वास्तविक व्यक्ती" कडे जाण्याचे मार्ग एकत्रित केले आहेत. हे उपाय "ऑपरेटरसाठी 0 दाबून ठेवा" पासून "मशीनला शाप देण्यापर्यंत शपथ घेण्यापासून ते माणसाला घेईपर्यंत शपथ घेतो." परिणामी, आयव्हीआर प्रणालीतील अलिकडील विकासाचे बरेच बदल फिरले आहेत ज्यामुळे ते मानवांसाठी अधिक स्वादिष्ट बनतात; आवाज अधिक सहानुभूतीपूर्ण आणि कमी रोबोटिक बनविणे, सिस्टमला नेव्हिगेट करणे सुलभ बनविते आणि कॉलरला कॉलरला हे सांगणे देऊन की संपूर्ण गोष्ट सुरुवातीपासून शेवटपर्यंत किती वेळ घेईल. हे सुचवते की चांगले तंत्रज्ञान म्हणजे अर्ध्या लढाईच; इतर अर्ध्या मशीनवर बोलण्याद्वारे बोर्डवर वापरकर्ते येत आहेत.

भविष्यात काय आहे

या आव्हानांना न जुमानता, व्हॉईस रेकग्निशन तंत्रज्ञान सर्वकाळ सुधारत आहे. सिरी आणि गूगल नाओ सारखे अनुप्रयोग - त्रुटी आणि सर्व - अद्याप त्यांच्या कामगिरीमध्ये विलक्षण प्रभावी आहेत आणि बर्‍याच कंपन्या व्हीआर क्षमता इतर अनुप्रयोगांमध्ये विस्तारित करीत आहेत.

उदाहरणार्थ, ड्रॅगन नॅचरलीस्पेकिंग स्पीच-टू-सॉफ्टवेअरचे निर्माते, न्युअन्सने यापूर्वीच टेलीव्हिजन आणि ऑटोमोबाईलसाठी व्हॉइस कंट्रोल विकसित केले आहेत आणि या टेक्नॉलॉजीच्या आवृत्त्या काही सॅमसंग टीव्ही आणि काही फोर्ड वाहनांमध्ये वापरल्या जाणार्‍या एसवायएनसी करमणूक प्रणालीमध्ये समाविष्ट केल्या आहेत.

आणि जसे की Google आणि पलला त्यांच्या व्हॉईस रेकग्निशन तंत्रज्ञानासाठी नवीन उपयोग सापडले आहेत, बहुधा आमच्या टेलिव्हिजनपासून ते टोस्टरपर्यंत सर्व प्रकारच्या रोजच्या मशीनवर ते बोलत जातील. आणि पुन्हा एकदा असे दिसते की विज्ञानकथा अगदी बरोबर होती. फक्त त्या आशावादी आहेत की त्या हुशार लेखक एका गोष्टीबद्दल चुकीचे होते. जर या मशीन्स ताब्यात घेत असतील तर पुढच्या वेळी जेव्हा आपण सिरीला "पॉड बे दरवाजे उघडा" असे सांगाल तेव्हा आपणास खूप त्रास होईल.