मजकूर ते भाषण (टीटीएस)

लेखक: Randy Alexander
निर्मितीची तारीख: 27 एप्रिल 2021
अद्यतन तारीख: 24 जून 2024
Anonim
मजकूर ते भाषण (टीटीएस) - तंत्रज्ञान
मजकूर ते भाषण (टीटीएस) - तंत्रज्ञान

सामग्री

व्याख्या - भाषण (टीटीएस) म्हणजे काय?

टू स्पीच (टीटीएस) ही एक नैसर्गिक भाषा मॉडेलिंग प्रक्रिया आहे ज्यास ऑडिओ सादरीकरणासाठी युनिट्समध्ये भाषणातील घटकांमध्ये बदलण्याची आवश्यकता असते. हे भाषण करण्याच्या उलट आहे, जिथे तंत्रज्ञान बोललेल्या शब्दांमध्ये घेते आणि त्या म्हणून अचूकपणे रेकॉर्ड करण्याचा प्रयत्न करते. जे भाषण वाचण्यास असमर्थ आहेत अशा लोकांना मदत करण्यासाठी किंवा इतर प्रकारच्या वापरासाठी ऑडिओ आऊटपुट देतात अशा तंत्रज्ञानामध्ये आता टू स्पीच सामान्य आहे.

मायक्रोसॉफ्ट अझर आणि मायक्रोसॉफ्ट क्लाऊडची ओळख | या संपूर्ण मार्गदर्शकामध्ये आपण क्लाउड संगणन करणे म्हणजे काय आणि मायक्रोसॉफ्ट अझर आपल्याला क्लाऊडवरून आपला व्यवसाय स्थलांतरित आणि चालविण्यात कशी मदत करू शकेल हे शिकाल.

टेकोपीडिया स्पिटला स्पष्टीकरण देते (टीटीएस)

भाषण क्षमता विकसित करण्यामध्ये काही अनन्य आव्हाने आहेत. विशेषत: इंग्रजी भाषेत, जिथे मोठ्या संख्येने शब्द उच्चारित शब्द असतात, संगणक प्रोग्राम डिजिटलमध्ये एखाद्या शब्दाच्या इच्छित उच्चारांचा अंदाज लावण्यासाठी संभाव्यतेच्या मॉडेलिंगवर अवलंबून असतात. प्रोग्रामला भाषण उच्चारांच्या छोट्या छोट्या युनिट्सला फोनममध्ये रूपांतरित करावे लागेल. याचा परिणाम असा आहे की बर्‍याच-भाषणे तंत्रज्ञान अचूक पेक्षा कमी आहेत, जरी अनेक वर्षांमध्ये विकसकांनी या तंत्रज्ञानावर मोठ्या प्रमाणात प्रगती केली आहे.

कालांतराने, तज्ञांनी टीटीएस विकासासाठी काही चांगल्या पद्धती पाळल्या आहेत. यामध्ये फोनमे बेस आणि पूर्वानुमानात्मक विश्लेषणासह संकल्पनात्मक दृष्टीकोन समाविष्ट आहेत. सर्वोत्कृष्ट प्रोग्राम कमीतकमी मेमरी आवश्यकतांसह कार्य करण्यास सक्षम असतात आणि ते सेट करणे सोपे आहे. विकसक कोणत्याही विशिष्ट भाषेसाठी टीटीएस स्त्रोतांवर कार्य करत राहतात आणि अस्पष्टतेच्या मुख्य आव्हानांमधून कार्य करतात आणि अधिक अचूक भाषांतर करण्याच्या अडथळ्या आहेत.