मजबुतीकरण शिक्षण

लेखक: Lewis Jackson
निर्मितीची तारीख: 11 मे 2021
अद्यतन तारीख: 15 मे 2024
Anonim
आजीवन अंग्रेजी भाषा की शिक्षा के लिए शिक्षकों की डिजिटल तैयारी को सुदृढ़ बनाना (1)
व्हिडिओ: आजीवन अंग्रेजी भाषा की शिक्षा के लिए शिक्षकों की डिजिटल तैयारी को सुदृढ़ बनाना (1)

सामग्री

व्याख्या - मजबुतीकरण शिक्षण म्हणजे काय?

कृत्रिम बुद्धिमत्तेच्या दृष्टीने मजबुतीकरण शिक्षण, एक प्रकारची डायनॅमिक प्रोग्रामिंग आहे जी बक्षिसे आणि शिक्षेची प्रणाली वापरुन अल्गोरिदम प्रशिक्षित करते.


एक मजबुतीकरण शिक्षण अल्गोरिदम किंवा एजंट त्याच्या वातावरणाशी संवाद साधून शिकतो. एजंटला योग्य प्रकारे कामगिरी करून आणि चुकीचे कामगिरी केल्याबद्दल दंड मिळतो. एजंट मानवाकडून हस्तक्षेप केल्याशिवाय त्याचे बक्षीस जास्तीत जास्त आणि दंड कमी करून शिकतो.

मायक्रोसॉफ्ट अझर आणि मायक्रोसॉफ्ट क्लाऊडची ओळख | या संपूर्ण मार्गदर्शकामध्ये आपण क्लाउड संगणन करणे म्हणजे काय आणि मायक्रोसॉफ्ट अझर आपल्याला क्लाऊडवरून आपला व्यवसाय स्थलांतरित आणि चालविण्यात कशी मदत करू शकेल हे शिकाल.

टेकोपीडिया रीइनोर्समेंट लर्निंगचे स्पष्टीकरण देते

मजबुतीकरण शिक्षण ही मशीन शिकण्याचा एक दृष्टीकोन आहे जो वर्तनवादी मानसशास्त्रातून प्रेरित होतो. एखादे मूल नवीन कार्य करण्यास कसे शिकते यासारखेच आहे. मजबुतीकरण शिक्षण इतर मशीन लर्निंग पध्दतींशी तुलना करते ज्यामध्ये अल्गोरिदम एखादे कार्य कसे करावे हे स्पष्टपणे सांगितले जात नाही, परंतु समस्येद्वारे स्वतः कार्य करते.

एजंट म्हणून, जी स्वत: ची ड्राईव्हिंग कार असू शकते किंवा बुद्धीबळ खेळणारा प्रोग्राम असू शकेल, त्याच्या वातावरणाशी संवाद साधेल, सुरक्षितपणे गंतव्यस्थानावर जाणे किंवा गेम जिंकणे यासारखे कार्य कसे करते यावर अवलंबून पुरस्कार मिळते. याउलट एजंटला चुकीच्या कामगिरीसाठी दंड मिळतो, जसे की रस्त्यावर जाणे किंवा चेकमेन्ट करणे.


एजंट वेळोवेळी आपला बक्षीस जास्तीत जास्त करण्याचे आणि डायनॅमिक प्रोग्रामिंगचा वापर करून दंड कमी करण्यासाठी निर्णय घेते. कृत्रिम बुद्धिमत्तेच्या या दृष्टिकोनाचा फायदा असा आहे की तो एआय प्रोग्रामला प्रोग्रामरला न शिकता एजंटने कार्य कसे करावे हे शिकण्याची परवानगी देतो.