सुदृढीकरण की एक अनुसूची क्या है?

मजबूती के कार्यक्रमों पर सीखने पर क्या प्रभाव पड़ता है?

ऑपरेंट कंडीशनिंग एक सीखने की प्रक्रिया है जिसमें नए व्यवहार हासिल किए जाते हैं और संशोधित होते हैं, हालांकि उनके परिणामों के साथ संबंध। एक व्यवहार को मजबूत करने से भविष्य में फिर से होने वाली संभावना बढ़ जाती है, जबकि व्यवहार को दंडित करने की संभावना कम हो जाती है कि इसे दोहराया जाएगा। ऑपरेटर कंडीशनिंग में , मजबूती के कार्यक्रम सीखने की प्रक्रिया का एक महत्वपूर्ण घटक हैं।

कब और कितनी बार हम एक व्यवहार को मजबूत करते हैं, प्रतिक्रिया की ताकत और दर पर नाटकीय प्रभाव पड़ सकता है।

सुदृढीकरण की एक अनुसूची क्या है?

तो मजबूती का एक कार्यक्रम वास्तव में क्या है और यह कंडीशनिंग प्रक्रिया में कैसे काम करता है? मजबूती का एक कार्यक्रम मूल रूप से एक नियम है जिसमें कहा गया है कि व्यवहार के उदाहरणों को मजबूत किया जाएगा। कुछ मामलों में, हर बार ऐसा होने पर एक व्यवहार को मजबूत किया जा सकता है।

कभी-कभी, एक व्यवहार को मजबूती नहीं दी जा सकती है।

स्थिति के आधार पर या तो सकारात्मक सुदृढीकरण या नकारात्मक सुदृढीकरण का उपयोग किया जा सकता है। दोनों मामलों में, मजबूती का लक्ष्य हमेशा व्यवहार को मजबूत करना और भविष्य में फिर से होने वाली संभावना को बढ़ाने के लिए है।

स्वाभाविक रूप से होने वाली सीखने की स्थितियों के साथ-साथ अधिक संरचित प्रशिक्षण स्थितियों में सीखने के तरीके के बारे में सोचकर आप सुदृढ़ीकरण कार्यक्रम कैसे संचालित करते हैं, इसके बारे में बेहतर महसूस कर सकते हैं।

असली दुनिया की सेटिंग्स में, संभवतः व्यवहार हर बार होने पर प्रबल नहीं होते हैं। ऐसी परिस्थितियों के लिए जहां आप जानबूझकर कक्षा में, खेल में, या पशु प्रशिक्षण में एक कार्रवाई को प्रशिक्षित करने और मजबूत करने की कोशिश कर रहे हैं, तो आप एक विशिष्ट सुदृढ़ीकरण अनुसूची का पालन करने का विकल्प चुन सकते हैं।

जैसा कि आप नीचे देखेंगे, कुछ शेड्यूल कुछ प्रकार की प्रशिक्षण स्थितियों के लिए सबसे उपयुक्त हैं। कुछ मामलों में, प्रशिक्षण एक शेड्यूल के साथ शुरू करने और वांछित व्यवहार सिखाए जाने के बाद दूसरे पर स्विच करने के लिए कॉल कर सकता है। सुदृढ़ीकरण के कुछ कार्यक्रम विशिष्ट परिस्थितियों में अधिक प्रभावी हो सकते हैं।

दो प्रकार के सुदृढ़ीकरण कार्यक्रम हैं:

निरंतर सुदृढीकरण अनुसूची

निरंतर सुदृढीकरण में, वांछित व्यवहार हर बार होने पर प्रबल होता है। व्यवहार और प्रतिक्रिया के बीच एक मजबूत सहयोग बनाने के लिए सीखने के शुरुआती चरणों के दौरान इस कार्यक्रम का सबसे अच्छा उपयोग किया जाता है।

उदाहरण के लिए, कल्पना करें कि आप अपने हाथ को हिलाकर कुत्ते को सिखाने की कोशिश कर रहे हैं। सीखने के शुरुआती चरणों के दौरान, व्यवहार को सिखाने और स्थापित करने के लिए आप शायद एक सतत सुदृढ़ीकरण कार्यक्रम के साथ रहेंगे। आप जानवर के पंजे को पकड़कर शुरू कर सकते हैं, झटका लगाना, "शेक" कहकर और फिर हर बार जब आप इस अनुक्रम का अनुक्रम करते हैं तो इनाम की पेशकश करते हैं। आखिरकार, कुत्ता अपने आप पर कार्रवाई करने लगेगा, और जब तक व्यवहार अच्छी तरह से स्थापित नहीं हो जाता है तब तक आप हर एक सही प्रतिक्रिया को मजबूत करना जारी रख सकते हैं।

एक बार जब प्रतिक्रिया दृढ़ता से संलग्न हो जाती है, तो मजबूती आमतौर पर आंशिक सुदृढीकरण अनुसूची में स्विच की जाती है।

आंशिक सुदृढीकरण अनुसूची

आंशिक या अंतःक्रियात्मक मजबूती में, प्रतिक्रिया उस समय के केवल एक हिस्से को मजबूत करती है । सीखने के व्यवहार आंशिक मजबूती के साथ धीरे-धीरे हासिल किए जाते हैं, लेकिन प्रतिक्रिया विलुप्त होने के लिए अधिक प्रतिरोधी है।

उदाहरण के लिए, हमारे पहले उदाहरण के बारे में सोचें जहां आप एक कुत्ते को हिलाकर प्रशिक्षण दे रहे थे। जब आपने शुरुआत में एक सतत कार्यक्रम का उपयोग किया, तो व्यवहार के हर एक उदाहरण को मजबूत करना हमेशा यथार्थवादी नहीं हो सकता है। आखिरकार, आप आंशिक अनुसूची में स्विच करने का निर्णय ले सकते हैं जहां आप इतने सारे प्रतिक्रिया होने के बाद मजबूती प्रदान करते हैं या इतने समय बीत चुके हैं।

आंशिक सुदृढ़ीकरण के चार कार्यक्रम हैं:

फिक्स्ड-रेफरेंस शेड्यूल वे हैं जहां प्रतिक्रिया के एक निश्चित संख्या के बाद प्रतिक्रिया को मजबूती मिलती है। यह अनुसूची प्रबलक के वितरण के बाद केवल एक संक्षिप्त विराम के साथ प्रतिक्रिया देने की उच्च, स्थिर दर उत्पन्न करती है। एक निश्चित अनुपात अनुसूची का एक उदाहरण चूहे को पांच बार दबाए जाने के बाद चूहे को एक खाद्य गोली दे रहा है।

वैरिएबल-अनुपात शेड्यूल तब होते हैं जब प्रतिक्रिया की अप्रत्याशित संख्या के बाद प्रतिक्रिया को मजबूत किया जाता है। यह अनुसूची प्रतिक्रिया देने की एक उच्च स्थिर दर बनाता है। जुआ और लॉटरी गेम एक चर अनुपात अनुपात के आधार पर एक इनाम के अच्छे उदाहरण हैं। एक प्रयोगशाला सेटिंग में, इसमें एक बार प्रेस के बाद एक चूहे पर भोजन छर्रों को वितरित करना, फिर चार बार प्रेस के बाद, और दो बार प्रेस के बाद एक तिहाई गोली शामिल हो सकती है।

फिक्स्ड-अंतराल शेड्यूल वे हैं जहां पहली प्रतिक्रिया केवल निर्दिष्ट समय के बाद ही पुरस्कृत की जाती है। इस अनुसूची में अंतराल के अंत के करीब प्रतिक्रिया की उच्च मात्रा होती है, लेकिन प्रबलक के वितरण के तुरंत बाद बहुत धीमी प्रतिक्रिया होती है। एक प्रयोगशाला सेटिंग में इसका एक उदाहरण 30-सेकंड अंतराल समाप्त होने के बाद पहली बार प्रेस के लिए एक प्रयोगशाला गोली के साथ चूहे को मजबूत करेगा।

परिवर्तनीय-अंतराल शेड्यूल तब होते हैं जब एक अप्रत्याशित समय बीतने के बाद प्रतिक्रिया को पुरस्कृत किया जाता है। यह अनुसूची प्रतिक्रिया की धीमी, स्थिर दर उत्पन्न करती है। इसका एक उदाहरण एक मिनट के अंतराल के बाद पहली बार प्रेस के बाद चूहे को एक खाद्य गोली प्रदान करेगा, पांच मिनट के अंतराल के बाद पहली प्रतिक्रिया के लिए एक और गोली, और पहली प्रतिक्रिया के लिए तीसरी खाद्य गोली तीन मिनट अंतराल।

आप सुदृढ़ीकरण की अनुसूची कैसे चुनते हैं?

किसी व्यवहार को मजबूत करने का निर्णय लेने से कई कारकों पर निर्भर किया जा सकता है। ऐसे मामलों में जहां आप विशेष रूप से एक नया व्यवहार सिखाने की कोशिश कर रहे हैं, एक सतत कार्यक्रम अक्सर एक अच्छा विकल्प होता है।

एक बार व्यवहार सीखा जाने के बाद, आंशिक अनुसूची में स्विच करना अक्सर बेहतर होता है।

दैनिक जीवन में, सुदृढ़ीकरण के आंशिक कार्यक्रम लगातार निरंतर करने की तुलना में अधिक बार होते हैं। उदाहरण के लिए, कल्पना करें कि क्या आप समय पर काम करने के लिए हर बार कुछ प्रकार का इनाम प्राप्त करते हैं। इसके बजाए, इस तरह के पुरस्कार आमतौर पर बहुत कम अनुमानित आंशिक सुदृढीकरण कार्यक्रम पर बाहर निकाले जाते हैं। न केवल इन कार्यक्रमों को और अधिक यथार्थवादी और लागू करने में आसान है, वे विलुप्त होने के लिए कम संवेदनशील होने के दौरान उच्च प्रतिक्रिया दर भी उत्पन्न करते हैं।

वास्तव में, हर बार एक व्यवहार को मजबूत करना मुश्किल हो सकता है और ध्यान और संसाधनों का एक बड़ा सौदा होना आवश्यक है। आंशिक कार्यक्रम न केवल उन व्यवहारों का कारण बनते हैं जो विलुप्त होने के लिए अधिक प्रतिरोधी हैं, वे इस जोखिम को भी कम करते हैं कि विषय तृप्त हो जाएगा। यदि प्रबलक का उपयोग किया जा रहा है अब वांछित या पुरस्कृत नहीं है, तो विषय वांछित व्यवहार करने से रोक सकता है।

उदाहरण के लिए, कल्पना करें कि आप कुत्ते को बैठने के लिए सिखाने की कोशिश कर रहे हैं। यदि आप एक इनाम के रूप में भोजन का उपयोग कर रहे हैं, तो कुत्ता पूरा होने के बाद कार्रवाई करने से रोक सकता है। ऐसे मामलों में, प्रशंसा या ध्यान जैसी कुछ अधिक प्रभावी प्रबलक हो सकती है।

से एक शब्द

ऑपरेटर कंडीशनिंग एक शक्तिशाली शिक्षण उपकरण हो सकता है। प्रशिक्षण और रखरखाव प्रक्रिया के दौरान उपयोग किए जाने वाले सुदृढीकरण के कार्यक्रम का एक बड़ा प्रभाव हो सकता है कि व्यवहार कितनी जल्दी प्राप्त किया जाता है, प्रतिक्रिया की ताकत, और व्यवहार कितनी बार प्रदर्शित होता है। यह निर्धारित करने के लिए कि कौन सा शेड्यूल बेहतर है, परिस्थिति के विभिन्न पहलुओं पर विचार करना महत्वपूर्ण है जिसमें सिखाया जा रहा व्यवहार और आवश्यक प्रतिक्रिया का प्रकार शामिल है।

> स्रोत:

> कूपर, जे, हेरॉन, टी, और हावर्ड, डब्ल्यू एप्लाइड व्यवहार विश्लेषण न्यू जर्सी: पियरसन शिक्षा; 2007।

> नेविद, जेएस। मनोविज्ञान के अनिवार्य: अवधारणाएं और अनुप्रयोग। बोस्टन, एमए: सेन्गेज लर्निंग; 2016।