ये नई एआई बॉट उपकरण का उपयोग करना सीखते हैं और गेम जीतने के लिए एक साथ काम करते हैं
RajibRoy - अक्टूबर 19, 2019
ओपन एआई के शोधकर्ताओं ने जब वे एआई को प्रोग्राम करते हैं, तो इसका परिणाम दिखाया है कि वे अपनी गलतियों से सीख सकते हैं, जबकि वे छिपाना और खेलना चाहते थे।
- 100,000 एआई द्वारा किए गए फ़ेस डेटाबेस हमारे फोटो को स्टॉक करने की सोच को बदल सकता है
- एआई डॉक्टरों को कार्डिएक एमआरआई स्कैन 186 टाइम फास्टर पढ़ने में करता है मदद
उपकरण का उपयोग करने वाला AI संभवतः कृत्रिम बुद्धिमत्ता का अगला स्तर है। ओपन AI के शोधकर्ताओं ने जब वे एआई को प्रोग्राम करते हैं, तो इसका परिणाम दिखाया है कि वे अपनी गलतियों से सीख सकते हैं, जबकि वे छिपाना और खेलना चाहते थे।
एआई ने दीवारों, रैंप और बॉक्सिंग वाले वातावरण के साथ दो टीमों में खेल खेला, जिसे स्थानांतरित या बंद किया जा सकता था। जैसे ही एक बॉट ने किसी आइटम को बंद कर दिया है, दूसरी टीम के बॉट उस आइटम को स्थानांतरित नहीं कर सकते हैं।
अपने शुरुआती चरण में, बॉट्स ने अपने विरोधियों से छिपाने के लिए उन बक्से, दीवारों और रैंप का उपयोग करके किलों का निर्माण करना सीखा, और उन्होंने अक्सर किलों के निर्माण के लिए एक साथ काम किया। अंत में, चाहने वाली टीम ने सीखा कि रैंप का इस्तेमाल किलों की दीवारों पर होने के लिए किया जा सकता है। फिर, छिपने वाली टीम ने छिपने से पहले रैंप पर ताला लगाना शुरू कर दिया। फिर खोजी टीम ने रैंप पर लॉक करने के लिए ब्लॉक के शीर्ष पर जाना सीख लिया, वे तब किलों तक पहुंचे और फिर कूद गए। परिणामस्वरूप, छिपने वाली टीम ने बक्से को भी लॉक करना सीख लिया।
टीम ने ओपन AI द्वारा इस महीने की शुरुआत में जारी एक पेपर में अपने विकास की व्याख्या की, जिसे एलोन मस्क ने दिसंबर 2015 में सह-स्थापित किया।
परियोजना के प्रमुख शोधकर्ता बोवेन बेकर ने कहा, "हम शायद बॉक्स सर्फिंग को देखकर सबसे ज्यादा हैरान थे।"
इस प्रयोग में सबसे मनोरंजक हिस्सा संभवतः तब है जब बॉट्स ने गेम के ग्लिट्स को ढूंढना शुरू किया जो वे जीतने के लिए उपयोग कर सकते थे। उदाहरण के लिए, बॉट्स, एक बिंदु पर, लगा कि वे बाहर की दीवारों के माध्यम से रैंप को कुछ कोणों पर धक्का दे सकते हैं ताकि उन्हें छुटकारा मिल सके।
हमने कहा कि लगभग 500 मिलियन लुका-छिपी के खेल हुए। शोध दल ने कहा कि वे इसे "वास्तव में दिलचस्प संकेत देते हैं कि मनुष्य पृथ्वी पर कैसे विकसित हुआ।"
बेकर के अनुसार, एआई ने पांच दिनों में खेलों को पूरा किया, और प्रत्येक समय, एक साथ 4,000 खेल खेले जा रहे थे।
जटिल समस्याओं को हल करने के लिए पिछली गलतियों से सीखने के साथ-साथ टीमवर्क का उपयोग करने के लिए कृत्रिम बुद्धिमत्ता सिखाने के लिए इस पद्धति का उपयोग करके, शोधकर्ता बदल सकते हैं कि हम उन्नत कृत्रिम बुद्धि बनाने के तरीके के बारे में कैसे सोचते हैं। जबकि यह केवल बच्चों को खेल खेलने के लिए सीखने और इसे जीतने के लिए सीखने की तरह लग सकता है, इस शोध के बड़े निहितार्थ हो सकते हैं।
यह कागज में लिखा है कि इस तरह के प्रयोग से एआई को विकसित करने का तरीका "शारीरिक रूप से आधार और मानव-प्रासंगिक व्यवहार को जन्म दे सकता है।" जिस तरह से इन बॉट्स को सीखा गया, वह इंसानों के सीखने के तरीके के समान था, जिसका अर्थ है कि यह प्रयोग दिखा सकता है कि हम कैसे मानवीय सोच को प्रतिबिंबित करने वाली कृत्रिम बुद्धि उत्पन्न कर सकते हैं। एआई खेल की खामियों का लाभ उठाने में सक्षम था, जिसका अर्थ है कि वे उन समाधानों का पता लगा सकते हैं जिनके बारे में मनुष्य ने सोचा भी नहीं होगा।
“इस प्रयोग से पता चला कि एजेंट शारीरिक रूप से ज़मीनी सिमुलेशन में जटिल कौशल और व्यवहार को बहुत कम मानवीय पर्यवेक्षण के साथ सीख सकते हैं। अगर हम एजेंटों को अधिक जटिल दुनिया में डालते हैं जो अधिक स्पष्ट रूप से हमारे जैसा दिखता है, तो शायद वे उन समस्याओं को हल कर सकते हैं जिनके लिए हमारे पास अभी तक समाधान नहीं है, ”बेकर कहते हैं।
अप्रैल में वापस, उलटा के अनुसार, ओपन AI ने सुर्खियां बटोरी क्योंकि इसकी बॉट टीम देता 2 में एक प्रो स्पोर्ट्स टीम को हरा सकती है। इसकी अगली रचनात्मक परियोजना को देखने के लिए रोमांचक है जो अधिक संभावनाएं ला सकती है। बेकर के अनुसार, "हमने कृत्रिम एजेंटों के निर्माण के वातावरण के लिए बहुत सारे अंतर्ज्ञान और उपकरण प्राप्त किए हैं, जो भविष्य की परियोजनाओं के लिए प्रगति को गति प्रदान करना चाहिए।"
हालांकि, एक सवाल यह है कि क्या कंपनी इस विकास को कभी संदिग्ध उपयोग में लाएगी, जैसा कि दिसंबर 2015 में सामने आया था, “चूंकि हमारा शोध वित्तीय दायित्वों से मुक्त है, इसलिए हम बेहतर मानव प्रभाव पर ध्यान केंद्रित कर सकते हैं। हम मानते हैं कि ए.आई. व्यक्तिगत मानवीय इच्छाशक्ति का विस्तार होना चाहिए और, स्वतंत्रता की भावना में, जितना संभव हो उतना व्यापक और समान रूप से वितरित किया जाना चाहिए। ”
फिर भी, एलोन मस्क ने कहा कि उन्होंने ट्विटर पर कहा कि कम से कम एक साल पहले कंपनी छोड़ दी थी, अब वह बोर्ड पर नहीं था।