أخبار الإنترنتدراسات وتقاريرمنوعات تقنية

شركة OpenAI تطور يد روبوتية تحاكي حركة يد الإنسان بمساعدة الذكاء الاصطناعي

كشف شركة OpenAI النقاب عن نظام روبوتي جديد يُسمى Dactyl يعتمد على يد روبوتية يمكنها التلاعب بالأشياء المادية ببراعة غير مسبوقة دون الاعتماد على البشر، حيث علّمت نفسها التقاط الأشياء بنفس طريقة البشر، وذلك بمساعدة التعلم الآلي – وهو شكل من أشكال الذكاء الاصطناعي – باستخدام خوارزمية مبرمجة بذكاء تسمح للآلات بتعلم مهارات جديدة بمفردها، مثل التلاعب بمكعب بمهارة خارقة من خلال ممارسة ما يعادل مائة عام داخل محاكاة الكمبيوتر ولكنها تمكنت من ذلك خلال بضعة أيام فقط.

Dactyl هو نظام روبوتي للتلاعب بالأشياء بواسطة يد روبوتية تُسمى Shadow  تُصنعها شركة بريطانية، حيث يقوم الباحثين بوضع مكعب يحمل علامات مختلفة على جوانبه  في راحة اليد ويطلبون من Dactyl إعادة وضعه في اتجاه مختلف؛ على سبيل المثال تدوير المكعب لوضع وجه جديد في الأعلى، في حين تلاحظ الشبكة فقط إحداثيات أطراف الأصابع والصور من ثلاث كاميرات RGB عادية.

هذا الإنجاز هو الأحدث من قبل شركة OpenAI وهي شركة غير ربحية لأبحاث الذكاء الاصطناعي أسسها إيلون ماسك مؤسس شركة تيسلا للسيارات الكهربائية بالتعاون مع سام ألتمان عام 2015 ويمولها عدد كبير من شركات وادي السليكون، لتطوير أنظمة الذكاء الاصطناعى الآمنة للاستخدام البشري.

تتقن بالفعل العديد من الروبوتات والأيدي الروبوتية بعض الحركات حيث تجد الروبوت داخل المصنع يمكنه أن يحمل الأشياء الثقيلة ويثبتها بشكل أكثر براعة من البشر، ولكنه يقوم بهذه المهمة اعتمادًا على برمجيات قابلة للتطبيق مكتوبة له ومحدّدًة للغاية لذلك لا يمكنك على سبيل المثال أن تطلب منه القيام بمهمة أخرى على نفس خط الإنتاج مثل اللحام لأن ذلك سيتطلب برنامجًا جديدًا تمامًا، لذلك لا يمكنك تدريب الروبوتات على فعل ما يفعله الإنسان حيث يجب عليك تقديم ملايين من الأمثلة لإظهار ما يمكن أن يفعله الإنسان مع الآلاف من الأشياء.

أدرك الباحثون أن الحل هنا لن يكون بالاعتماد على استخدام البيانات البشرية فقط، ولكن بدلا من ذلك تركوا الكمبيوتر يحاول ويعاني من الفشل مرارا وتكرارا في المحاكاة، ويتعلم ببطء كيفية تحريك أصابعه بحيث يتحرك الشيء في قبضته حسب الرغبة.

وبمساعدة تقنيات الذكاء الاصطناعي أصبح ذلك أسهل اليوم، بالرغم من أن نظام  Dactyl مازال لا يقترب من رشاقة يد الإنسان في التقاط الأشياء، ولكن مع ذلك تُظهر الدراسة قدرة التعلم الآلي على إطلاق قدرات جديدة للروبوتات. كما تشير أيضًا إلى أن الروبوتات في يوم ما قد تعلِّم نفسها مهارات جديدة داخل العوالم الافتراضية، والتي يمكن أن تسرع بشكل كبير عملية البرمجة أو التدريب.

تستخدم الخوارزمية أسلوبًا من أساليب التعلم الآلي يُعرف باسم التعلم التعزيزي (Reinforcement learning (RL، حيث تم إعطاء نظام Dactyl مهمة تحريك مكعب بحيث يتم الحصول على وجه مختلف كل مرة. وقد تُرك ليكتشف من خلال التجربة والخطأ أي الحركات ستحقق النتائج المرجوة.

تُظهر مقاطع فيديو لنظام Dactyl أنه يقوم بتدوير المكعب مع خفة حركة مثيرة للإعجاب، وحدد تلقائيًا العديد من حركات السيطرة التي يستخدمها البشر عادة. لكن الأبحاث أظهرت أيضا إلى أي مدى وصلت أنظمة الذكاء الاصطناعي: لقد تمكن النظام من التلاعب بالمكعب بنجاح  50 مرة.

أسلوب التعلم التعزيزي مستوحى من الطريقة التي تتعلم بها الحيوانات من خلال ردود فعل إيجابية. وقد تم اقتراحه لأول مرة منذ عدة عقود، إلا أنه أثبت نجاحه العملي في السنوات الأخيرة بفضل التقدم الذي شهدته الشبكات العصبية الاصطناعية، واستخدمته شركة DeepMind التابعة لشركة جوجل لإنشاء نظام AlphaGo وهو برنامج كمبيوتر يعلم نفسه لعبة جو Go شديدة التعقيد والذكاء، والذي هزم بطل العالم في هذه اللعبة عام 2017.

قام باحثون آخرون في مجال الروبوتات باختبار هذا النهج لفترة من الوقت، لكنهم واجهوا صعوبة في تقليد تعقيد العالم الحقيقي وعدم إمكانية التنبؤ به. ولكن الباحثون في مختبرات OpenAI توصلوا إلى هذا الأمر عن طريق إدخال تغييرات عشوائية في عالمهم الافتراضي، بحيث يمكن أن يتعلم الروبوت حساب حالات الإزعاج مثل الاحتكاك، والضوضاء في أجهزة الروبوت، والأوقات التي يكون المكعب فيها مخفيا جزئيا عن العرض.

الرائع في هذا النظام ليس فقط طبيعة حركاته، بل النتائج التي تم الوصول إليها بشكل مستقل عن طريق التجربة والخطأ كما انه ليس مرتبطًا بأي شكل أو نوع معين من الأشياء تماما مثل الإنسان، حيث يمكن لـ  Dactyl مسك أي شيء والتلاعب به عند وضعه في يده في حدود المهمة المطلوبة منه بالطبع، وتسمى هذه المرونة بالتعميم generalization، وهي مهمة بالنسبة للروبوتات التي يجب أن تتفاعل مع العالم الحقيقي.

قال أليكس راي وهو أحد المهندسين الذين يعملون على النظام: “إن Dactyl يمكن تحسينه من خلال منحه المزيد من القدرة على المعالجة وتقديم المزيد من العشوائية، لا أعتقد أننا وصلنا إلى الحد الأقصى”.

وأضاف: “لا توجد خطة لمحاولة تسويق هذه التقنية حاليًا ويركز فريق العمل الآن على تطوير أقوى أساليب التعلم المعممة الممكنة”.

وكما هو الحال دائما مع باحثو شركة OpenAI فقد تم نشر ورقة بحثية تظهر النتائج التي توصلوا لها بحرية، وكذلك بعض الأدوات التي استخدموها لإنشاء واختبار نظام Dactyl.

زر الذهاب إلى الأعلى