إنفيديا تستفيد من فيجين برو لتطوير الروبوتات البشرية
تخطو إنفيديا خطوات واسعة في سد فجوة المحاكاة للروبوتات البشرية من خلال الاستفادة من نظارة الرأس فيجين برو Vision Pro من آبل لجمع بيانات تدريب واقعية.
وكشفت الشركة سابقًا عن مشروع Gr00t، وهي منصة ذكاء اصطناعي متعددة الوسائط لتشغيل الروبوتات البشرية في المستقبل باستخدام الذكاء الاصطناعي الأساسي المتقدم.
وعرضت إنفيديا GR00T خلال مؤتمر GTC 2024، وهي تستخدم نموذجًا أساسيًا للأغراض العامة يسمح للروبوتات البشرية بأخذ النصوص أو الكلام أو مقاطع الفيديو أو حتى العروض التوضيحية المباشرة بصفتها مدخلات ومعالجتها لاتخاذ إجراءات عامة محددة.
وكان التحدي الرئيسي في إنشاء روبوتات مناسبة للمهام اليومية هو الافتقار إلى بيانات تدريب عالية الجودة.
وتعتقد إنفيديا أنها وجدت حلًا من خلال الجمع بين البيانات التي أنشأها الإنسان والبيانات الاصطناعية.
وأوضح جيم فان، كبير مديري الأبحاث ورئيس قسم الذكاء الاصطناعي المتجسد في إنفيديا، أن الشركة تستخدم فيجين برو لتسجيل نماذج الإجراءات للروبوتات.
ويتحكم البشر الذين يرتدون نظارة الرأس في الروبوتات من منظور الشخص الأول، ويؤدون مهام، مثل صنع الخبز المحمص أو استرجاع كوب من الخزانة.
وقال فان: “تحلل فيجين برو وضعية اليد البشرية وتعيد توجيه الحركة إلى يد الروبوت، كل ذلك في الوقت الفعلي. التشغيل من بُعد بطيء ويستغرق وقتًا طويلًا، مع أنه يسمح لنا بجمع كمية صغيرة من البيانات”.
وتستخدم إنفيديا بعد ذلك إطار المحاكاة RoboCasa لمضاعفة هذه البيانات. ويعمل نظام الشركة المسمى MimicGen على توسيع مجموعة البيانات من خلال إنشاء إجراءات جديدة بناءً على البيانات البشرية الأصلية وتصفية المحاولات غير الناجحة.
وتُعد هذه بمنزلة طريقة لمقايضة حوسبة البيانات البشرية المرتفعة التكلفة بالمحاكاة المتسارعة بواسطة وحدة معالجة الرسومات.
ويساعد استخدام بيانات العالم الحقيقي وتوسيع نطاقها في سد ما يسمى بفجوة محاكاة الواقع، وهو مصطلح يصف صعوبة نقل الأنظمة الروبوتية المدربة عبر المحاكاة فقط إلى ما هو عادة واقع معقد جدًا.
وفي مؤتمر Siggraph لهذا العام، أوضح الرئيس التنفيذي لشركة إنفيديا، جنسن هوانغ، ما أسماه مشكلة الحواسيب الثلاثة في تطوير الروبوتات.
وأوضح هوانغ أن العملية تتطلب حواسيب منفصلة لإنشاء الذكاء الاصطناعي ومحاكاته وتشغيله في الروبوت الفعلي.
وشدد هوانغ على أن هذا النهج المتعدد المراحل يضمن تصميم نماذج الذكاء الاصطناعي واختبارها وتحسينها قبل نشرها في العالم الحقيقي.
وأصبح إطار المحاكاة RoboCasa الآن مفتوح المصدر بالكامل، كما أن نظام MimicGen أصبح مفتوح المصدر للأذرع الآلية، مع وجود نسخة قيد التطوير مخصصة للروبوتات البشرية والأيدي ذات الأصابع الخمسة.