أخبار الإنترنت تحت الضوء دراسات وتقارير منوعات تقنية

جوجل تدرب أنظمة الذكاء الاصطناعي على حل المشكلات بطريقة الإنسان

18 يوليو 2018آخر تحديث: 18 يوليو 2018

4 دقائق

جوجل تدرب أنظمة الذكاء الاصطناعي على حل المشكلات بطريقة الإنسان

قام باحثون في شركة ديب مايند DeepMind التابعة لشركة جوجل بتدريب أنظمة التعلم الآلي على اجتياز اختبارات الذكاء IQ التي صممت لقياس عدد من مهارات التفكير، من أجل إثبات قدرتها على التفكير في المفاهيم المجردة، لتصبح بذلك أنظمة الذكاء الاصطناعي قادرة على التفكير المجرد على غرار البشر وبناء عليه يمكن التفكير ووضع حلول للمشكلات.

تستمر النماذج القائمة على الشبكات العصبية في تحقيق نتائج مذهلة في حل مشاكل التعلم الآلي، أما إثبات قدرتها على التفكير في المفاهيم المجردة فقد أثبت أنه صعب على مدار الأيام، ولكن اليوم قد تجاوز الذكاء الاصطناعي هذه المشكلة من خلال التدريب على اختبارات الذكاء IQ.

نشر الباحثون ورقة بحثية تحمل عنوان “قياس الاستدلال المجرد في الشبكات العصبية”، توضح بالتفصيل محاولتهم لقياس قدرات التفكير التجريدي المختلفة لأنظمة الذكاء الاصطناعي اعتمادًا على اختبارات الذكاء IQ المستخدمة لقياس قدرات التفكير التجريدي عند البشر، والتي كشفت بعض الرؤى الهامة.

تتضمن الألغاز الموجودة في الاختبار سلسلة من الأشكال العشوائية، والتي يحتاج المشاركون إلى دراستها لتحديد القواعد التي تكمل هذا النمط، وبمجرد أن يتم وضع قواعد اللغز يجب أن يكونوا قادرين على اختيار الشكل التالي بدقة في التسلسل.

يأمل باحثو ديب مايند في أن تطوير الذكاء الاصطناعي القادر على التفكير خارج الصندوق يمكن أن يؤدي إلى أن تصبح الآلات قادرة على خلق حلول جديدة للمشاكل التي لم يسبق أن فكر فيها البشر.

وقد استخدم باحثو ديب مايند الألغاز المعروفة باسم اختبار مصفوفات ريفن المتتابعة Raven Progressive Matrices، طُورت هذه الاختبارات أساسًا بواسطة جون سي ريفن John C. Raven في 1936،حيث يطلب من المشاركين في الاختبار أن يتعرفوا على العنصر المفقود الذي يكمل النمط، وتظهر الكثير من الأنماط في أشكال مصفوفات، وقد قامت المصفوفات بقياس قدرة المشاركين على فهم المعنى من البيانات المعقدة أو المربكة.

تمكن الباحثون من تطوير نظام برمجي مصمم خصيصا لهذه المهمة وقادر على توليد مصفوفات فريدة لتطبيق هذا الاختبار على أنظمة الذكاء الاصطناعي، ثم دربوا أنظمة الذكاء الاصطناعي على حل هذا الاختبار، وكانت النتيجة أن أنظمة الذكاء الاصطناعي حققت نسبة دقة تصل إلى 63 في المائة في حل ألغاز اختبار معدل الذكاء IQ-style puzzles.

كما أنهم كانوا يختبرون قدرة الأنظمة على إدراك أنماط وعلاقات جديدة وتشكيل بنيات غير لفظية إلى حد كبير تجعل من السهل التعامل مع التعقيد.

وقال ديفيد باريت من ديب مايند: “الاستدلال المجرد مهم في مجالات مثل الاكتشافات العلمية حيث نحتاج إلى فرض فرضيات جديدة ثم نستخدم هذه الفرضيات لحل المشكلات، ومن المهم ملاحظة أن الهدف من هذا العمل ليس تطوير شبكة عصبية يمكنها اجتياز اختبارات الذكاء فقط”.

يمكن للبشر الذين يجلسون في الاختبارات أن يعطوا أنفسهم دفعة من خلال الإعداد المكثف للاختبارمسبقًا، ويتعلمون نوع القواعد المستخدمة في التحكم في الأنماط المستخدمة في المصفوفات، وهذا يعني بدلاً من استخدام فكرة مجردة أنهم يستخدمون المعرفة التي تعلموها بدلاً من ذلك.

بينما أنظمة الذكاء الاصطناعي التي تستخدم الشبكات العصبية المُغذية بكميات هائلة من البيانات للتعلم، يمكن بسهولة أن تتعلم فقط لالتقاط هذه الأنماط دون الحاجة إلى استخدام التفكير المجرد.

لذلك اختبر الباحثون مجموعة من الشبكات العصبية القياسية على خاصية واحدة داخل مصفوفة ولكن ليس كل الخصائص الممكنة، ووجدوا أنهم يؤدون أداءً سيئًا للغاية حيث وصلت نسبة الدقة إلى 22 بالمائة فقط، ومع ذلك فإن الشبكة العصبية المصممة خصيصًا والتي يمكن أن تستنتج العلاقات بين أجزاء مختلفة من اللغز سجلت أعلى دقة بنسبة 63 في المائة.

بسبب تصميم الاختبارات، لم يكن من الممكن مقارنة هذه الدرجات مباشرة مع الناس لأن أنظمة الذكاء الاصطناعي لديها تدريب مسبق على كيفية الحل، ولكن وجد الباحثون أن المشاركين الذين لديهم الكثير من الخبرة في الاختبارات والذين يمكن مقارنتهم مع الآلات المدربة، يمكن أن يسجلوا نسبة دقة أكثر من 80 في المائة، بينما غالبًا ما يفشل القادمون الجدد للاختبارات في الإجابة على جميع الأسئلة.

يشير هذا الاختبار إلى أن أنظمة الذكاء الاصطناعي القائمة حاليًا لن تكون قادرة على حل مهمات لم تدرب على حلها، وهذا يعني أنها تحتاج إلى المزيد من الوقت والمراقبة للوصول لذلك.

بينما في الأسابيع الأخيرة تم الكشف عن أن الذكاء الاصطناعي التابع لشركة جوجل يمكن أن يتعرف الآن على البيئة المحيطة به استنادًا إلى صورة واحدة، من خلال تدريب الأنظمة على المهام البصرية والمعرفية باستخدام مجموعات بيانات كبيرة من الصور المشروحة التي ينتجها البشر، حيث قام النظام الذكي الذي تم تطويره كجزء من برنامج ديب مايند بتدريب نفسه على تصور أي مساحة في صورة ثابتة، والذي يطلق عليها اسم شبكة الاستعلام التجريبية Generative Query Network، وهي إطار يتم من خلاله تعليم الأنظمة إدراك محيطها من خلال التدريب فقط على البيانات التي يتم الحصول عليها من أنفسهم أثناء تنقلهم في المكان، حيث يتعلم نظام GQN من خلال وضع ملاحظاته لفهم العالم من حوله. وللقيام بذلك يتعلم نظام GQN التعرف على المشاهد وخواصها الهندسية دون وضع أي علامات بشرية على محتويات هذه المشاهد.

يعطي نظام GQN الآلة “خيالًا شبيهاً بالإنسان”، وهذا يسمح للخوارزمية بتوليد انطباعات ثلاثية الأبعاد للمسافات التي لم ترها على الإطلاق في الصور المسطحة ثنائية البعد.

وقد أعلن ديميس هاسابيس الرئيس التنفيذي لشركة ديب مايند عن الطفرة التي حققتها أنظمة الذكاء الاصطناعي، مع نظام GQN حاول الدكتور هاسابيس وفريقه تكرار الطريقة التي يتعرف بها الدماغ البشري على بيئته المحيطة بمجرد النظر إليه، وهذا نهج مختلف تمامًا لمعظم المشاريع حيث يقوم الباحثون بتسمية البيانات يدويًا وإدخالها ببطء إلى أنظمة الذكاء الاصطناعي، ولتدريب الشبكات العصبية التابعة لشركة ديب مايند قام الفريق بعرض صور ثابتة مأخوذة من وجهات نظر مختلفة على نفس المشهد على أنظمة الذكاء الاصطناعي، وباستخدام هذه الصور تمكنت الخوارزمية من تعليم نفسها كيفية التنبؤ بظهور شيء ما في وجهة نظر جديدة غير مضمنة في الصور، وسرعان ما تعلمت الأنظمة تصور صور ثلاثية الأبعاد كاملة للمشهد.

وبناء على ذلك أصبحت الآلات الذكية قادرة على التحرك في المجال الذي تتخيله، ولكن أثناء تحركها يجب أن تقوم الخوارزمية بعمل تنبؤات باستمرار حول مكان الأشياء التي يتم مشاهدتها في البداية في الصور وما تبدو عليه من منظور دائم التغير.

نشر الباحثون ورقة بحثية توضح النتائج التي توصلوا إليها وقال الباحث علي اسلامى: “لم يكن من الواضح على الإطلاق أن الشبكة العصبية يمكن أن تتعلم ابدًا ابتكار صور بطريقة دقيقة ومضبوطة هكذا، ومع ذلك وجدنا أن الشبكات العميقة يمكن أن تتعلم عن المنظور العام والإغلاق والإضاءة، دون أي هندسة بشرية، وقد كانت هذه نتيجة مذهلة للغاية”.

لإنشاء هذه المشاهد الكاملة استخدم النظام مكونين، المكون الأول يعالج التمثيل ويقوم بعمل أكواد للمشهد ثلاثي الأبعاد في الصورة الساكنة وتحويله إلى شكل رياضي معقد، وهذا ما يُعرف باسم المتجه vector.

المكون الثاني يُطلق عليه اسم generative، والذي يستخدم المكون الأول المتجهات vectors لتخيل ما هو الشيء المختلف في هذا المشهد – بمعنى التعرف على الأجزاء الغير مضمنة في الصور الأصلية – وبناء عليه تصبح أنظمة الذكاء الاصطناعي قادرة على التأكد من العلاقات المكانية داخل المشهد، باستخدام البيانات التي تم جمعها من الصور الأولية.

كما يمكن لأنظمة الذكاء الاصطناعي المتطورة من جوجل أيضًا التحكم في الأشياء داخل هذا الفضاء الافتراضي المتخيل من خلال تطبيق فهمها للعلاقات المكانية على السيناريو.