MuZero من جوجل تتقن الألعاب دون معرفة القواعد

طورت شركة DeepMind خوارزمية للذكاء الاصطناعي تسمى MuZero قادرة على إتقان ألعاب Go والشطرنج وألعاب الفيديو دون إعطائها القواعد، مما يمثل اختراقًا رئيسيًا آخر لقسم الذكاء الاصطناعي في شركة جوجل.

وتتبع خوارزمية MuZero خورازمية AlphaGo، التي كانت بمنزلة البرنامج الحاسوبي الأول الذي يفوز على بطل بشري في لعبة اللوحة المعقدة Go.

وابتكرت شركة DeepMind في عام 2016 خوارزمية الذكاء الاصطناعي AlphaGo التي تتفوق على أفضل اللاعبين البشريين في Go.

وواصلت DeepMind تحسين عملها وقدمت بعد عام واحد خوارزمية AlphaGo Zero، التي تعلمت من خوارزمية AlphaGo اللعب بلعبة Go من خلال مراقبة مباريات الهواة والمحترفين.

وأتقنت AlphaGo Zero اللعبة القديمة من خلال اللعب ببساطة ضد نفسها، وقدمت DeepMind بعد ذلك خوارزمية AlphaZero القادرة على اللعب بلعبة Go والشطرنج باستخدام خوارزمية واحدة.

وكانت السمة المميزة لهذه الخوارزميات أنها تعرف قواعد الألعاب التي يجب عليها إتقانها أثناء تدريبها.

ولم يكن هناك حاجة لإخبار خوارزمية MuZero بقواعد go والشطرنج و shogi ومجموعة من ألعاب Atari لإتقانها، بحيث تعلمتها كلها من تلقاء نفسها ودون أي بيانات بشرية أو معرفة بالقواعد.

ووصف الباحثون الخوارزمية الجديدة بأنها خطوة مهمة إلى الأمام في السعي وراء خوارزميات الأغراض العامة، ونُشرت تفاصيل خوارزمية MuZero في ورقة بحثية في المجلة العلمية Nature.

وقال (ديميس هاسابيس) Demis Hassabis، الرئيس التنفيذي ومؤسس شركة DeepMind: هذا يقربنا من امتلاك الخوارزميات القادرة على التعامل مع الفوضى والتعقيد في العالم الحقيقي.

وأشاد خبراء الذكاء الاصطناعي البارزون بالشركة الناشئة التي تتخذ من لندن مقراً لها، التي استحوذت عليها شركة جوجل في عام 2014 مقابل 500 مليون دولار لريادتها في تطوير الذكاء الاصطناعي على مستوى الإنسان، بعد أن حققت عددًا من الإنجازات الرئيسية في هذا المجال.

ولم تحقق الشركة ربحًا بعد، وأعلنت في وقت سابق من هذا الشهر عن خسائر سنوية قدرها 477 مليون جنيه إسترليني في عام 2019، وذلك ارتفاعًا من 470 مليون جنيه إسترليني في عام 2018، لكن جوجل قادرة على سد استنزاف السيولة.