برامج وتطبيقات تحت الضوء دراسات وتقارير عالم الكمبيوتر منوعات تقنية

ابتكار نظام ذكاء اصطناعي يحول الأفكار إلى كلام مسموع ومفهوم

13 يناير 2020آخر تحديث: 6 ديسمبر 2023

2 دقائق

ابتكار نظام ذكاء اصطناعي يحول الأفكار إلى كلام مسموع ومفهوم

ابتكر باحثون في جامعة كاليفورنيا نظاماً حاسوبياً يتمتع بقدرات ذكاء اصطناعي متطورة بمقدوره تسجيل الإشارات الصادرة من الدماغ عند التحدث وتحويلها إلى كلام مفهوم. ولقد تم استخدام أقطاب كهربائية موضوعة على قشر الدماغ، وذلك بغية ترجمة الموجات الدماغية إلى كلمات يتحدث بها الحاسوب (الكمبيوتر). ويعد هذا تطوراً لافتاً ومميزاً في هذا الإطار، ولربما يُعوّل عليه في المستقبل القريب لمساعدة الأشخاص الذين فقدوا القدرة على التحدث.

بقلم: الدكتور عبدالسلام حلواني
المصادر: نيتشر.كوم | نيو سايانتست

عندما نتحدث، يرسل المخ إشارات من القشرة الحركية إلى العضلات في الفك والشفتين والحنجرة لتنسيق حركتهم وإنتاج صوت.

يقول إدوارد تشانج من جامعة كاليفورنيا سان فرانسيسكو: “إن الدماغ يترجم الأفكار وما تريد قوله إلى حركات عضلية تنفذ من قبل المسالك الصوتية، وهذا ما نحاول فك تشفيره”.

استخدام أقطاب كهربائية لفك تشفير الأفكار

ابتكر وزملاؤه عملية مؤلفة من خطوتين اثنتين لفك تشفير تلك الأفكار باستخدام مجموعة من الأقطاب الكهربائية التي وضعت جراحياً على جزء من الدماغ الذي يتحكم في الحركة، واستخدام الحاسوب (الكمبيوتر) في محاكاة وظيفة المسالك الصوتية، وذلك من أجل إعادة إنتاج الكلام المسموع.

في دراستهم، عملوا مع خمسة مشاركين لديهم أقطاب كهربائية على سطح القشرة الحركية كجزء من علاجهم للصرع. طُلب من هؤلاء الأشخاص قراءة 101 جملة بصوت عالٍ، وتضمنت كلمات وعبارات تغطي جميع الأصوات باللغة الانجليزية، بينما سجل الفريق الإشارات المرسلة من القشرة الحركية أثناء الكلام.

أكثر من 100 عضلة تشترك في عملية إنتاج الكلام

هناك ما يربو على 100 عضلة تستخدم لإنتاج الكلام، ويتم التحكم فيها عن طريق عدة مجموعات من الخلايا العصبية التي تعمل في وقت واحد بآلية غاية في التعقيد، لذلك ليس من البساطة رسم خرائط الإشارات من قطب واحد إلى عضلة واحدة لتفسير أوامر الدماغ للفم. لذلك، قام الفريق بتدريب خوارزمية لإعادة إنتاج صوت كلمة منطوقة من مجموعة الإشارات المرسلة إلى الشفاه والفك واللسان بناء على تدرب مسبق.

قال الفريق إن “الأداء الجيد” كان ممكنًا عند تدريب الجهاز على 25 دقيقة فقط من الكلام، وتم تحسين وحدة فك الترميز مع المزيد من البيانات”.

إنشاء ملفات صوتية بناءً على الإشارات

بمجرد إنشاء ملفات صوتية بناءً على الإشارات، طلب الفريق من مئات الناطقين باللغة الإنجليزية الاستماع إلى الجمل المنتجة من النظام الحاسوبي وتحديد الكلمات المفهومة.

سجل المستمعون 43% من التجارب بشكل مثالي عندما كان لديهم 25 كلمة للاختيار من بينها، و21% بشكل مثالي عندما كان لديهم 50 خيارًا. وتحسنت هذه النتائج تدريجياً مع تزويد الشبكة العصبية الاصطناعية بمزيد من التدريب والإشارات.

قد يمكّن ذلك في المستقبل، من استخدام خوارزمية مدربة على كلام شخص ما لفك تشفير الكلمات من مريض آخر دون تدريب طويل.

عندما طلب الفريق من شخص واحد تقليد الكلام عن طريق تحريك أفواههم دون إبداء أي أصوات. لم يعمل النظام جيدًا كما كان مع الكلمات المنطوقة.

الاعتماد على إشارات التحكم فقط

ميزة هذا النظام الاساسية بالمقارنة مع باقي الأنظمة السابقة أنه يعتمد فقط على إشارات التحكم من المناطق المحركة في الدماغ التي لا تزال تُرسل الإشارات حتى ولو كان الدماغ يخص شخصاً مشلولاً. لذلك، يمكن أن يكون أن يساعد هذا الجهاز الأشخاص الذين كانوا قادرين على الكلام في السابق، لكنهم فقدوا تلك القدرة بسبب عمل جراحي أو اضطرابات حركية تسببت في عجزهم عن الكلام. إذ يفقد الأشخاص عادة في مثل تلك الحوادث السيطرة على عضلاتهم.

Follow @aitnews

الوسوم