الذكاء الاصطناعي يمكنه تحويل نشاط المخ إلى كلمات!
تختبئ الإشارات العصبية لدى العديد من المصابين بالشلل أو فقد القدرة على الكلام في مكان ما من المخ. لم يتمكن أحد من فك شفرة هذه الإشارات مباشرةً، إلى أن تمكنت 3 فرق بحثية من إحراز تقدم ملحوظ في تحويل البيانات -المُلتقَطة من طريق أقطاب كهربية بعد تثبيتها جراحيًّا بالمخ وتوصيلها بالحاسوب- إلى كلام منطوق. من طريق تصميم نماذج محاكاة حاسوبية تُعرف باسم الشبكات العصبية، تمكن الباحثون من إعادة تصميم الكلمات والجُمل التي كانت غالبًا غير مفهومة للمستمع.
تقول ستيفاني مارتن Stephanie Martin مهندسة شبكات عصبية بجامعة جينيف- سويسرا: «لم تنجح الجهود السابقة في إعادة تكوين الكلام المنطوق، لكن تمكن الباحثون من إعادة بناء الكلام المنطوق من طريق مراقبة نشاط مخ الأشخاص في أثناء قراءتهم بصوت مسموع، أو قراءتهم في صمت، أو استماعهم لتسجيلات صوتية، والأمر المثير حقًا أن هذا الخطاب المُعاد بناؤه مفهوم».
بوسع الأشخاص الذين فقدوا القدرة على الكلام نتيجة سكتة دماغية أو أمراض أخرى التواصل باستخدام عيونهم أو حركات بسيطة لتوجيه مؤشر cursor أو اختيار حروف على الشاشة، مثلما تمكن ستيفن هوكينج Stephen Hawking من التحكم في زر مثبت بنظارته من طريق حركة الخد ليتحول إلى كلام منطوق. لكن تتيح التقنية الجديدة -بربط المخ بالحاسوب- الحديث مباشرةً دون الحاجة إلى وسيط، وأيضًا التحكم في نبرة الصوت والانخراط في المحادثات سريعًا.
يقول دكتور نيما ميسجاراني Nima Mesgarani عالم الحاسوب computer scientist بجامعة كولومبيا: «ما تزال العقبات كبيرة، نحاول اكتشاف نمط عمل العصبونات في وضعي التشغيل والتوقف، واستنتاج الكلام المنطوق في أثناء ذلك.
لكن يصعب رسم خارطة توضح آلية عملها مباشرةً، إذ تختلف ترجمة الإشارات العصبية إلى كلام منطوق من شخص إلى آخر، لذا نحتاج إلى تدريب نماذج المحاكاة الحاسوبية على كل شخص. تُعطي هذه النماذج نتائج أفضل حين تكون البيانات دقيقة، وهذا يستلزم شق الجمجمة لتوصيلها بالمخ مباشرةً».
يستطيع الباحثون إجراء هذه التسجيلات التداخلية في حالات نادرة فقط، مثلًا عند إزالة ورم من المخ، يتطلب ذلك توصيل أقطاب كهربية في المنطقة المكشوفة من المخ لتساعد الجراحين على تحديد مناطق الكلام والحركة لتجنبها. أيضًا عند زراعة أقطاب كهربية في مخ مرضى الصرع عدة أيام لتحديد المنطقة المسئولة عن المرض. تقول مارتن: «يجعل هذا وقت جمع البيانات محدودًا جدًّا، 20 – 30 دقيقة فقط».
بعد ذلك يُدخل الباحثون هذه البيانات إلى شبكات عصبية تعيد ترتيبها في أنماط معقدة من العُقد الحاسوبية computational nodes، ثم تعيد الشبكات ترتيب الاتصال بين تلك العقد. في أثناء التجربة، تعرضت الشبكات العصبية للتسجيلات الصوتية التي تحدث بها أو سمعها الشخص بالتزامن مع بيانات نشاط المخ لتربط هذه الشبكات بينها.
اعتمد ميسجراني وفريقه على بيانات من 5 مرضى بالصرع. حللت الشبكة العصبية تسجيلات من المنطقة السمعية بالمخ (التي تنشط عند الكلام أو السمع) بينما المرضى يستمعون إلى تسجيلات لأناس يعدون الأرقام من 0 إلى 9. تمكن الحاسوب من إعادة بناء الكلمات اعتمادًا على البيانات العصبية لنشاط المخ. بلغت دقة التسجيلات 75% عند الاستماع لها من أشخاص أصحَّاء.
اعتمد فريق بحثي آخر بقيادة تانيا شولتز Tanja Schultz من جامعة برمين الألمانية على بيانات مجمعة من 6 مرضى خضعوا لجراحة إزالة ورم بالمخ. سجل الفريق تسجيلًا صوتيًّا للمرضى في أثناء الجراحة حال نطقهم لكلمات أحادية المقطع، مع مراقبة النشاط الكهربي لمنطقة النطق ومنطقة الحركة (المسئولة عن إرسال الإشارات للأحبال الصوتية) في المخ.
وتمكن ميجيل أنجريك Miguel Angrick وكريستيان هيرف Christian Herff من جامعة ماستريخت من بناء شبكة عصبية اعتمادًا على قراءات الأقطاب الكهربية في أثناء التسجيلات الصوتية، ما سمح للحاسوب بإعادة بناء الكلمات باستخدام تلك البيانات غير المرئية لنشاط المخ. ووفقًا لنظام التقييم الحاسوبي computerized scoring system فإن 40% من الكلمات التي أعاد الحاسوب بناءها كانت مفهومة.
تمكن الفريق البحثي الثالث، بقيادة إدوارد تشانج Edward Chang جراح الأعصاب بجامعة كاليفورنيا- سان فرانسيسكو، من إعادة بناء جُمل كاملة باستخدام بيانات خاصة بنشاط المخ من 3 مرضى بالصرع، بعد تجميع هذه البيانات في أثناء قراءتهم لها بصوت مسموع.
وفي استطلاع على الانترنت شارك فيه 166 شخصًا باستماعهم لتلك الجمل واختيار الإجابة من ضمن 10 خيارات مكتوبة، تمكنوا من الإجابة عنها بدقة في 80% من المرات. عدَّل الباحثون نموذج المحاكاة لإعادة بناء الجمل اعتمادًا على بيانات نشاط المخ المسجلة حال قراءة الأشخاص لها دون صوت. يقول هيرف: «هذه النتائج مهمة. إنها خطوة للأمام نحو بناء الكلام الذي تحتويه عقولنا دون أن ننطق به».
توضح ستيفاني ريس Stephanie Riès عالمة الأعصاب بجامعة كاليفورنيا- سان دييجو: «نتطلع إلى رؤية نتائج التجربة مع مرضى لا يستطيعون التحدث». فالإشارات المخية حين يستمع الانسان لأصوات معينة أو يتحدث في سره قد لا تتطابق مع تلك الإشارات الصادرة عن المخ حال الكلام المنطوق. حينها قد يصعب على الحاسوب تمييز الكلام غير المنطوق أو ربطه مع نشاط المخ في غياب قدرة هؤلاء المرضى على الكلام بصوت مسموع.
يقول جيرون شاك Gerwin Schalk، اختصاصي الهندسة العصبية بجامعة نيويورك- ألباني: «ستكون قفزةً هائلة حقًّا إذا استطعنا فك شفرة حديث تخيلي في المخ. ليس لدي فكرة كيف سنتمكن من فعل هذا».
يقول هيرف: «من الأساليب المقترحة للتغلب على هذه العقبة تكوين واجهة تفاعلية بين الحاسوب والشخص، يراقب الحاسوب نشاط المخ ويترجمه إلى كلام يستمع إليه الشخص في الوقت ذاته، ليتفاعل مع الحاسوب حول دقة الكلام أو يغير الأفكار حتى يصل إلى المعنى المطلوب. وهو ما يمكِّن الإنسان والحاسوب من العمل معًا للوصول إلى النتيجة المرجوة».