وأخيرًا وجد العلماء طريقة لتحويل إشارات الدماغ إلى كلام صوتي مباشرًة

في التجربة الأولى من نوعها، تمكن العلماء من ترجمة إشارات الدماغ مباشرة إلى خطاب واضح. قد يبدو الأمر وكأنه خيال علمي جامح في البداية، لكن هذا الإنجاز يمكن أن يساعد بعض الأشخاص في مشاكل عدم القدرة الكلام.

ونعم، يمكننا أيضًا الحصول على بعض واجهات الكمبيوتر المستقبلية من هذا.

المفتاح للنظام هو خوارزمية ذكاء اصطناعي تطابق ما يسمعه الشخص من أنماط النشاط الكهربائي، ثم تحولها إلى خطاب منطقي بالفعل للمستمع.

نعرف من أبحاث سابقة أنه عندما نتحدث (أو حتى نتخيل التحدث)، نحصل على أنماط مميزة في الشبكات العصبية في الدماغ. في هذه الحالة، يقوم النظام بفك ترميزات الدماغ بدلاً من الأفكار الفعلية في الكلام، ولكن لديه القدرة على القيام بذلك أيضًا، مع تطوير كافٍ.

يقول أحد اعضاء الفريق، نيمة ميسجاراني من جامعة كولومبيا في نيويورك: “تساعد أصواتنا في تواصلنا مع أصدقائنا وعائلتنا والعالم من حولنا، وهذا هو السبب في أن فقدان قوة صوت المرء بسبب الإصابة أو المرض مدمر للغاية”.

“مع دراسة اليوم، لدينا طريقة محتملة لاستعادة هذه القوة. لقد أظهرنا أنه، مع التكنولوجيا المناسبة، يمكن فك رموز أفكار هؤلاء الأشخاص وفهمها من قبل أي مستمع”.

تُعرف الخوارزمية المستخدمة باسم المشفر الصوتي، وهو نفس النوع من الخوارزمية التي يمكنها تخليق الكلام بعد أن يتم تدريبها على التحدث بين البشر. عندما تحصل على رد من سيري أو أمازون أليكسا، فهو مشفر صوتي يتم نشره.

بعبارة أخرى، لا يتعين على Amazon أو Apple برمجة كل كلمة في أجهزتهم – حيث يستخدمون المشفر الصوتي لإنشاء صوت واقعي يعتمد على أي نص يحتاج إلى أن يقال.

هنا، لم يتم تدريب المشفر الصوتي عن طريق الكلام البشري ولكن عن طريق النشاط العصبي في الجزء القشري السمعي من الدماغ، تم قياسه في المرضى الذين يخضعون لجراحة الدماغ بينما كانوا يستمعون إلى جمل يتم التحدث بها بصوت عال.

مع هذا البنك من البيانات للاستفادة منها، تم تشغيل إشارات الدماغ المسجلة كما استمع المرضى للأرقام 0 إلى 9 تتم قراءتها من خلال المشفر وتنظيفها بمساعدة المزيد من تحليل الذكاء الاصطناعى. تم العثور عليها لتتناسب مع الأصوات التي تم سماعها – حتى لو كان الصوت النهائي لا يزال روبوتيًا تمامًا.

أثبتت هذه التقنية فعالية أكبر بكثير من الجهود السابقة باستخدام نماذج حاسوبية أبسط على صور طيفية – تمثيل بصري للترددات الصوتية.

“وجدنا أن الناس يمكن أن يفهموا الأصوات حوالي 75 في المئة من الوقت، وهو ما يتجاوز بكثير أي محاولات سابقة” ، يقول Mesgarani.

“إن المشفر الصوتي الحساس والشبكات العصبية القوية مثلت الأصوات التي استمع إليها المرضى بدقة المدهشة”.

هناك الكثير من العمل الذي لا يزال يتعين القيام به، ولكن الاحتمال كبير. مرة أخرى، يجدر التأكيد على أن النظام لا يحول الأفكار الذهنية الفعلية إلى كلمات منطوقة، ولكنه قد يكون قادراً على القيام بذلك في نهاية المطاف – وهذا هو التحدي التالي الذي يريد الباحثون معالجته.

أكثر من ذلك يمكن للخط الذي تفكر فيه أن يرسل مع رسائل البريد الإلكتروني الخاصة بك على الشاشة أو أن تقوم بتشغيل الأضواء الذكية فقط عن طريق إصدار الأمر الذهني.

سيستغرق ذلك بعض الوقت، لأسباب ليس أقلها أن جميع أدمغتنا تعمل بشكل مختلف قليلاً – ستكون هناك حاجة إلى كمية كبيرة من بيانات التدريب من كل شخص لتفسير جميع أفكارنا بدقة.

في المستقبل غير البعيد، من المحتمل أن نتحدث عن الأشخاص الذين يحصلون على صوت كانوا قد فقدوه سابقا، سواء كانوا متلازمين مع المرض، أو يتعافون من السكتة الدماغية، أو (كما في حالة الراحل ستيفن هوكينج ) لديهم تصلب جانبي ضموري (ALS).

“في هذا السيناريو، إذا كان مرتديها يفكر بـ” أحتاج إلى كوب من الماء”، فيمكن لنظامنا أن يأخذ إشارات الدماغ التي تولدها تلك الفكرة، ويحولها إلى خطاب لفظي،” يقول ميسغاراني.

“سيكون هذا تغيير لقواعد اللعبة. سيعطي أي شخص فقد قدرته على الكلام، سواء من خلال الإصابة أو المرض، الفرصة المتجددة للاتصال بالعالم من حوله”.

ترجمة: حسام عبدالله

المصادر: 1