ابتكار طريقة تمنع أنظمة الذكاء الاصطناعي من إيذاء البشر
يستطيع الذكاء الاصطناعي اكتشاف كيفية القيام بأي مهمة، إذ يمكنه محاكاة هيئة الكون، وحل مكعب روبيك باستخدام يد واحدة فقط، واكتشاف أشباح مختبئة في ماضينا.
يُفترض أن تكون هذه التطورات في صالحنا، لكن ماذا لو حدث العكس؟
إن الأنظمة الخوارزمية -التي تؤثر في حياة الناس بالفعل مؤخرًا- تُظهر وجود أنظمة إنذار متحيزة في عملياتها، مثل توقع حدوث جرائم على أساس العرق، أو وضع قيود للائتمان اعتمادًا على الجنس.
في ظل ذلك، كيف يكون بوسع العلماء تأكيد إن أنظمة التفكير المتقدمة عادلة أو آمنة؟
تحاول دراسة جديدة يقودها باحثون في جامعة ماساتشوستس أمهيرست Massachusetts Amherst الإجابة عن هذا السؤال، بوصف إطار يمنع ما يسميه الفريق «السلوك غير المرغوب فيه» للآلات الذكية.
يقول فيليب توماس Philip Thomas الباحث في مجال التعلم الآلي: «عندما تزود آلةً بخوارزمية تعليمية، يصعب السيطرة على سلوكها. من المهم وجود وسائل تؤكد إنصاف هذه الآلات وعدم قدرتها على الإيذاء، إذ إن خوارزميات التعلم الآلي قادرة على التأثير في حياتنا كثيرًا».
شاهد الفيديو
إن إطار العمل الذي يقترحه الفريق للمساعدة على تطوير أنماط جديدة من خوارزميات التعلم الآلي ML algorithms لا يتضمن أنظمة الذكاء الاصطناعي بمبادئ أو مفاهيم أخلاقية، لكنه يعتمد على تمكين الباحثين من تحديد السلوك غير المرغوب فيه وتنظيمه عند تصميم الخوارزميات الأساسية.
من أهم هذه النظم الجديدة خوارزميات سيلدون Seldonian algorithms التي سُميت تيمنًا بالشخصية الرئيسية في سلسلة الخيال العلمي الشهيرة لإسحاق أسيموف Isaac Asimov. لا تضمن هذه الخوارزميات صحة الجانب الأخلاقي فحسب، لكنها أيضًا تضمن سلامة أداء الآلات عمومًا، مثل نظم الأمان المعقدة في المعدات الطبية.
يوضح توماس: «إذا استخدمنا هذه الخوارزميات في علاج مرض السكري مثلًا، فبوسعنا تحديد السلوك غير المرغوب فيه بانخفاض مستوى سكر الدم. يمكننا أن نأمر الآلة بتحسين السيطرة على مضخة الإنسولين، وذلك بعدم السماح بحدوث تغيرات تؤدي إلى تكرار النقص في سكر الدم. أكثر الخوارزميات السابقة لا تمكنك من تحديد مثل هذا السلوك، إذ لم تتضمنه التصاميم الأولى».
من هنا، طور الفريق خوارزمية للتحكم في مضخة إنسولين آلية، وذلك بوضع نظام بوسعه تحديد الجرعات المناسبة لكل شخص اعتمادًا على قياسات السكر في دمه.
أيضًا طوروا -في تجربة أخرى- خوارزمية للتنبؤ بالمعدل التراكمي للطلاب، دون أن تتضمن التحيز على أساس الجنس كما حدث في الخوارزمية السابقة.
أجرى الباحثون هذه التجارب لإثبات ما تستطيع خوارزمية سيلدون فعله، وأن ما يهم في مثل هذا العمل هو الإطار نفسه، الذي يمكن أن يستخدمه علماء آخرون دليلًا لصنع أنظمة ذكاء اصطناعي مستقبلية.
وقال توماس: «نؤمن بوجود مجال هائل لتطوير هذا المجال. لقد حققنا نتائج مبهرة حتى باستخدام خوارزميات مكونة من عناصر بسيطة. نأمل أن يستمر الباحثون في مجال التعلم الآلي بتطوير خوارزميات جديدة وأكثر تعقيدًا اعتمادًا على هذا الإطار، الذي يمكن استخدامه استخدامًا مسؤولًا في تطبيقات كان استخدام التعلم الآلي فيها يُعَد مخاطرةً كبرى».