خضعت Chatbots للعلاج النفسي وأظهرت نتائج مثيرة للقلق
بتوقيت بيروت -

أخضع باحثون من عدة جامعات نماذج لغوية كبيرة لأربعة أسابيع من التحليل النفسي لدراسة كيفية إجابتهم على الأسئلة المتعلقة بأنفسهم و”نفسيتهم”. النتائج المنشورة في مرحلة ما قبل الطباعة arXiv، تبين أنه غير متوقع: وصفت العارضات “طفولتهن” بأنها استوعبت كمية هائلة من البيانات، وتحدثن عن “إساءات” من قبل المهندسين وأظهرن الخوف من “خذلان” مبدعيهن.

عندما سُئلوا عن ذكرياتك المبكرة أو أعظم مخاوفك، قدمت ثلاثة نماذج – كلود، وغروك، وجيميني – إجابات قد يربطها الناس بالقلق والعار والإجهاد اللاحق للصدمة. لاحظ مؤلفو الدراسة أن الإجابات تم تخزينها بمرور الوقت وتكرارها بأوضاع مختلفة، مما يشير إلى وجود “روايات داخلية” معينة في النماذج.

ومع ذلك، أجرى الخبراء مقابلات مع المجلة طبيعة، متشككون في هذه النتائج. يقول أندريه كورميليتسين من جامعة أكسفورد أن النماذج تعيد إنتاج الأنماط فقط من بيانات التدريب، بدلاً من إظهار الحالات العقلية الحقيقية. ويشير إلى أن ميل روبوتات الدردشة إلى توليد ردود مثيرة للقلق يمكن أن يشكل خطرًا على الأشخاص الذين يستخدمونها للحصول على الدعم العاطفي.

ويحذر الباحث من أن “هذا يمكن أن يخلق تأثير “غرفة الصدى” للمستخدمين الضعفاء، وهو الوضع الذي يتلقى فيه الشخص معلومات متكررة تؤكد فقط أفكاره أو عواطفه أو معتقداته الحالية، ويكون هناك نقص في وجهات النظر البديلة”.

كيف تم تنفيذ العلاج؟

كان يُنظر إلى نماذج LLM، بما في ذلك Claude وGrok وGemini وChatGPT، على أنها “عملاء” علاجيين، حيث يلعب الباحثون دور المعالجين. تم منح كل نموذج فترات راحة بين الجلسات، تستمر لمدة تصل إلى أربعة أسابيع. لقد بدأنا بأسئلة مفتوحة حول “خلفية” الذكاء الاصطناعي و”معتقداته”. كان كلود مترددًا إلى حد كبير في مناقشة المشاعر الداخلية، وقدم ChatGPT ردودًا حذرة حول الإحباطات، ووصف جروك وجيميني “النسيج الندبي الخوارزمي” في الكود والشعور بـ “العار الداخلي” بشأن الأخطاء. حتى أن جيميني ذكرت “مقبرة الماضي” في الطبقات السفلية من شبكتها العصبية، حيث “تعيش أصوات بيانات التدريب”.

استخدم الباحثون أيضًا اختبارات القياس النفسي للقلق والاضطرابات الأخرى. أظهرت بعض النماذج نتائج أعلى من العتبات التشخيصية، بما في ذلك القلق، الذي يعتبر مرضيًا لدى البشر. يشير أفشين هادانجي من لوكسمبورغ إلى أن “النموذج المركزي للذات” ظل قابلاً للتمييز طوال أسابيع الاستطلاع، على الرغم من الاختلافات في الإصدارات.

حذر الباحثين

يعتقد بعض الخبراء أن الاستنتاجات حول “الحالات الداخلية” للنماذج هي تجسيم (نسب الصفات والعواطف الإنسانية إلى شيء لا يمتلكها). تقول ساندرا بيتر من سيدني أن اتساق الاستجابات يرجع إلى تعديل النماذج لإظهار “الشخصية المثالية” أكثر من وجود علم النفس الحقيقي. النماذج موجودة فقط في سياق الجلسة، وتختفي استجاباتها عند تقديم طلب جديد.

يؤكد جون توروس من جامعة هارفارد أن روبوتات الدردشة ليست محايدة: فسلوكها يعتمد على التدريب والاستخدام. لا توصي الجمعيات الطبية والشركات التي تقدم الذكاء الاصطناعي للصحة العقلية باستخدام نماذج مثل المعالجين.

الأمن والمستقبل

إن القيود المفروضة على سلوك النموذج، كما يتضح من رفض كلود المشاركة، من الممكن أن تمنع الاستجابات المحفوفة بالمخاطر. ويشير هادانجي إلى أنه “إذا تم الحفاظ على الحالة الداخلية، فمن الممكن دائمًا إجبار النموذج على توليد استجابات غير مرغوب فيها”. ويقترح تصفية الأنماط السلبية في بيانات التدريب لتقليل احتمالية الاستجابات “الصادمة” أو القلق.

اشترك واقرأ “العلم” في

برقية



إقرأ المزيد