كشفت دراسة حديثة أن أحدث النماذج اللغوية الكبيرة من شركة “OpenAI”، وهو “GPT-4.5″، لم يجتز فقط اختبار تورنغ، بل تفوق أيضًا على البشر الفعليين في اعتبارهم كبشر.

واختبار تورنغ أو اختبار المحاكاة تم تطويره في عام 1949، وهو طريقة لتحديد ما إذا كان حاسوب أو برنامج قادرا على إظهار الذكاء البشري.

وتجتاز أنظمة الذكاء الاصطناعي اختبار تورنغ باستمرار، والذي يعتمد على تحديد الإنسان ما إذا كانت المحادثة تُدار بواسطة ذكاء اصطناعي أم بواسطة شخص آخر، مما يُظهر مدى تطور هذه التقنية.

وتشير نتائج الدراسة الجديدة، التي نُشرت في ورقة بحثية أولية تنتظر مراجعة الأقران، إلى أن “GPT-4.5” يمكنه إقناع المشاركين بإنسانيته أكثر من الأشخاص الحقيقيين عند تحديد شخصية محددة له ليتقمصها، بحسب تقرير لمجلة “نيوزويك”، اطلعت عليه “العربية Business”.

وعند إعطائه تعليمات لتقمص شخصية محددة، تم التعرف على “GPT-4.5” بشكل خاطئ على أنه إنسان بنسبة 73% من الوقت، وهو ما يزيد كثيرًا عن معدل النجاح المتوقع البالغ 50%.

وقارنت الدراسة عدة نماذج، بما في ذلك “LLama 3.1-405B” من شركة ميتا و”GPT-4o” من “OpenAI” وروبوت الدردشة “ELIZA”، حيث طُلب من المشاركين إما اختيار سيناريو “شخصية” أو “بدون شخصية”.

وقد كان أداء الذكاء الاصطناعي أفضل بكثير عندما تم منحه شخصية ليتقمصها، على سبيل المثال، مستخدم إنترنت شاب واعي ثقافيًا.

وبدون تقمص شخصية، انخفضت فعالية نموذج “GPT-4.5” إلى 36%. أما “GPT-4o”، فقد حقق 21% فقط، و”ELIZA”، الذي طُوّر في ستينيات القرن الماضي، فقد تفوق عليه قليلاً بنسبة 23%.

وقال كارستن جونغ، رئيس قسم الاقتصاد الكلي والذكاء الاصطناعي في معهد أبحاث السياسة العامة في المملكة المتحدة، لمجلة نيوزويك، إن هذا الاختراق كان مهمًا.

وأضاف أن الذكاء الاصطناعي تطور بشكل كبير لدرجة أنه لم يعد بإمكان الأشخاص تمييزه عن البشر في المحادثات.

وتابع: “في الواقع، تُظهر هذه الدراسة الجديدة أن الذكاء الاصطناعي يبدو للناس أكثر إنسانية من البشر أنفسهم”.