الذكاء الاصطناعي يجتاز اختبار تورينج بشكل أفضل من الإنسان

وفقًا لدراسة جديدة، اجتاز روبوت دردشة رائد يعمل بتقنية الذكاء الاصطناعي اختبار تورينج بشكل أكثر إقناعًا من الإنسان.
وأظهرت نتائج اختبار تورنج أن نموذج OpenAI GPT-4.5، الذي يُشغّل أحدث إصدار من ChatGPT، الذي يعد نموذج بشري "أكثر بكثير من البشر الحقيقيين".
ويُعدّ اختبار تورينج، الذي اقترحه عالم الكمبيوتر البريطاني آلان تورينج لأول مرة عام 1950، مقياسًا لمدى قدرة الذكاء الاصطناعي على مضاهاة الذكاء البشري، حيث يتضمن الاختبار محادثة نصية مع مُستجوب بشري، والذي عليه تقييم ما إذا كان التفاعل مع إنسان آخر أم آلة.
وشارك ما يقرب من 300 مشارك في أحدث دراسة، والتي أجرت اختبارات على روبوتات دردشة مختلفة ونماذج لغوية كبيرة (LLMs)، حيث تم تصنيف برنامج OpenAI GPT-4.5 على أنه إنسان بنسبة 73% عند تكليفه بتبني شخصية.
تعليقات على الدراسة
كتب الدكتور كاميرون جونز، باحث ما بعد الدكتوراه من جامعة كاليفورنيا في سان دييغو، والذي قاد الدراسة، في منشور على X: "نعتقد أن هذا دليل قوي على أن [روبوتات الدردشة التي تعمل بتقنية الذكاء الاصطناعي] تجتاز اختبار تورينج، بل إن 4.5 تم تصنيفه على أنه إنسان بنسبة أكبر بكثير من البشر الفعليين".
وهذه ليست المرة الأولى التي يتفوق فيها برنامج ذكاء اصطناعي على اختبار تورينج، على الرغم من أن الباحثين من جامعة كاليفورنيا في سان دييغو الذين أجروا الدراسة يزعمون أن هذا هو الدليل الأكثر شمولًا على اجتياز المعيار.
وشملت النماذج الأخرى التي تم اختبارها في أحدث الأبحاث برنامج Meta's Llama-3.1، والذي اجتاز الاختبار بشكل أقل إقناعًا.
وعلى الرغم من اجتياز اختبار تورينج، أشار الباحثون إلى أن هذا لا يعني أن روبوتات الذكاء الاصطناعي تتمتع بذكاء بمستوى ذكاء الإنسان، المعروف أيضًا باسم الذكاء الاصطناعي العام (AGI)، ويعود ذلك إلى أن طلاب ماجستير القانون مُدرَّبون على مجموعات بيانات ضخمة للتنبؤ بالإجابة الصحيحة، مما يجعلهم في الأساس شكلًا متقدمًا من أشكال التعرف على الأنماط.
والأهم من ذلك، أعتقد أن النتائج تُقدِّم دليلًا إضافيًا على أن طلاب ماجستير القانون يُمكنهم استبدال الأشخاص في التفاعلات القصيرة دون أن يُدرك أحد ذلك، وقد يؤدي هذا إلى أتمتة الوظائف، وتحسين هجمات الهندسة الاجتماعية، واضطراب مجتمعي أوسع نطاقًا.