كشف باحثون في شركة آبل عن بعض الأخطاء المنطقية الجسيمة في استدلال الذكاء الاصطناعي التوليدي، خاصة عندما يتعلق الأمر بالأرقام والرياضيات، مما يشير إلى فشل الذكاء الاصطناعي في تقديم حلول تتعلق بالعمليات الرياضية المعقدة والأساسية في المدارس الابتدائية.
الذكاء الاصطناعي يفشل في حل العمليات الحسابية المعقدة
أظهرت ورقة بحثية نُشرت مؤخرًا بواسطة ستة باحثين في شركة Apple أن الاستدلال الرياضي الذي تستخدمه نماذج اللغات الكبيرة المتقدمة (LLMs) قد يكون غير دقيق وهشًا. استخدم الباحثون الذكاء الاصطناعي لحل مجموعة بيانات من أسئلة الرياضيات المتنوعة لغوياً في المدارس الابتدائية، وجمعوا الاختبار الموحد الذي يتكون من 8000 مسألة رياضية على مستوى المدرسة الابتدائية، ثم قام الباحثون بتغيير الصياغة قليلاً دون تغيير منطق المشكلة وأطلقوا عليها اسم هذا الاختبار هو اختبار GSM-Symbolic.
دراسة تكشف فشلاً جديداً للذكاء الاصطناعي في مواجهة صعوبة الرياضيات
سجلت المجموعة الأولى من الاختبارات انخفاضا في الأداء تراوح بين 0.3% و9.2%، بينما أظهرت المجموعة الثانية، التي تضمنت بيانا عن بعض المسائل التي لا علاقة لها بالإجابة، «انخفاضا كارثيا في الأداء» من نحو 17.5% إلى 65.7%. . .
وخلصت الدراسة إلى أن الذكاء الاصطناعي يجد صعوبة في حل بعض المهام البسيطة المتعلقة بالأرقام، وهو ما يؤكد في الواقع أنه يفشل في الإجابة على العمليات الحسابية بشكل صحيح، بل يستخدم بدلاً من ذلك “مطابقة الأنماط” البسيطة لتحويل البيانات إلى عمليات دون فهم حقيقي.
وأكد الباحثون أن الذكاء الاصطناعي يميل إلى الفشل في حل المسائل الرياضية البسيطة لأن الكلمات كانت مربكة للغاية أو لا تتبع النمط الدقيق. كما يبدو أن الذكاء الاصطناعي يعطي وهم “الاستدلال” ويعتمد بدلا من ذلك على تخزين البيانات ومن ثم معالجتها.
للمزيد : تابعنا هنا ، وللتواصل الاجتماعي تابعنا علي فيسبوك وتويتر .
مصدر المعلومات والصور: socialpress