حقق نموذج جديد للذكاء الاصطناعي (AI) نتائج على المستوى البشري في اختبار مصمم لقياس “الذكاء العام”، حيث سجل نظام OpenAI’s o3 85% على معيار ARC-AGI، وهو أعلى بكثير من أفضل نتيجة سابقة للذكاء الاصطناعي والتي بلغت 55%. وعلى قدم المساواة مع متوسط الدرجات البشرية، فقد سجل أيضًا نتائج جيدة في اختبار رياضيات صعب للغاية.
وفقًا لـ Techxplore، فإن إنشاء ذكاء اصطناعي عام، أو AGI، هو الهدف المعلن لجميع مختبرات أبحاث الذكاء الاصطناعي الرئيسية، ويبدو أن OpenAI قد خطت خطوة كبيرة على الأقل نحو هذا الهدف.
يشعر العديد من الباحثين والمطورين في مجال الذكاء الاصطناعي أن شيئًا ما قد تغير، وبالنسبة للكثيرين، يبدو احتمال الذكاء العام الاصطناعي الآن أكثر واقعية، وأكثر إلحاحًا، وأقرب مما كان متوقعًا.
أيضًا، لفهم ما تعنيه درجة o3، عليك أن تفهم ما يدور حوله اختبار ARC-AGI. ومن الناحية الفنية، يعد هذا اختبارًا لـ “كفاءة العينة” لنظام الذكاء الاصطناعي في التكيف مع شيء جديد.
نظام الذكاء الاصطناعي مثل ChatGPT (GPT-4) ليس فعالاً للغاية في التعامل مع العينات. لقد تم “تدريبها” على ملايين الأمثلة من النصوص البشرية، وبناء قواعد احتمالية حول مجموعات الكلمات الأكثر احتمالية، لذا فهي تحقق نتائج جيدة جدًا في المهام الشائعة، وهي سيئة للغاية. على المهام غير الشائعة، لأنه يحتوي على بيانات أقل (عينات أقل) حول هذه المهام.
تحتاج أنظمة الذكاء الاصطناعي إلى التعلم من عدد صغير من الأمثلة والتكيف بشكل أكثر كفاءة في التعامل مع العينات، وحتى يتم ذلك، سيتم استخدامها فقط في الوظائف المتكررة للغاية وتلك التي يكون الفشل فيها مقبولاً.
تُعرف القدرة على حل المشكلات غير المعروفة أو الجديدة بدقة من عينات محدودة من البيانات بالقدرة على التعميم، ويُنظر إليها على نطاق واسع على أنها عنصر ضروري، بل وأساسي، للذكاء.
تشبه اختبارات الذكاء الاصطناعي اختبارات الذكاء التي قد تتذكرها أحيانًا من المدرسة، ولا نعرف بالضبط كيف قامت OpenAI بذلك، لكن النتائج تشير إلى أن نموذج o3 قابل للتكيف بدرجة كبيرة، ومع بعض الأمثلة فقط، يجد القواعد التي يمكن تعميمها.
بدأت OpenAI بإصدار للأغراض العامة من نموذج o3، والذي يختلف عن معظم النماذج الأخرى لأنه يمكنه قضاء المزيد من الوقت في “التفكير” في الأسئلة الصعبة، ثم قام بتدريبه خصيصًا لاختبار ARC-AGI.
يعتقد الباحث الفرنسي في الذكاء الاصطناعي فرانسوا شوليه، الذي صمم المعيار، أن o3 يبحث من خلال “سلاسل فكرية” مختلفة تصف خطوات حل المهمة، ثم يختار “الأفضل” وفقًا لقاعدة غير محددة بوضوح، أو “قاعدة الاستدلال”. “.
وهذا “لا يختلف كثيرًا” عن الطريقة التي بحث بها نظام AlphaGo من Google عبر تسلسلات مختلفة محتملة من الحركات للتغلب على بطل العالم في Go، ومن الممكن أن يكون هناك الآلاف من البرامج المختلفة التي تبدو صالحة بنفس القدر.
لا يزال كل شيء تقريبًا حول o3 غير معروف، حيث لم تكشف عنه OpenAI إلا في عدد قليل من العروض التقديمية الإعلامية والاختبارات المبكرة لعدد قليل من الباحثين والمختبرات ومنظمات سلامة الذكاء الاصطناعي.
إن الفهم الحقيقي لإمكانيات O3 سيتطلب عملاً مكثفًا، بما في ذلك التقييمات وفهم توزيع قدراتها، وعدد مرات فشلها، وعدد مرات نجاحها.
عندما يتم إصدار o3، سيكون لدينا فكرة أفضل بكثير عما إذا كان قابلاً للتكيف تقريبًا مثل الإنسان العادي.
وإذا كان الأمر كذلك، فمن الممكن أن يكون له تأثير اقتصادي ضخم وثوري، ويبشر بعصر جديد من الذكاء المتسارع الذي يعمل على تحسين الذات. سنحتاج إلى معايير جديدة للذكاء الاصطناعي العام نفسه والتفكير الجاد في كيفية إدارته. إذا لم يكن الأمر كذلك، فستظل هذه نتيجة مثيرة للإعجاب. ومع ذلك، ستبقى الحياة اليومية كما هي إلى حد كبير.
للمزيد : تابعنا هنا ، وللتواصل الاجتماعي تابعنا علي فيسبوك وتويتر .
مصدر المعلومات والصور: socialpress