اختبار الرياضيات لنموذج الذكاء الاصطناعي o3 يكشف كذب “OpenAI”

اختبار الرياضيات لنموذج الذكاء الاصطناعي o3 يكشف كذب "OpenAI"
21 أبريل 2025
(شباب اف ام) -

في خطوة أثارت تساؤلات حول الشفافية والمصداقية، كشفت نتائج اختبار مستقلة عن أداء أقل من المتوقع لنموذج الذكاء الاصطناعي o3 الذي طورته شركة OpenAI، وذلك مقارنةً بالنتائج التي أعلنتها الشركة سابقًا.

وكانت “OpenAI” قد استعرضت في ديسمبر قدرات النموذج الجديد، مشيرة إلى أنه قادر على الإجابة على أكثر من ربع أسئلة اختبار “FrontierMath” المتقدم، “اختبار مسائل رياضيات معقدة”، متفوقًا بشكل لافت على النماذج المنافسة التي لم تتجاوز دقتها 2% فقط.

وخلال بث مباشر، صرّح مارك تشين، كبير الباحثين في “OpenAI”، بأن النموذج حقق نسبة تجاوزت 25% عند اختباره داخليًا باستخدام بنية حوسبية متقدمة، بحسب تقرير نشره موقع “تك كرانش” واطلعت عليه “العربية Business”.

غير أن هذه النتيجة تمثل على الأرجح الحد الأقصى لأداء النموذج، إذ تبيّن لاحقًا أنها كانت مستندة إلى نسخة تجريبية أكثر قوة من تلك التي طرحتها الشركة للعامة.

وفي تقرير حديث، أعلن معهد “Epoch AI” – الجهة المطورة لمعيار “FrontierMath” – أن الاختبارات التي أجراها على الإصدار العام من o3 أظهرت أداءً أقل بكثير، إذ لم يتجاوز النموذج حاجز 10% من الإجابات الصحيحة.

ورغم أن هذه النتيجة لا تُثبت أن “OpenAI” قدّمت معلومات مغلوطة، فإنها تثير تساؤلات حول أسلوب الشركة في عرض قدرات نماذجها.

وأوضح معهد Epoch أن الفروقات قد تكون ناجمة عن اختلاف الإعدادات الحوسبية، أو عدد المسائل المستخدمة في كل اختبار.