في نهاية فعالية 12 يومًا مع الذكاء الاصطناعي، كشفت شركة OpenAI عن أحدث نماذج الذكاء الاصطناعي لديها (o3 وo3 mini)، معلنة بذلك بداية فصل جديد لتقنية الذكاء الاصطناعي. وفي الجلسة الاختتامية للفعالية التي نظمتها شركة أوبن إيه آي، سلط رئيس الشركة سام ألتمان الضوء على الميزات والإمكانات الرائعة التي تتمتع بها أحدث نماذجها (o3 وo3 mini) والتي قال أنها مصممة لحل المشكلات الأكثر تعقيدًا.
أوبن إيه آي تكشف عن o3 وo3 mini
أعلنت شركة OpenAI عن إطلاق o3 وo3 mini، النسخة المحسنة باستخدام المنطق من نموذج الذكاء الاصطناعي الأكثر تقدمًا حتى الآن. النموذج الجديد قادر على تقديم الاستجابات خطوة بخطوة بطريقة أكثر منطقية؛ قال الرئيس التنفيذي لشركة OpenAI سام ألتمان، خلال الإطلاق، إن الشركة تنظر إلى o3 على أنه بداية مرحلة جديدة من الذكاء الاصطناعي. وقال إن هذه النماذج يمكن استخدامها للقيام بالمهام المنطقية الأكثر تعقيدًا.
ماهو نموذج o3
o3 هو نموذج ذكاء اصطناعي رائد تم تطويره لتقديم تفكير وذكاء متقدمين عبر مجموعة من المهام المعقدة؛ إنه مصمم لتعزيز التفكير وإتقان البرمجة وحل المشكلات الصعبة والمعقدة في الترميز والذكاء العام والرياضيات، وهو أمر لم يتم القيام به بواسطة النماذج القديمة.
تم الإعلان عنه بالإضافة لإصدار أصغر هو، o3 Mini. والذي يعد بديلاً ميسور التكلفة لنموذج o3. يوفر o3 mini التفكير التكيفي، مما يسمح للمستخدمين بتعديل جهود التفكير بناءً على تعقيد المهمة. يوفر التفكير غير المجهد في النموذج السرعة والكفاءة اللازمتين للمهام البسيطة، وللمهام المعقدة، فإنه يستخدم جهدًا أعلى للدقة. وفقًا لشركة OpenAI، فإن مرونة نموذج o3 Mini تجعله الأنسب للمطورين والباحثين.
مميزات نموذج o3 الجديد
- القدرة على حل المسائل المعقدة المتعلقة بالترميز.
- الكفاءة في حل المشكلات العلمية.
- القدرة على معالجة التفكير في المشكلات المعقدة.
- القدرة على حل بعض المشكلات الرياضية المتقدمة والمنطقية الصعبة.
- سجل نموذج o3 نسبة 25.2% في اختبار EpochAI Frontier Math, والذي يعد من بين أصعب الاختبارات الرياضية التي تتضمن مشكلات لم يتم نشرها من قبل، بينما لم تتجاوز نماذج الذكاء الاصطناعي الأقدم من مختلف أنحاء الصناعة من تجاوز نسبة 2% فقط.
ما الفرق بين o3 وo1؟
إليك مقارنة توضح الفرق بين نموذج o3 الجديد وo1 الذي تم إطلاقه في سبتمبر:
المعيار | النموذج | التفصيل | |
o3 | o1 | ||
الترميز: في اختبار SWE-bench verified | حقق نموذج o3 دقة بنسبة 71.7 % | سجل o1 نسبة 48.9% | (SWE-bench verified) هي مجموعة من الاختبارات لتقييم قدرة النموذج على الترميز |
البرمجة: (Codeforces) | سجل(o3) 2727 نقطة | سجل (o1) 1891 نقطة | |
المنطق الرياضي | سجل(o3) 96.7 % | 83.3 % سجلها 01 | في اختبار (AIME) 2024 |
معايير العلوم | سجل o3 دقة بنسبة 87.7 | بينما سجل(o1) 78% | خاصة في اختبار GPQA Diamond، وهو اختبار يحتوي على أسئلة على مستوى الدكتوراه |
متى سيكون نموذج o3 متاحًا؟
يقتصر حالياً استخدام كل من o3 وo3 mini على الباحثين من خلال برنامج اختبارات السلامة الخاص بشركة OpenAI. وبحسب ما ورد، سيكون طراز 03-mini متاحًا بحلول نهاية يناير 2025. وسيتوفر طراز o3 الكامل بعد اختبارات السلامة.
اعتبارًا من الآن، بدأت OpenAI في إجراء اختبارات السلامة العامة، وإذا تحققت النتائج الأولية وأداء المعايير، فقد تمثل نماذج o3 وo3 mini.. خطوة كبيرة إلى الأمام وقفزة عملاقة في تطوير نماذج الذكاء الاصطناعي.