“غوغل” تكشف عن الجيل القادم من نماذج التفكير بالذكاء الاصطناعي

كشفت «غوغل» يوم الثلاثاء عن Gemini 2.5، وهي سلسلة جديدة من نماذج الذكاء الاصطناعي التي تتوقف مؤقتًا للتفكير قبل الإجابة على سؤال.
ولإطلاق هذه السلسلة الجديدة من النماذج، تُطلق «غوغل» Gemini 2.5 Pro Experimental، وهو نموذج ذكاء اصطناعي متعدد الوسائط، تزعم الشركة أنه أذكى نموذج لديها حتى الآن.
سيتوفر هذا النموذج في منصة «غوغل» للمطورين، Google AI Studio، بالإضافة إلى تطبيق Gemini للمشتركين في باقة Gemini Advanced للذكاء الاصطناعي بقيمة 20 دولار شهريًا.
في المستقبل، تقول «غوغل» إن جميع نماذج الذكاء الاصطناعي الجديدة ستتضمن قدرات استدلالية مدمجة.
منذ أن أطلقت «OpenAI» أول نموذج استدلالي للذكاء الاصطناعي في سبتمبر 2024، تسابقت شركات التكنولوجيا لمضاهاة قدرات هذا النموذج أو تجاوزها.
واليوم، تمتلك كل من «أنثروبيك» و»ديب سيك» و «غوغل» و «xAI» نماذج استدلالية للذكاء الاصطناعي، والتي تستخدم قوة حوسبة ووقتًا إضافيين للتحقق من صحة المعلومات والتفكير في المشكلات قبل تقديم إجابة.
ساعدت تقنيات الاستدلال نماذج الذكاء الاصطناعي على تحقيق آفاق جديدة في مهام الرياضيات والبرمجة.
ويعتقد كثيرون في عالم التكنولوجيا أن نماذج الاستدلال ستكون مكونًا أساسيًا في وكلاء الذكاء الاصطناعي، وهي أنظمة مستقلة قادرة على أداء المهام دون تدخل بشري إلى حد كبير، ومع ذلك، فإن هذه النماذج أغلى ثمنًا أيضًا.
سبق لشركة غوغل أن أجرت تجارب على نماذج التفكير بالذكاء الاصطناعي، حيث أصدرت نسخة مُفكِّرة من جيميني في ديسمبر.
لكن جيميني 2.5 يُمثل أضخم محاولة للشركة حتى الآن للتفوق على سلسلة نماذج «o» من «OpenAI».
تزعم «غوغل» أن Gemini 2.5 Pro يتفوق على نماذج الذكاء الاصطناعي الرائدة السابقة، وبعض نماذج الذكاء الاصطناعي المنافسة الرائدة، في عدة معايير. تقول «غوغل» إنها صممت Gemini 2.5 ليتفوق في إنشاء تطبيقات ويب جذابة بصريًا وتطبيقات برمجة وكيلة.
وتقول «غوغل» إن Gemini 2.5 Pro حصل على 68.6% في تقييم يقيس تحرير التعليمات البرمجية، ويسمى Aider Polyglot، متفوقًا على أفضل نماذج الذكاء الاصطناعي من «OpenAI» و»أنثروبيك» ومختبر الذكاء الاصطناعي الصيني «ديب سيك».
ومع ذلك، في اختبار آخر لقياس قدرات تطوير البرمجيات، تم التحقق منه بواسطة SWE-bench، حصل Gemini 2.5 Pro على 63.8%، متفوقًا على o3-mini من «OpenAI» وR1 من «ديب سيك»، ولكنه كان أقل أداءً من Claude 3.7 Sonnet من «أنثروبيك»، والذي حصل على 70.3%.
وفي الاختبار الأخير للبشرية، وهو اختبار متعدد الوسائط يتكون من آلاف الأسئلة التي يتم جمعها جماعياً والمتعلقة بالرياضيات والعلوم الإنسانية والعلوم الطبيعية، تقول «غوغل» إن جهاز Gemini 2.5 Pro حصل على نسبة 18.8%، وهو أداء أفضل من معظم النماذج الرائدة المنافسة.
بدايةً، تُعلن «غوغل» أن إصدار Gemini 2.5 Pro يأتي مع نافذة سياقية تضم مليون رمز، مما يعني أن نموذج الذكاء الاصطناعي قادر على استيعاب حوالي 750,000 كلمة دفعةً واحدة.
وهذا أطول من سلسلة روايات «سيد الخواتم» بأكملها، وقريبًا، سيدعم Gemini 2.5 Pro ضعف طول الإدخال (مليوني رمز).