كلود يستعرض عضلاته: أنثروبيك تطلق Opus 4.8 بقدرات برمجية فائقة وصدق غير مسبوق

يبدو أن معركة الذكاء الاصطناعي لا تعرف الهدوء ولو للحظة واحدة! ففي الوقت الذي يتطلع فيه الجميع لما يحمله المستقبل من تحديثات كبرى، فاجأتنا شركة “أنثروبيك” (Anthropic) بإطلاق وحشها الجديد: نموذج Claude Opus 4.8. هذا التحديث لا يحمل مجرد تحسينات طفيفة، بل يأتي ليعيد تعريف طريقة تعامل المطورين والمستخدمين مع مهام البرمجة والتحليل المالي، مع ميزة قد تبدو غريبة في عالم الذكاء الاصطناعي الحالي وهي: الصدق والاعتراف بالخطأ بدلاً من الهلوسة واختلاق الإجابات!

نموذج الذكاء الاصطناعي كلود أوبوس 4.8 من أنثروبيك


قفزة هائلة في البرمجة والذكاء العملي

تصف أنثروبيك نموذجها الجديد Claude Opus 4.8 بأنه “شريك متعاون أكثر فاعلية”، والسر يكمن في تطوير قدراته بشكل كبير على القيام بمهام “الوكيل المستقل” (Agentic Tasks). هذا يعني أنه لا يكتفي بكتابة كود برمجي بسيط عند الطلب، بل يمكنه التخطيط، وتحليل المشكلات المعقدة متعددة التخصصات، وحتى التحكم في واجهات الكمبيوتر لإنجاز مهام متكاملة بكفاءة غير مسبوقة.

المثير للاهتمام هنا هو ردود أفعال المختبرين الأوائل؛ حيث أشاروا إلى أن النموذج الجديد أصبح أكثر ذكاءً وحدة في اتخاذ القرارات، والأهم من ذلك أنه أصبح “أكثر صدقاً”. نعم، لقد مللنا جميعاً من الهلاوس البصرية والفلسفة الفارغة التي تقدمها بعض النماذج عندما لا تعرف الإجابة. في Opus 4.8، أصبح النموذج أكثر ميلاً للاعتراف بعدم يقينه وتحديد جوانب الشك في إجاباته بدلاً من اختلاق ادعاءات لا أساس لها من الصحة. وبحسب لغة الأرقام، فإن النموذج أقل عرضة بـ 4 مرات لتمرير كود برمجي يحتوي على أخطاء دون التنبيه عليها مقارنة بالإصدارات السابقة.


تفوق رقمي واضح على المنافسين

من موقع فون إسلام: جدول يقارن بين نسب الأداء والنتائج التي حققها كل من Claude Opus 4.8 وOpus 4.7 وGPT-5.5 وGemini 3.1 Pro عبر ستة معايير، مع تمييز نتائج Claude Opus 4.8 لسهولة الرجوع إليها.

على جبهة الاختبارات المعيارية المباشرة، تمكن Claude Opus 4.8 من تحقيق نتيجة مذهلة بلغت 69.2% في اختبار البرمجة الشهير SWE-Bench Pro. هذه النتيجة تضعه رسمياً في الصدارة متفوقاً على منافسين شرسين للغاية مثل GPT-5.5 من OpenAI وGemini 3.1 Pro من جوجل. ومع ذلك، لا تزال الغلبة لنموذج GPT-5.5 في اختبارات البرمجة عبر الطرفية (terminal-coding).

ولم تتوقف أنثروبيك عند زيادة الذكاء فقط، بل عالجت أيضاً معضلتين طالما أرّقتا المطورين: السرعة والتكلفة. الآن، يعمل “الوضع السريع” (Fast mode) في Opus 4.8 بسرعة تفوق الإصدارات السابقة بمعدل 2.5 مرة، والأفضل من ذلك أنه أصبح أرخص بثلاث مرات كاملة! هذا يعني كفاءة أعلى بفاتورة أقل بكثير، وهو بالضبط ما يبحث عنه قطاع الأعمال والمطورون المستقلون على حد سواء. أما بالنسبة للاستخدام العادي، فستظل الأسعار كما هي دون تغيير مقارنة بإصدار Opus 4.7 السابق.


ميزات جديدة تمنحك السيطرة الكاملة

من موقع فون إسلام: يعرض المخطط الشريطي المعنون "السلوك غير المتناسق" الدرجات (1-10) لكل من السوناتة 4.6، وMythos Preview، وMythos Preview، وOpus 4.7، وClaude Opus 4.8. تتصدر السوناتة 4.6 بأعلى الدرجات، بينما تحتل Mythos Preview المرتبة الأدنى بين المجموعة.

لم يقتصر الإعلان على النموذج نفسه، بل قدمت أنثروبيك ترسانة من الميزات الجديدة لتسهيل بيئة العمل وتحسين الإنتاجية بشكل جذري:

  • سير العمل الديناميكي (Dynamic Workflows): تتيح هذه الميزة (المتوفرة كنسخة تجريبية للباحثين والمشتركين في باقات الأعمال والفرق والحد الأقصى) للنموذج التخطيط للمهام الضخمة وتشغيل مئات الوكلاء الفرعيين بالتوازي في جلسة واحدة. هذا يعني القدرة على إدارة وترحيل مشاريع برمجية ضخمة تصل إلى مئات الآلاف من أسطر الكود دفعة واحدة!
  • التحكم في المجهود (Effort Control): تمنح هذه الميزة مستخدمي Claude.ai وخاصية Cowork القدرة على تحديد مقدار المجهود والتركيز الذي يبذله الذكاء الاصطناعي في صياغة الإجابة. إذا اخترت مجهوداً أقل، ستحصل على إجابة أسرع وستستهلك حصتك اليومية بمعدل أبطأ. وبشكل افتراضي، يعمل Opus 4.8 على وضع “المجهود العالي” لضمان التوازن المثالي بين الجودة وتجربة المستخدم.
  • تحديثات واجهة برمجة التطبيقات (Messages API): أضافت الشركة إمكانية تحديث التعليمات الأساسية الموجهة للنموذج في منتصف المهمة، مما يمنح المطورين مرونة فائقة لم تكن ممكنة من قبل.

وفيما يتعلق بالسلامة والأخلاقيات، تشير التقييمات إلى أن النموذج حقق مستويات قياسية جديدة في “السمات الاجتماعية الإيجابية”، مثل احترام استقلالية المستخدم والعمل بما يخدم مصلحته الفضلى، مع انخفاض ملحوظ في السلوكيات المضللة أو الخادعة مقارنة بالإصدارات السابقة.


ماذا يخبئ لنا المستقبل القريب؟

الإطلاق الفوري لنموذج Claude Opus 4.8 في جميع أنحاء العالم اليوم هو مجرد بداية لخطط أنثروبيك الطموحة. فالشركة تعمل حالياً على تطوير نماذج تقدم نفس القدرات الفائقة ولكن بتكلفة أقل بكثير لتكون في متناول الجميع، بالإضافة إلى العمل على فئة جديدة تماماً من النماذج تفوق ذكاء Opus بمراحل.

كما أكدت الشركة أنها تضع اللمسات الأخيرة والضمانات الأمنية لنموذج “Claude Mythos” الذي يتم اختباره حالياً مع عدد محدود من المؤسسات (وهو نفس النموذج الذي ساعد سابقاً في اكتشاف ثغرات أمنية خطيرة في نظام ماك)، وتتوقع إطلاقه لجميع العملاء خلال الأسابيع القليلة القادمة. المنافسة تشتعل، والمستفيد الأول والأخير هو نحن المستخدمين الذين نرى هذه القفزات التقنية تتحقق أمام أعيننا يوماً بعد يوم.

هل تعتقد أن تفوق كلود في الصدق وتقليل الأخطاء البرمجية سيجعلك تعتمد عليه كلياً وتفضله على المنافسين مثل GPT؟ شاركنا رأيك في التعليقات!

المصدر:

macrumors.com

اترك رد