أخبار سارة لـ xAI: "Grok" يثبت جدارته في الإجابة عن أسئلة "بوابة بلدور" بدقة مذهلة
في عالم يتسابق فيه عمالقة التكنولوجيا لتطوير أنظمة الذكاء الاصطناعي، لكل مختبر أولوياته التي تميزه عن الآخر. فبينما تركز "أوبن إيه آي" على المستخدمين العاديين، وتستهدف "أنثروبيك" الشركات، كشفت الأيام الماضية أن شركة "إكس إيه آي" التابعة لإيلون ماسك وضعت نصب أعينها هدفاً غير متوقع تماماً: إتقان الإرشادات الخاصة بألعاب الفيديو.
عندما يؤخر "باب بوابة بلدور" إطلاق نموذج ذكاء اصطناعي!
في تقرير مفصل نشرته "بيزنس إنسايدر" مؤخراً، كُشف النقاب عن قصة طريفة ولكنها ذات دلالة عميقة. ففي العام الماضي، تأخر إطلاق أحد نماذج "xAI" لعدة أيام كاملة، والسبب؟ كان إيلون ماسك غير راضٍ عن كيفية إجابة الروبوت على أسئلة مفصلة حول لعبة الفيديو الشهيرة "Baldur's Gate 3" (بوابة بلدور 3). ولم يتوقف الأمر عند هذا الحد، بل تم سحب مهندسين كبار من مشاريعهم الأساسية للعمل على تحسين إجابات النموذج قبل الإطلاق!
قد تتخيل إحباط مهندس محترف يحضر إلى العمل وهو يعتقد أنه سيحل مشاكل الذكاء الإنساني والمعرفة، ليجد نفسه منهمكاً في مساعدة رجل في الخامسة والخمسين من عمره على "اجتياز لعبة فيديو". لكن السؤال الأهم الذي طرحته القصة: هل نجح "غروك" في النهاية؟
"BaldurBench": اختبار حقيقي لأشهر نماذج الذكاء الاصطناعي
للإجابة عن هذا السؤال بحيادية، قام خبير ألعاب التمثيل والأدوار (RPG) في "تك كرانش"، رام آير، بتصميم مجموعة من خمسة أسئلة عامة حول اللعبة. تم طرح هذه الأسئلة على "غروك" (Grok) بالإضافة إلى ثلاثة نماذج رئيسية أخرى: ChatGPT من OpenAI، وClaude من Anthropic، وGemini من Google. وقد أطلق على هذا الاختبار شبه الرسمي اسم "BaldurBench".
والخبر السار لعشاق اللعبة ومطوري xAI على حد سواء هو أن "غروك" قدم معلومات جيدة ودقيقة بشكل مذهل.
تحليل النتائج: من تفوق في "بوابة بلدور"؟
إليكم ملخص ما توصل إليه الاختبار، والذي يظهر تفوقاً واضحاً لنموذج xAI في هذا المجال تحديداً:
· Grok (xAI) - البطل المطلق: كانت إجابات النموذج غنية بالمعلومات ومفيدة للغاية. صحيح أنها كانت مليئة بمصطلحات اللاعبين المحترفين مثل "save-scumming" بدلاً من "الحفظ" و "DPS" بدلاً من "الضرر"، إلا أنها كانت دقيقة وتعكس فهماً عميقاً للعبة. كما أظهر "غروك" حباً واضحاً للجداول الإحصائية والنظريات التحليلية، مما يجعله مرجعاً مثالياً للمحترفين.
· ChatGPT - الأسلوب المنظم: فضّل النموذج استخدام القوائم النقطية وجمل قصيرة ومباشرة، مما يجعل المعلومات سهلة القراءة والفهم للمبتدئين.
· Gemini - التأكيد البصري: اعتمد النموذج على تسميك الكلمات المهمة لجذب انتباه القارئ، وهي ميزة بصرية مفيدة.
· Claude - الصديق الحريص: كان المفاجأة الأكبر! فقد أظهر "كلود" قلقاً بالغاً على تجربة المستخدم، حيث رفض تقديم إجابات قد "تفسد" متعة اللعب. فمثلاً عندما سُئل عن أفضل تشكيلة فريق، اختتم إرشاداته قائلاً: "لا تشدد على نفسك كثيراً، فقط العب بما يبدو ممتعاً بالنسبة لك". إنه نهج ودود ولطيف، لكنه قد لا يساعد اللاعب العالق في مهمة صعبة!
ماذا يعني هذا بالنسبة لمستقبل الذكاء الاصطناعي؟
من المهم التذكير أن هذا المجال هو بالضبط الذي ركزت عليه xAI (حسب تقرير Business Insider) لتحقيق التكافؤ مع المنافسين. لذلك لا يجب أن نقرأ كثيراً في حقيقة أن نصيحة "غروك" جاءت بنفس جودة النماذج الأخرى بعد هذا "السباق" المكثف. ولكن من الجميل أن نعرف أن xAI قادرة على تحقيق أهدافها عندما تركز جهودها، حتى لو كان الهدف هو مساعدة الملياردير الأكثر شهرة في العالم على إتقان لعبة فيديو.
الخلاصة: سواء كنت من محبي "Baldur's Gate 3" وتبحث عن إرشادات احترافية، أو كنت مهتماً بمعايير أداء نماذج الذكاء الاصطناعي، فإن "غروك" يثبت أنه خيار قوي ومنافس شرس، خصوصاً في المجالات التي تحظى باهتمام شخصي من إيلون ماسك.

التعليقات