كشفت شركة ديب سيك الصينية أنها درّبت نموذجها الثوري R1 بتكلفة بلغت 294 ألف دولار فقط، وهو رقم يثير الدهشة مقارنةً بمئات الملايين التي تنفقها الشركات الأمريكية على تدريب النماذج المماثلة.

ويضع هذا الإعلان بكين في قلب المنافسة مع شركات وادي السيليكون، ويثير تساؤلات حول مستقبل الهيمنة الأمريكية على تكنولوجيا الذكاء الاصطناعي.

ويُعد هذا الإعلان، الذي ورد في مقالة علمية مُحكّمة نشرتها مجلة Nature، أول تقدير رسمي لتكاليف التدريب تكشف عنه الشركة التي تتخذ من مدينة هانغتشو الصينية مقرًا لها.

وكان إطلاق DeepSeek في يناير قد أثار مخاوف المستثمرين عالميًا، ودفع بعضهم إلى التخلي عن أسهم شركات التكنولوجيا، خشية أن تهدد هذه النماذج هيمنة عمالقة القطاع مثل إنفيديا. ومنذ ذلك الحين، نادراً ما ظهر مؤسس الشركة ليانغ وينفنغ أو فريقه في الساحة العامة، باستثناء إعلانات محدودة لتحديثات جديدة.

التدريب بمعالجات إنفيديا H800

وبحسب المقالة، التي شارك ليانغ في تأليفها، فقد بلغت تكلفة تدريب نموذج R1 القائم على قدرات الاستدلال والتفكير المنطقي نحو 294 ألف دولار باستخدام 512 معالجًا من نوع إنفيديا H800.

يُذكر أن النسخة السابقة من الدراسة التي نُشرت في يناير لم تتضمن هذه التفاصيل.

وفي المقابل، كان الرئيس التنفيذي لشركة OpenAI الأميركية سام ألتمان قد صرّح في عام 2023 أن تدريب ما وصفه بـ”النماذج التأسيسية” كلف شركته “أكثر بكثير” من 100 مليون دولار، دون الكشف عن أرقام دقيقة.

جدل حول مصادر الرقاقات

وكانت إنفيديا قد طورت معالجات H800 بنحو خاص للسوق الصينية بعد أن حظرت الولايات المتحدة في أكتوبر 2022 تصدير معالجاتها القوية H100 و A100 إلى الصين.

وكانت تقارير صحفية قد أشارت نقلًا عن مسؤولين أمريكيين إلى أن DeepSeek تمتلك “كميات كبيرة” من شرائح H100 حصلت عليها بعد سريان قيود التصدير، في حين أكدت إنفيديا أن الشركة استخدمت فقط معالجات H800 المقتناة بطريقة قانونية.

وفي وثيقة معلومات مرفقة بمقالة Nature، أقرت DeepSeek لأول مرة بامتلاكها رقاقات A100 واستخدامها في المراحل التحضيرية لتطوير نموذج DeepSeek-R1، موضحةً أن مرحلة التدريب النهائية استغرقت 80 ساعة باستخدام 512 معالجًا من نوع H800، وهو ما يعكس قدرة مهندسيها على ابتكار طرق جديدة لتدريب النماذج بأقصى كفاءة ممكنة.

ويرى محللون أن إنجاز DeepSeek يكتسب أهمية مضاعفة في ظل افتقار الصين إلى بنية تحتية متقدمة من مراكز البيانات والرقاقات العالية الأداء، نتيجة القيود الأمريكية المفروضة على تصدير أحدث المعالجات.

فرص جديدة في الأسواق الناشئة

ويُبرز تركيز DeepSeek على تطوير خوارزميات أكثر فاعلية بدلاً من الاعتماد المفرط على العتاد المتطور مسارًا مختلفًا عن النهج الذي تتبعه شركات وادي السيليكون.

وقد يمنح خفض التكاليف إلى هذا المستوى الشركات الناشئة الصينية فرصة أكبر لمجاراة عمالقة القطاع في الغرب، ويفتح الباب أمام سباق محموم لتطوير نماذج قوية بموارد أقل، وقد يشجع حكومات وشركات في الأسواق الناشئة على دخول مضمار تطوير النماذج اللغوية.

وفي الوقت نفسه، تُثار تحذيرات من أن التركيز على التكلفة وحدها قد يغفل جانب الجودة والموثوقية، مؤكدين أن معيار التنافس الحقيقي يكمن في كفاءة النماذج وأمان استخدامها لا في تكاليف تدريبها فقط.

ويُتوقع أن يزيد هذا الجدل الضغوط الجيوسياسية بين الولايات المتحدة والصين، في ظل مساعي واشنطن إلى الحد من وصول بكين إلى أحدث التقنيات، في حين تحاول الشركات الصينية الالتفاف على القيود عبر حلول محلية أقل تكلفة.