أخبار الإنترنت

إنفيديا تكشف عن نموذج لتوليد الأشكال الثلاثية الأبعاد

كشفت إنفيديا عن نموذج ذكاء اصطناعي جديد لتوليد الأشكال الثلاثية الأبعاد يطلق عليه اسم LATTE3D.

ويعمل النموذج الجديد عن طريق تحويل المطالبات النصية إلى تمثيلات واقعية ثلاثية الأبعاد للأشياء والحيوانات في غضون ثوانٍ.

ويوفر النموذج الأشكال المولدة بتنسيق شائع قابل للاستخدام في التطبيقات القياسية لنمذجة الرسومات، مما يعني أنه يمكن إضافتها داخل البيئات الافتراضية.

وتتوافق نتائج النموذج مع العديد من المجالات، مثل ألعاب الفيديو، والحملات الإعلانية، ومشاريع التصميم، وساحات التدريب الافتراضية للروبوتات، وعوالم الواقع الافتراضي، حسبما قال باحثو إنفيديا.

ويعد LATTE3D بمنزلة تقدم كبير، إذ كانت النماذج المتقدمة لتحويل النص إلى أشكال ثلاثية الأبعاد قبل عام واحد تستغرق ساعة كاملة لتوليد صور بالجودة نفسها.

في حين يمكن للنماذج فعل الشيء نفسه الآن خلال 12 ثانية فقط، مما يجعل تحويل النص إلى أشكال ثلاثية الأبعاد في الوقت الفعلي في متناول المبدعين عبر الصناعات.

ووفقًا لشركة إنفيديا، فإن النموذج الجديد يمكنه إنتاج أشكال ثلاثية الأبعاد مفصلة بصورة فورية تقريبًا عند تشغيله عبر وحدة معالجة رسومات واحدة، مثل Nvidia RTX A6000.

ويغير LATTE3D قواعد اللعبة للمصممين، إذ أصبح بإمكانهم استخدام النموذج لتوليد أفكار متعددة للأشكال فورًا بدلًا من إضاعة الوقت في البحث في مكتبة الأصول الثلاثية الأبعاد الواسعة.

ويولد النموذج مجموعة صغيرة من الأشكال الثلاثية الأبعاد لكل رسالة نصية، مما يعني أن المصمم لديه خيارات متعددة للاختيار من بينها.

كما يمكنه بعد ذلك تحسين الشكل الذي اختاره وتحسين جودة رسوماته في غضون دقائق قليلة باستخدام المطالبات النصية.

وبمجرد أن يشعر المصمم بالرضا عن النتائج، يمكنه بعد ذلك تصديره إلى تطبيق برمجي رسومي، مثل Omniverse من إنفيديا، وهي منصة تدعم إطار العمل USD لتبادل بيانات الرسومات الثلاثية الأبعاد.

ودربت إنفيديا LATTE3D على قاعدتي بيانات محددتين تحتويان أشكال الحيوانات والأشياء اليومية، مع أنه يمكن للباحثين تدريب النموذج على أنواع أخرى من البيانات، مثل المباني أو المركبات، من أجل توسيع وظائفه.

واستخدمت إنفيديا وحدات معالجة الرسوميات القديمة A100 Tensor Core لتدريب النموذج، كما استخدمت ChatGPT من OpenAI لتعليم النموذج فهم مجموعة متنوعة من المطالبات النصية، مما يحسن قدرته في فهم العبارات المختلفة التي قد يستخدمها شخص ما لوصف كائن ثلاثي الأبعاد.

زر الذهاب إلى الأعلى