جوجل تطلق DiffusionGemma: نموذج ذكاء اصطناعي أسرع بـ 4 مرات
أعلنت جوجل عن إطلاق نموذجها التجريبي الجديد DiffusionGemma، وهو نموذج ذكاء اصطناعي يعتمد على تقنية الانتشار (Diffusion) ويتميز بسرعة معالجة تزيد بأربع مرات عن النماذج السابقة من عائلة Gemma. هذا التطور يفتح آفاقاً جديدة لتحسين كفاءة نماذج الذكاء الاصطناعي المحلية.
على الرغم من السرعة الفائقة لتقنية الانتشار، إلا أن جوجل لم تعتمدها بعد في نماذجها السحابية الكبيرة مثل Gemini، وذلك لوجود بعض التحديات. فبينما لا يؤثر الخطأ في بكسل واحد في الصور على جودتها النهائية، فإن الخطأ في الكلمات أو الرموز (tokens) في النصوص يمكن أن يجعل جزءاً كاملاً من النص بلا معنى، مما يتطلب إعادة المحاولة للحصول على نتيجة أفضل. كما أن نماذج الانتشار تهدر الموارد عند الحاجة لعدد قليل من الرموز، حيث تتطلب معالجة متوازية مكثفة للوصول إلى النتائج المطلوبة، على عكس النماذج التلقائية التي تعمل بخطوات متسلسلة.
تتفوق DiffusionGemma في الكفاءة عند المعالجة المحلية، مما يجعلها خياراً جذاباً للتجارب. في البيئات السحابية، يمكن للنماذج التلقائية معالجة عدد كبير من طلبات المستخدمين دفعة واحدة بكفاءة عالية، بفضل ذاكرة النطاق الترددي العالي (HBM). أما على الأجهزة المحلية، فتواجه نماذج الذكاء الاصطناعي مشكلة هدر دورات المعالجة بسبب انخفاض عرض النطاق الترددي للذاكرة ووقت الخمول. نماذج الانتشار يمكن أن تستغل موارد المعالجة المتاحة بشكل أفضل.
إلى جانب تقنية الانتشار، بدأت جوجل مؤخراً في تطبيق تقنية "المسودات التنبؤية لعدة رموز" (Multi-Token Prediction - MTP) التي تستغل دورات المعالجة غير المستخدمة للتنبؤ بالرموز المحتملة وزيادة السرعة. ومع ذلك، تظل DiffusionGemma أسرع من إصدارات MTP الخاصة بـ Gemma.
تؤكد جوجل أن DiffusionGemma لا يزال نموذجاً تجريبياً، ولكنه متاح تحت ترخيص Apache 2.0 نفسه الذي تتمتع به نماذج Gemma الأخرى. يمكن تحميل أوزان النموذج من منصة Hugging Face. وقد تعاونت جوجل مع Nvidia لضمان تحسين أداء DiffusionGemma على مختلف الإعدادات، بما في ذلك وحدات معالجة الرسوميات RTX المتطورة (بعد التكميم) وأنظمة المؤسسات مثل H100 أو منصة DGX Spark.