جوجل تكشف عن Imagen 4: الجيل الجديد من الذكاء الاصطناعي لتوليد الصور بدقة نصية مذهلة

في تطور لافت ضمن سباق الذكاء الاصطناعي البصري، أعلنت شركة جوجل رسميًا عن إطلاق نموذجها الجديد “Imagen 4”، الجيل الأحدث من نماذجها المتخصصة في توليد الصور بناءً على الأوامر النصية. ويأتي هذا الإعلان ليؤكد استمرار جوجل في تحسين تقنياتها في مجال التصوير بالذكاء الاصطناعي، مع وعود واضحة بتحسين عرض النصوص داخل الصور، وهي إحدى التحديات التي واجهت الإصدارات السابقة مثل Imagen 3 أحد أبرز المستجدات في هذا الإصدار هو طرح "Imagen 4 Ultra"، نسخة احترافية موجهة للمستخدمين الذين يبحثون عن دقة أعلى في تنفيذ التعليمات النصية، مقابل تكلفة أعلى نسبيًا. وقد أتاحت جوجل للمطورين والمستخدمين تجربة هذه النماذج الجديدة من خلال واجهة Gemini API، مع إمكانية الوصول المجاني المحدود عبر منصة Google AI Studio النموذج الأساسي من Imagen 4 وُصف بأنه الأنسب لمعظم المهام اليومية، بتكلفة تبلغ 0.04 دولار لإنتاج الصورة الواحدة، بينما يقدم الإصدار Ultra مستوى أعلى من الالتزام بالتعليمات مقابل 0.06 دولار لكل صورة، ما يعكس زيادة بنسبة 50% في السعر، لكنها تُبرر بالدقة الفائقة في النتائج وقد استعرضت جوجل في مدونتها الرسمية مجموعة صور مذهلة أنشأها النموذج الجديد، من بينها قصة مصوّرة بثلاث مشاهد لسفينة فضاء تتعرض لهجوم من كائن فضائي أزرق ضخم، وقد أظهرت الصور توافقًا مذهلًا مع التعليمات النصية، بتفاصيل تحاكي الرسوم ثلاثية الأبعاد، مما يعكس تطور البنية البصرية للنموذج مقارنة بالإصدارات السابقة ورغم هذا التحسن، لا تزال بعض الآراء تُشير إلى أن جوجل لم تصل بعد إلى المستوى الذي تقدمه نماذج منافسة مثل DALL·E 3 من OpenAI أو Midjourney 7، لكنها تواصل تحسين قدراتها تدريجيًا، خاصة بعد النجاح اللافت لنموذجها Veo 3 في مجال توليد الفيديو