“جوجل” تصدر النسخة الثانية لتقنية “Imagen” لتوليد الصور

نماذج من صور مولدة عبر تقنية "Imagen 2"- (جوجل)

camera iconنماذج من صور مولدة عبر تقنية "Imagen 2"- (جوجل)

tag icon ع ع ع

أعلنت “جوجل” رسميًا عن إصدارها تقنية “Imagen 2” لتوليد الصور باستخدام الذكاء الاصطناعي مع تحسينات واسعة مقارنة بإصدارها الأول.

وقالت “جوجل” في بيان نشر الخميس 14 من كانون الأول، إن تقنية “Imagen 2” باتت تولد صورًا ذات جودة عالية، مع قدرة على إنتاج النصوص داخل الصور بلغات إضافية، بالإضافة إلى إنشاء الشعارات، وغيرها من الميزات الإضافية.

وتوظف تقنية “Imagen 2” آليات الذكاء الاصطناعي في تحويل النص إلى صورة، وقد أصبحت متاحة الآن على نطاق واسع لعملاء “Vertex AI”، وهي منصة تابعة لـ”جوجل” تضم مجموعة من المنتجات والخدمات السحابية المعتمدة على الذكاء الاصطناعي وتعلم الآلة، والموجهة بصورة أساسية إلى الشركات.

وكانت “جوجل” نجحت في اجتذاب العديد من الشركات بالفعل لاستخدام تقنية “Imagen”، ومنها “Shutterstock” و”سناب” وغيرها.

وتتيح التقنية الجديدة إمكانية إنشاء وصف نصي للصور، كما أنها تضيف علامة مائية مميزة للصور التي تولد من خلالها من أجل تمييزها عن الصور الواقعية.

وتمنح إمكانات فهم الصور المحسّنة في “Imagen 2” للمستخدمين إنشاء تسميات توضيحية وصفية طويلة والحصول على إجابات تفصيلية للأسئلة المتعلقة بالعناصر الموجودة في الصورة.

وإلى جانب اللغة الإنجليزية، يدعم إطلاق “Imagen 2” ست لغات إضافية (الصينية والهندية واليابانية والكورية والبرتغالية والإسبانية)، مع التخطيط لإصدار العديد من اللغات الأخرى في أوائل عام 2024، وفق البيان.

ويتضمن دعم اللغات القدرة على الترجمة بين المطالبة النصية للصور والإخراج النصي داخل الصورة، أي يمكن مثلًا المطالبة باللغة الإسبانية مع تحديد أن الإخراج يجب أن يكون باللغة البرتغالية.

وتحاول “جوجل” من خلال تلك التقنية منافسة نموذج “DALL-E 3” من شركة “OpenAI”، الذي يتيح كذلك تحويل الأوامر النصية إلى صور باستخدام الذكاء الاصطناعي.

وقبل عدة أشهر، قدمت “جوجل” النسخة الأولى من هذه التقنية لتحرير الصور أطلقت عليها اسم “Imagen Editor” لتتيح للمستخدمين إجراء تعديلات معينة على الصور استنادًا إلى الأوامر النصية التي يكتبها المستخدم.

وكانت الشركة كشفت حديثًا عن نظام “Gemini” للذكاء الاصطناعي التوليدي، وذكرت أنه النموذج الأكثر تطورًا المتاح للمستخدمين، وأنه يتفوق على نموذج “GPT-4” أيضًا من “OpenAI”.




مقالات متعلقة


×

الإعلام الموجّه يشوه الحقيقة في بلادنا ويطيل أمد الحرب..

سوريا بحاجة للصحافة الحرة.. ونحن بحاجتك لنبقى مستقلين

ادعم عنب بلدي

دولار واحد شهريًا يصنع الفرق

اضغط هنا للمساهمة