أعلنت OpenAI عن تحديث جديد للروبوتات من الذكاء الاصطناعي في ChatGPT. يتيح ذلك للمستخدمين إنشاء صور بناءً على تعليمات مفصلة ومعقدة وغير تقليدية، في الخطوات التي تعتبر تطويرًا بارزًا لأهم منتجات الشركة.
يعتمد الإصدار الجديد من ChatGPT على طراز GPT-4O. يسمح هذا للروبوت بتحليل النص والصور معًا في نظام متكامل واحد. يمنحك هذا القدرة غير المسبوقة على توليد صور أكثر تعقيدًا ودقة.
وفقًا للشركة، يمكن للمستخدمين وصف صور الرسوم المتحركة التي تتكون من أربع لوحات، بما في ذلك تحديد الشخصيات التي تظهر في جميع الصور، على سبيل المثال، للإنشاء الفوري لرسومات الكاريكاتير المتكاملة بناءً على هذه التفاصيل.
ومع أن الإصدارات السابقة من ChatGPT كانت قادرة على إنشاء الصور، فإنها لم تكن تتمتع بالقدرة على إدماج مفاهيم متعددة ومتنوعة في صورة واحدة بدقة وموثوقية، كما لم تكن قادرة على التعامل مع النصوص داخل الصور بنحو دقيق كما هو الحال مع التحديث الجديد.
وعانت النماذج السابقة للذكاء الاصطناعي مشكلات في إدراج النصوص داخل الصور، إذ كانت النتائج غالبًا غير واضحة أو غير مفهومة، لكن GPT-4o يتفوق في هذا المجال، إذ يمكنه إنشاء لافتات تحتوي على نصوص مقروءة بوضوح، وهو تحسن كبير مقارنة بالإصدارات السابقة.
ويتيح نموذج GPT-4o تجربة تفاعلية أكثر في تعديل الصور، إذ يمكن للمستخدم طلب إنشاء صورة أو رفعها، ثم تقديم تعليمات متتالية لتعديلها، مثل تغيير الألوان أو إضافة تفاصيل جديدة، دون الحاجة إلى إعادة كتابة الوصف بالكامل.
وأوضح غابرييل غو، الباحث في OpenAI، أن هذه التقنية تشكّل “نوعًا جديدًا تمامًا من الذكاء الاصطناعي”، مضيفًا أن نماذج الشركة “لم تعد تفصل بين توليد النصوص وإنشاء الصور، بل تدمج العمليتين معًا للحصول على نتائج أكثر سلاسة ودقة”.
وأشار غو إلى أن نماذج توليد الصور التقليدية واجهت دومًا صعوبة في إنشاء صور لمفاهيم غير مألوفة، مثل دراجة بعجلات مثلثة، لكن الإصدار الجديد من ChatGPT أصبح قادرًا على التعامل مع هذه الطلبات المعقدة بسهولة.
وأعلنت OpenAI أن التحديث الجديد لروبوت ChatGPT سيكون متاحًا لكافة المستخدمين، سواء عبر النسخة المجانية أو من خلال الاشتراكات المأجورة. يُذكر أن خاصية إنشاء الصور متاحة لأصحاب الحسابات المجانية، لكن بنحو محدود، وسوف يتأخر إطلاق التحديث الأخير لهم، وفقًا لما أعلنته الشركة.
أصدرت OpenAI العديد من مقاطع الفيديو التي توضح ميزات GPT-4O. يمكن للمستخدمين تحرير الصور على مراحل ومعرفة كيف يمكنهم التفاعل مع ChatGPT لتحسين النتائج.
كانت ChatGPT هي المرة الأولى في نهاية عام 2022 واعتمدت على تحليل عدد كبير من النصوص على الإنترنت، مما سمح لي بالإجابة على الأسئلة، وكتابة الشعر، وكتابة رمز البرمجيات، لكن في تلك المرحلة لم أتمكن من إنشاء صور.
بعد حوالي عام، أطلقت OpenAI طراز Dall-E لإنشاء الصورة، ولكن تم فصلها عن ChatGPT. الآن، قامت الشركة بدمج نظامين في منصة واحدة. فهو يجمع بين إمكانيات النص والصور، مما يمتد قدرات الذكاء الاصطناعي التوليدي بطريقة غير مسبوقة.


