القائمة الرئيسية

الصفحات

شرح البرنامج الخارق لتحويل النص الى صورة و التعديل عليها DALL-E 2

 شرح البرنامج الخارق لتحويل النص الى صورة و التعديل عليها DALL-E 2

شرح البرنامج الخارق لتحويل النص الى صورة و التعديل عليها DALL-E 2
شرح البرنامج الخارق لتحويل النص الى صورة و التعديل عليها DALL-E 2

موقع DALLE -E هو نموذج الذكاء الاصطناعي الاحدث المصمم من طرف شركة OpenAI الامريكية. اذا كنت قد شاهدت بعض ابداعاته و اعتقدت انها رائعة، تابع القراءة لمعرفة لماذا انت على حق!


- من DALL-E الى DALL-E 2

نشرت شركة OpenAI مقالة و ورقة بحثية بعنوان "انشاء صورة بالنص الشرطي الهرمي بواسطة CLIP Latents" على DALL-E 2. المقالة جيدة اذا كنت تريد إلقاء نظرة سريعة على النتائج، كما ان الورقة مفيدة لك في فهم التفاصيل التقنية للمشروع، لكن شرح روعة DALL-E 2 و الجانب العميق له و اكثر ستجدها في هذه المقالة بالتفصيل.


دالي 2 هو النسخة الاحدث من DALL-E، و هو نموذج توليد لغوي الذي يقوم بأخذ الجمل المكتوبة و يحولها الى صور اصلية. عند برامترات 3.5B، دالي 2 هو نموذج واسع لكن ليس بحجم GPT-3 و بشكل مثير للاهتمام فهو اصغر من سلفه DALL-E 12B بالرغم من حجمه الصغير، الا انه ينتج صورا بدقة جودة 4 اضعاف من DALL-E و هو المفضل حسب رأي 70 في المائة من الناس الذين قاموا بتجربته، سواءا في مطابقته للنص او الواقعية في الصور.

كما فعلوا مع DALL-E، لم تقم OpenAI بإصدار DALL-E 2. رغم ذلك، قاموا بجعل برنامج CLIP مفتوح المصدر و هو مرتبط بشكل غير مباشر ب DALL-E كجامع لأساسيات DALL-E 2.


- كيف يشتغل DALL-E 2

1.2 المفاهيم الأربعة الرئيسية

هنا ابسط شرح لمن لا يحبون التضمينات و التعقيدات التقنية. يمكنك مشاهدة نمودج من ما يقدمه DALLE -E 2 عبر هذا الفيديو القصير :


لفهم افضل للمفاهيم الغامضة، دعونا نقوم بلعبة بسيطة. خد ورقة و قلم و قم بتحليل عملية تفكيرك عند قيامك بهذه الثلاثة تمارين:

اولا، فكر في رسم منزل محاط بالاشجار و الشمس في الخلفية السماوية. تصور كيف سيكون شكل الرسم. التصوير الذهني الذي ظهر في عقلك الان هو تشبيه بشري لتضمين صورة.


لا يمكنك معرفة كيف ستكون نتيجة الرسم النهائية بالضبط، لكنك تعرف المكونات الرئيسية التي يجب ان تظهر في الرسم. الانتقال من الجمل المكتوبة الى التصوير الذهني هو ما يقوم به نموذج DALL·E 2.

بإمكانك الان الرسم. ترجمة التصوير الذهني لديك الى رسم واقعي و هو ما يفعله برنامج unCLIP.


بإمكانك الان بكل دقة اعادة الرسم من منطلق نفس النص بنفس العناصر لكن بشكل نهائي مختلف تماما. اليس كذلك؟ هذا ما يقوم به DALL-E 2 بالضبط، يستطيع انشاء صور من صورة مضمنة سلفا.


لحسن حظنا، دماغنا يقوم بتحليل متماثل و بالتالي من السهل الفهم على مستوى عالي ما يقوم به كليب و دالي 2. رغم ذلك يبقى هذا الشرح مجرد تبسيط، و بالتأكيد هذه النماذج لا تشابه تماما ما يقوم به الدماغ.


إلى هنا أصدقائي نكون قد وصلنا إلى نهاية هاته التدوينة اتمنى ان تكون مجموعة التطبيقات هاته  قد نالت إعجابكم ،فلا تقرأ و تذهب ، اترك بصمتك بتعليق  و شارك معنا رأيك فرأيك يهمنا.


رابط الموقع DALL-E 2

تعليقات