تکنولوژی تولید تصاویر با هوش مصنوعی به سرعت در حال پیشرفت است. نسل جدید انجین DALL-E موسوم به DALL-E-3 توانایی درک زبان فارسی را نیز داراست.
از این پس معماران، گرافیستها، طراحان دکور و حتی پژوهشگران و اساتید دانشگاه قادر خواهند بود تصاویر خلاقانه و منحصر به فرد خود را با نسخهی به روز شدهی ربات تصويرساز پلاتونیا خلق کنند. آخرین نسخه موتورهای هوش مصنوعی تصویرساز با نام DALL-E-3 و DALL-E-3-HD، قابلیت درک و تولید تصاویر بسیار پیچیده و با کیفیت بالا را دارند.
مدلهای DALL-E-3 و DALL-E-3-HD جهشی خارقالعاده در تکنولوژی تصویرسازی با هوش مصنوعی
مدل DALL-E-3 یک مدل خودآموز است که با استفاده از یک شبکه عصبی پیچشی (CNN) و یک شبکه عصبی بازگشتی (RNN)، قادر است تصاویر را بر اساس متن وارد شده تولید کند. این مدل از یک تکنیک به نام VQ-VAE استفاده میکند که به آن امکان میدهد تصاویر را با کیفیت بالا و با حجم کم ذخیره کند. مدل DALL-E-3 قادر است تصاویر را با ابعاد ۱۰۲۴x۱۰۲۴، ۱۷۹۲x۱۰۲۴ و ۱۰۲۴x۱۷۹۲ پیکسل و با 16 میلیون رنگ تولید کند.
مدل DALL-E-3-HD یک نسخه بهینهسازی شده از مدل DALL-E-3 است. این مدل از یک شبکه عصبی ترانسفورمر (Transformer) به جای RNN استفاده میکند. در این مدل با استفاده از حافظه نزدیک (Attention)، رابطه بین کلمات و تصاویر بهتر درک میشود. همچنین، این مدل از یک تکنیک به نام CLIP استفاده میکند. این تکنیک به مدل این امکان را میدهد تا تصاویر را با استفاده از چشمانداز نظارت شده (Supervised Vision)، دستهبندی و رتبهبندی کند. مدل DALL-E-3-turbo تصاویری با ابعاد ۱۰۲۴x۱۰۲۴، ۱۷۹۲x۱۰۲۴ و ۱۰۲۴x۱۷۹۲ پیکسل و با 16 میلیون رنگ تولید میکند.
این دو مدل هوش مصنوعی، بر خلاف مدل DALL-E-2 زبان فارسی را نیز درک میکنند. البته پیشنهاد میکنیم برای حصول نتایج بهتر، درخواستهای خود از این مدلها را به زبان انگلیسی بیان کنید.
کاربردهای DALL-E-3
DALL-E-3 و DALL-E-3-HD جدیدترین مدلهای تولید تصویر از نسل DALL-E ارائه شده توسط شرکت OpenAI هستند. برخی کاربردهای این مدلهای پیشرفته را در ادامه نام میبریم:
-
- طراحی لوگو، پوستر، کارت ویزیت و سایر المانهای ویژهی تبلیغات و برندسازی
-
- خلق ایده برای طراحی دکوراسیون داخلی بر اساس سلیقه و بودجهی مشتریان در ترکیب با ربات پلاتو-ویژن (ربات تفسیر تصویر)
-
- بصری سازی و طراحی فضاهای داخلی و خارجی
-
- تولید پلنهای الهامبخش و خلاقانه برای طراحان حرفهای و دانشجویان معماری
-
- ایجاد طرحهای خلاقانه و یکتا برای ساختمانها، فضاهای عمومی، پارکها و محلات شهری و روستایی با استفاده از ترکیب تصاویر و متن
-
- تولید مدلهای سهبعدی و واقعیت افزوده (Augmented Reality) برای نمایش و ارزیابی طرحهای معماری در مقیاسهای مختلف
-
- ایجاد پیشنمایش واقعگرایانه از ایدهها برای ساخت یا بازسازی ساختمانها و نماها
-
- تولید تصاویر آموزشی، تفسیری و سرگرمکننده برای گروههای مختلف
-
- ارائه پیشنمایشهای واقعگرایانه از محصولات، خدمات، مکانها و رویدادهایی که هنوز واقعیت نیافتهاند
-
- کمک به پژوهشگران و دانشمندان در درک بصری از دادهها، پدیدهها و فرضیات
چند نمونه از تصاویر خلق شده با انجینهای DALL-E-3 و DALL-E-3_HD ربات خلق تصویر پلاتونیا
آیا DALL-E-3 توانایی ویرایش تصاویر را دارد؟
خیر. در حال حاضر شرکت OpenAI توانایی ویرایش تصاویر را تنها در مدل DALL-E-2 فعال کرده است. ما نیز در تلاشیم تا به زودی این ویژگی را در رباتهای پلاتونیا به کاربران ارزشمندمان ارائه کنیم.
چگونه از DALL-E-3 و DALL-E-3-HD استفاده کنم؟
اگر عضو پلاتونیا هستید میتوانید از این ربات استفاده کنید. عضویت در پلاتونیا هزینهای ندارد. به هر کاربر به محض عضویت در پلاتونیا، تعدادی توکن هدیه تعلق میگیرد. با توکنهای هدیه پلاتونیا میتوانید بسیاری از رباتهای پلاتونیا، از جمله ربات خلق تصویر را تست کنید. [اکنون به خانوادهی پلاتونیا بپیوندید]
پس از ورود به حساب کاربری، در برگهی «رباتهای پلاتونیا» با کلیک بر روی دکمهی «خلق تصویر»، به محیط ربات DALL-E وارد میشوید. در بخش تنظیمات ربات، امکاناتی در اختیارتان قرار دارد که برای بیشینه کردن مطلوبیت نتیجه میتوانید از آنها استفاده کنید. برای استفاده از مدلهای DALL-E-3 و DALL-E-3-HD در تنظیمات ربات مقدار «مدل هوش مصنوعی» را متناسب با نیاز خود تنظیم کنید.
پس از انجام تنظیمات مطلوب خود، در بخش «Prompt» آنچه در ذهن دارید را وارد کنید و روی دکمهی «تصویر رو خلق کن» کلیک کنید. تصویر مورد نظر شما پس از ساخته شدن، بارگذاری شده و نمایش داده میشود. تصاویر تولید شده، در دیتابیس پلاتونیا ذخیره نمیشوند مگر در صورتی که پس از انتخاب تصویر تولید شده، دکمهی ذخیره تصویر را بفشارید.
هزینههای استفاده از DALL-E-3
هر کاربر به محض عضویت با توکنهای هدیهای که در اختیار دارد، میتواند یک تصویر با DALL-E-3 یا DALL-E-3-HD تولید کند. برای خرید توکنهای بیشتر، میتوانید توکنهای DALL-E را از بازارچهی پلاتونیا تهیه فرمایید. تعداد توکنهای مصرفی توسط رباتهای خلق تصویر به ابعاد و رزلوشن تصویر و مدل هوش مصنوعی انتخابی بستگی دارد. به شکل میانگین با یک بستهی ۱۰۰تایی توکن DALL-E میتوانید ۱۰۰ تصویر ۱۰۲۴x۱۰۲۴ با DALL-E-2 بسازید. توکن مصرفی مدل DALL-E-3 تقریباً دو برابر DALL-E-2 است. مدل DALL-E-3-HD نیز مصرفی حدود یک و نیم تا دو برابر مدل DALL-E-3 دارد. بدین ترتیب با یک بستهی ۱۰۰تایی توکن DALL-E قادر به تولید ۲۵ تا ۳۰ تصویر ۱۰۲۴x۱۰۲۴ با DALL-E-3-HD هستید.