خانه » با انجین DALL-E-3-HD پلاتونیا تصاویری بدیع خلق کنید

تکنولوژی تولید تصاویر با هوش مصنوعی به سرعت در حال پیشرفت است. نسل جدید انجین DALL-E موسوم به DALL-E-3 توانایی درک زبان فارسی را نیز داراست.

از این پس معماران، گرافیست‌ها، طراحان دکور و حتی پژوهشگران و اساتید دانشگاه قادر خواهند بود تصاویر خلاقانه و منحصر به فرد خود را با نسخه‌ی به روز شده‌ی ربات تصويرساز پلاتونیا خلق کنند. آخرین نسخه‌ موتورهای هوش مصنوعی تصویرساز با نام DALL-E-3 و DALL-E-3-HD، قابلیت درک و تولید تصاویر بسیار پیچیده و با کیفیت بالا را دارند.

مدل‌های DALL-E-3 و DALL-E-3-HD جهشی خارق‌العاده در تکنولوژی تصویرسازی با هوش مصنوعی

مدل DALL-E-3 یک مدل خودآموز است که با استفاده از یک شبکه عصبی پیچشی (CNN) و یک شبکه عصبی بازگشتی (RNN)، قادر است تصاویر را بر اساس متن وارد شده تولید کند. این مدل از یک تکنیک به نام VQ-VAE استفاده می‌کند که به آن امکان می‌دهد تصاویر را با کیفیت بالا و با حجم کم ذخیره کند. مدل DALL-E-3 قادر است تصاویر را با ابعاد ۱۰۲۴x۱۰۲۴، ۱۷۹۲x۱۰۲۴ و ۱۰۲۴x۱۷۹۲ پیکسل و با 16 میلیون رنگ تولید کند.

مدل DALL-E-3-HD یک نسخه بهینه‌سازی شده از مدل DALL-E-3 است. این مدل از یک شبکه عصبی ترانسفورمر (Transformer) به جای RNN استفاده می‌کند. در این مدل با استفاده از حافظه نزدیک (Attention)، رابطه بین کلمات و تصاویر بهتر درک می‌شود. همچنین، این مدل از یک تکنیک به نام CLIP استفاده می‌کند. این تکنیک به مدل این امکان را می‌دهد تا تصاویر را با استفاده از چشم‌انداز نظارت شده (Supervised Vision)، دسته‌بندی و رتبه‌بندی کند. مدل DALL-E-3-turbo تصاویری با ابعاد ۱۰۲۴x۱۰۲۴، ۱۷۹۲x۱۰۲۴ و ۱۰۲۴x۱۷۹۲ پیکسل و با 16 میلیون رنگ تولید می‌کند.

این دو مدل هوش مصنوعی، بر خلاف مدل DALL-E-2 زبان فارسی را نیز درک می‌کنند. البته پیشنهاد می‌کنیم برای حصول نتایج بهتر، درخواست‌های خود از این مدل‌ها را به زبان انگلیسی بیان کنید.

کاربردهای DALL-E-3

DALL-E-3 و DALL-E-3-HD جدیدترین مدل‌های تولید تصویر از نسل DALL-E ارائه شده توسط شرکت OpenAI هستند. برخی کاربردهای این مدل‌های پیشرفته را در ادامه نام می‌بریم: 

      • طراحی لوگو، پوستر، کارت ویزیت و سایر المان‌های ویژه‌ی تبلیغات و برندسازی

      • خلق ایده برای طراحی دکوراسیون داخلی بر اساس سلیقه‌ و بودجه‌ی مشتریان در ترکیب با ربات پلاتو-ویژن (ربات تفسیر تصویر)

      • بصری سازی و طراحی فضاهای داخلی و خارجی

      • تولید پلن‌های الهام‌بخش و خلاقانه برای طراحان حرفه‌ای و دانشجویان معماری

      • ایجاد طرح‌های خلاقانه و یکتا برای ساختمان‌ها، فضاهای عمومی، پارک‌ها و محلات شهری و روستایی با استفاده از ترکیب تصاویر و متن

      • تولید مدل‌های سه‌بعدی و واقعیت افزوده (Augmented Reality) برای نمایش و ارزیابی طرح‌های معماری در مقیاس‌های مختلف

      • ایجاد پیش‌نمایش واقع‌گرایانه از ایده‌ها برای ساخت یا بازسازی ساختمان‌ها و نماها

      • تولید تصاویر آموزشی، تفسیری و سرگرم‌کننده برای گروه‌های مختلف

      • ارائه پیش‌نمایش‌های واقع‌گرایانه از محصولات، خدمات، مکان‌ها و رویدادهایی که هنوز واقعیت نیافته‌اند

      • کمک به پژوهشگران و دانشمندان در درک بصری از داده‌ها، پدیده‌ها و فرضیات

    چند نمونه‌ از تصاویر خلق شده با انجین‌های DALL-E-3 و DALL-E-3_HD ربات خلق تصویر پلاتونیا

    خلق ایده‌ی نمای معماری با DALL-E-3

    پروفایل فانتزی

    طراحی چیدمان معماری با DALL-E-3

    خروس سبز با DALL-E-3

    مزرعه خورشیدی با DALL-E-3

    شهر فردا

    آیا DALL-E-3 توانایی ویرایش تصاویر را دارد؟

    خیر. در حال حاضر شرکت OpenAI توانایی ویرایش تصاویر را تنها در مدل DALL-E-2 فعال کرده‌ است. ما نیز در تلاشیم تا به زودی این ویژگی را در ربات‌های پلاتونیا به کاربران ارزشمندمان ارائه کنیم.

    چگونه از DALL-E-3 و DALL-E-3-HD استفاده کنم؟

    اگر عضو پلاتونیا هستید می‌توانید از این ربات استفاده کنید. عضویت در پلاتونیا هزینه‌ای ندارد. به هر کاربر به محض عضویت در پلاتونیا، تعدادی توکن هدیه تعلق می‌گیرد. با توکن‌های هدیه پلاتونیا می‌توانید بسیاری از ربات‌های پلاتونیا، از جمله ربات خلق تصویر را تست کنید. [اکنون به خانواده‌ی پلاتونیا بپیوندید]

    پس از ورود به حساب کاربری، در برگه‌ی «ربات‌های پلاتونیا» با کلیک بر روی دکمه‌ی «خلق تصویر»، به محیط ربات DALL-E وارد می‌شوید. در بخش تنظیمات ربات، امکاناتی در اختیارتان قرار دارد که برای بیشینه‌ کردن مطلوبیت نتیجه می‌توانید از آنها استفاده کنید. برای استفاده از مدل‌های DALL-E-3 و DALL-E-3-HD در تنظیمات ربات مقدار «مدل هوش مصنوعی» را متناسب با نیاز خود تنظیم کنید.

    ربات خلق تصویر با DALL-E

    پس از انجام تنظیمات مطلوب خود، در بخش «Prompt» آنچه در ذهن دارید را وارد کنید و روی دکمه‌ی «تصویر رو خلق کن» کلیک کنید. تصویر مورد نظر شما پس از ساخته شدن، بارگذاری شده و نمایش داده می‌شود. تصاویر تولید شده، در دیتابیس پلاتونیا ذخیره نمی‌شوند مگر در صورتی که پس از انتخاب تصویر تولید شده، دکمه‌ی ذخیره تصویر را بفشارید.

    هزینه‌های استفاده از DALL-E-3

    هر کاربر به محض عضویت با توکن‌های هدیه‌ای که در اختیار دارد، می‌تواند یک تصویر با DALL-E-3 یا DALL-E-3-HD تولید کند. برای خرید توکن‌های بیشتر، می‌توانید توکن‌های DALL-E را از بازارچه‌ی پلاتونیا تهیه فرمایید. تعداد توکن‌های مصرفی توسط ربات‌های خلق تصویر به ابعاد و رزلوشن تصویر و مدل هوش مصنوعی انتخابی بستگی دارد. به شکل میانگین با یک بسته‌ی ۱۰۰تایی توکن DALL-E می‌توانید ۱۰۰ تصویر ۱۰۲۴x۱۰۲۴ با DALL-E-2 بسازید. توکن مصرفی مدل DALL-E-3 تقریباً دو برابر DALL-E-2 است. مدل DALL-E-3-HD نیز مصرفی حدود یک و نیم تا دو برابر مدل DALL-E-3 دارد. بدین ترتیب با یک بسته‌ی ۱۰۰تایی توکن DALL-E قادر به تولید ۲۵ تا ۳۰ تصویر ۱۰۲۴x۱۰۲۴ با DALL-E-3-HD هستید.