این هوش مصنوعی در ۵ ثانیه عکس دوبعدی را سه‌بعدی می‌کند!

صنایع خلاقانه برای راضی‌ نگه‌ داشتن مخاطبان به جریان مدام محتوا نیاز دارند و این محتوا باید به‌نحوی ایجاد شود. وقتی صحبت از مدل‌های سه‌بعدی به‌میان آید، الگوریتم‌های هوش مصنوعی می‌توانند با کاهش زمان تولید، کمک بزرگی به تولیدکنندگان محتوا کنند.

محققان ادوبی و دانشگاه ملی استرالیا، با استفاده از مجموعه داده‌های بزرگ برای آموزش الگوریتم یادگیری ماشینی، فناوری جذابی را توسعه داده‌اند که عملکرد شگفت‌انگیزی در تولید مدل‌های سه‌بعدی دارد. محققان اولین مدل بازسازی بزرگ (LRM) را ایجاد کردند که می‌تواند شکل مدل سه‌بعدی را از روی تصویر دوبعدی پیش‌بینی کند و اینکار را فقط در مدت پنج ثانیه انجام می‌دهد.

محققان در مقاله‌ی خود توضیح می‌دهند نسل قبلی الگوریتم‌های ساخت مدل سه‌بعدی، براساس مجموعه داده‌های متمرکز بر تصویر در مقایس کوچک آموزش داده شده‌اند. اکنون مدل‌ LRM از معماری بسیار مقیاس‌پذیر و مبتنی‌بر ترانسفورماتور با بیش‌از ۵۰۰ میلیون پارامتر آموزش داده شده و از یک میلیون شکل سه‌بعدی موجود در داده‌های Objaverse و MVImgNet بهره می‌برد.

محققان می‌گویند مدل LRM می‌تواند بازسازی‌های سه‌بعدی با کیفیت را از عکس‌های مختلف ازجمله تصاویر دنیای واقعی تولید کند. علاوه‌بر این، مدل مذکور می‌تواند تصاویر عادی ساخته‌شده با سایر سرویس‌های هوش مصنوعی مثل DALL-E و میدجورنی را به‌عنوان مدل دوبعدی ورودی دریافت کند.

یوکان هانگ، نویسنده‌ی اصلی مقاله‌ی LRM می‌گوید این مدل پیشرفت مهمی در بازسازی سه‌بعدی از روی تصاویر ساده است. الگوریتم هوش مصنوعی می‌تواند هندسه‌ی دقیق را از ویدیو یا تصویر شکل موردنظر، ایجاد و بافت‌های پیچیده مثل دانه‌های چوب را روی آن‌ها حفظ کند.