OpenAI هنگام رونمایی اولیه‌ی هوش مصنوعی Sora نگاه‌ها را خیره کرد و همچنان به متعجب‌کردن مردم ادامه می‌دهد. سورا که سرویسی بسیار پیشرفته محسوب می‌شود، صرفاً از روی دستور متنی، ویدیوهای واقع‌گرایانه می‌سازد.

ویدیوهای سورا بی‌نقص نیستند و همچنان برخی باگ‌ها در آن‌ها به چشم می‌خورد، با این‌حال کیفیت ویدیوهایی که سورا می‌سازد، به طرز اعجاب‌انگیزی بالا است و در برخی نمونه‌ها ممکن است تشخیص آن‌ها از واقعیت سخت باشد. راه‌اندازی سورا باعث نگرانی تولیدکنندگان ویدیو و مخصوصاً افراد فعال در هالیوود شده است.

سورا صرفاً با دستور متنی، ویدیوهای بسیار واقع‌گرایانه می‌سازد

ویدیوهای جدیدی که از Sora در شبکه‌ی اجتماعی ایکس پخش شده‌اند، بار دیگر توانایی‌های این مدل هوش مصنوعی را به تصویر می‌کشند. در ویدیوهای جدید شاهد صحنه‌هایی واقع‌گرایانه هستیم که جزئیات و دقت‌شان بسیار زیاد است.

سورا فعلاً به‌صورت عمومی در دسترس قرار ندارد، با این‌حال مدیر ارشد فناوری OpenAI تأیید کرده است که هوش مصنوعی مورد بحث قبل از پایان سال ۲۰۲۴ منتشر می‌شود.

درحالی‌که هنوز کاربران عادی به سورا دسترسی ندارند، OpenAI تلاش می‌کند با ویدیوهایی کوتاه و تحسین‌برانگیز، هیجان پیرامون این مدل هوش مصنوعی را حفظ کند.

یکی از ویدیوهای جدید سورا، شبیه سکانسی از فیلم‌های فانتزی به نظر می‌رسد و با این دستور متنی ساخته شده است: «یک فیل ساخته‌شده از برگ در حال دویدن در جنگل.»

به جزئیات فیل، جنگل، آسمان و نحوه‌ی نورپردازی دقت کنید تا به توانایی‌های سورا پی ببرید. OpenAI می‌گوید ویدیوی بالا تماماً توسط سورا ساخته شده و هیچ اصلاحی روی آن انجام نگرفته است.

ویدیوی جذاب دیگر سورا، یک گربه‌ی بازیگوش را نشان می‌دهد که با این دستور متنی ساخته شده است: «یک دزد دریاییِ گربه‌ایِ دوست‌داشتنی که روی جاروبرقی رباتیک سوار است و در خانه می‌چرخد.»

هنگام تماشای ویدیوی بالا به خود یادآوری کنید که آن گربه وجود خارجی ندارد و کل ویدیو صرفاً با دستور متنی ساخته شده است؛ چون ممکن است آن را با ویدیویی واقعی اشتباه بگیرید.

ویدیوی دیگر سورا، «آبشار رنگارنگ نیاگارا» را با جزئیات بسیار زیاد به تصویر می‌کشد. نتیجه‌‌ای که سورا ساخته، در زمینه‌ی دقت و نورپردازی و حتی رنگ‌ها بسیار طبیعی به نظر می‌رسد.

سه ویدیویی که در این مقاله دیدید، تنها بخشی از توانایی‌های سورا را نمایش می‌دهند. این مدل هوش مصنوعی پیشرفته صحنه‌هایی واقع‌گرایانه و مبتکرانه می‌سازد و می‌تواند بفهمد که اشیاء مدنظر کاربر در دنیای واقعی چگونه به‌نظر می‌رسند.

مقاله‌های مرتبط

بر اساس گفته‌ی OpenAI، سورا توانایی تفسیر دقیق دستورهای متنی را دارد و کاراکترهای پرجزئیاتی می‌سازد که احساسات‌شان پرجنب‌و‌جوش به نظر می‌رسد.

مدل هوش مصنوعی جدید OpenAI افزون‌بر تبدیل متن به ویدیو می‌تواند ویدیو را از روی عکس تولید کند و همچنین توانایی پرکردن فریم‌های خالی ویدیوها و حتی افزایش زمان آن‌ها را دارد.

اگر به تماشای ویدیوهای بیشتر از سورا علاقه دارید، حتماً به این مجموعه‌پست در شبکه‌ی اجتماعی ایکس سر بزنید. شک نداریم که از تماشای یکایک ویدیوها حیرت‌زده خواهید شد.