Pulkit Agrawal، استادیار MIT که روی هوش مصنوعی و روباتیک کار می کند، می گوید که نمایش های اخیر گوگل و OpenAI چشمگیر است و نشان می دهد که مدل های هوش مصنوعی چندوجهی با چه سرعتی پیشرفت کرده اند. OpenAI در سپتامبر 2023 GPT-4V را راه‌اندازی کرد، سیستمی که قادر به تجزیه و تحلیل تصاویر است. تحت تأثیر قرار گرفت که Gemini قادر به درک ویدیوی زنده بود – برای مثال، به درستی تغییرات ایجاد شده در نمودار تخته سفید را در زمان واقعی تفسیر می‌کرد. به نظر می رسد نسخه جدید OpenAI ChatGPT نیز قادر به انجام همین کار باشد.

آگراوال می گوید که دستیارانی که گوگل و OpenAI نشان داده اند می توانند داده های آموزشی جدیدی را به شرکت ها ارائه دهند، زیرا کاربران با مدل های دنیای واقعی تعامل دارند. او می افزاید: «اما آنها باید مفید باشند. “سوال بزرگ این است که مردم از آنها برای چه استفاده خواهند کرد – خیلی واضح نیست.”

گوگل می گوید Project Astra از طریق رابط جدیدی به نام Gemini Live در اواخر سال جاری در دسترس قرار خواهد گرفت. Hassabis گفت که این شرکت هنوز در حال آزمایش چند نمونه اولیه عینک هوشمند است و هنوز تصمیمی برای عرضه هیچ یک از آنها نگرفته است.

توانایی‌های Astra می‌تواند به گوگل این فرصت را بدهد تا نسخه‌ای از عینک‌های هوشمند بدبخت خود را راه‌اندازی مجدد کند، اگرچه تلاش‌ها برای ساخت سخت‌افزار مناسب برای هوش مصنوعی مولد تاکنون دچار شکست شده‌اند. با وجود تظاهرات چشمگیر OpenAI و Google، مدل‌های چندوجهی نمی‌توانند به طور کامل دنیای فیزیکی و اشیاء موجود در آن را درک کنند، و محدودیت‌هایی را برای کارهایی که می‌توانند انجام دهند قرار می‌دهند.

برندان لیک، دانشیار دانشگاه نیویورک که از هوش مصنوعی برای مطالعه هوش انسانی استفاده می‌کند، می‌گوید: «توانایی ساختن یک مدل ذهنی از دنیای فیزیکی اطرافتان برای ساختن هوشی شبیه به انسان کاملاً ضروری است.

لیک اشاره می‌کند که بهترین مدل‌های هوش مصنوعی امروزی هنوز هم بسیار زبان محور هستند، زیرا بیشتر آموزش‌های آن‌ها از متن‌های پاره‌شده از کتاب‌ها و وب است. این اساساً با روش یادگیری زبان توسط افرادی که در تعامل با دنیای فیزیکی آن را به دست می آورند متفاوت است. او درباره روند ایجاد مدل های چندوجهی می گوید: «این در مقایسه با رشد کودک عقب مانده است.

Hassabis معتقد است که آغشته کردن مدل‌های هوش مصنوعی با درک عمیق‌تر از دنیای فیزیکی، کلید پیشرفت‌های بیشتر در هوش مصنوعی و قوی‌تر کردن سیستم‌هایی مانند Project Astra خواهد بود. او می‌گوید دیگر مرزهای هوش مصنوعی، از جمله کار Google DeepMind روی برنامه‌های هوش مصنوعی برای بازی کردن، می‌تواند کمک کند. Hassabis و دیگران امیدوارند که چنین کاری بتواند انقلابی برای روباتیک باشد، حوزه ای که گوگل نیز در آن سرمایه گذاری می کند.

Hassabis در مورد نقطه آینده مورد انتظار اما تا حد زیادی تعریف نشده که در آن ماشین ها می توانند هر کاری و هر کاری را که ذهن انسان می تواند انجام دهند، گفت: “یک عامل دستیار جهانی چند وجهی در راه هوش مصنوعی عمومی است.” “این AGI یا هر چیز دیگری نیست، اما شروع چیزی است.”

به روز شده در 2024/5/14 ساعت 4:15 بعد از ظهر EDT: این مقاله برای روشن شدن نام کامل پروژه گوگل به روز شده است.