Pulkit Agrawal، استادیار MIT که روی هوش مصنوعی و روباتیک کار می کند، می گوید که نمایش های اخیر گوگل و OpenAI چشمگیر است و نشان می دهد که مدل های هوش مصنوعی چندوجهی با چه سرعتی پیشرفت کرده اند. OpenAI در سپتامبر 2023 GPT-4V را راهاندازی کرد، سیستمی که قادر به تجزیه و تحلیل تصاویر است. تحت تأثیر قرار گرفت که Gemini قادر به درک ویدیوی زنده بود – برای مثال، به درستی تغییرات ایجاد شده در نمودار تخته سفید را در زمان واقعی تفسیر میکرد. به نظر می رسد نسخه جدید OpenAI ChatGPT نیز قادر به انجام همین کار باشد.
آگراوال می گوید که دستیارانی که گوگل و OpenAI نشان داده اند می توانند داده های آموزشی جدیدی را به شرکت ها ارائه دهند، زیرا کاربران با مدل های دنیای واقعی تعامل دارند. او می افزاید: «اما آنها باید مفید باشند. “سوال بزرگ این است که مردم از آنها برای چه استفاده خواهند کرد – خیلی واضح نیست.”
گوگل می گوید Project Astra از طریق رابط جدیدی به نام Gemini Live در اواخر سال جاری در دسترس قرار خواهد گرفت. Hassabis گفت که این شرکت هنوز در حال آزمایش چند نمونه اولیه عینک هوشمند است و هنوز تصمیمی برای عرضه هیچ یک از آنها نگرفته است.
تواناییهای Astra میتواند به گوگل این فرصت را بدهد تا نسخهای از عینکهای هوشمند بدبخت خود را راهاندازی مجدد کند، اگرچه تلاشها برای ساخت سختافزار مناسب برای هوش مصنوعی مولد تاکنون دچار شکست شدهاند. با وجود تظاهرات چشمگیر OpenAI و Google، مدلهای چندوجهی نمیتوانند به طور کامل دنیای فیزیکی و اشیاء موجود در آن را درک کنند، و محدودیتهایی را برای کارهایی که میتوانند انجام دهند قرار میدهند.
برندان لیک، دانشیار دانشگاه نیویورک که از هوش مصنوعی برای مطالعه هوش انسانی استفاده میکند، میگوید: «توانایی ساختن یک مدل ذهنی از دنیای فیزیکی اطرافتان برای ساختن هوشی شبیه به انسان کاملاً ضروری است.
لیک اشاره میکند که بهترین مدلهای هوش مصنوعی امروزی هنوز هم بسیار زبان محور هستند، زیرا بیشتر آموزشهای آنها از متنهای پارهشده از کتابها و وب است. این اساساً با روش یادگیری زبان توسط افرادی که در تعامل با دنیای فیزیکی آن را به دست می آورند متفاوت است. او درباره روند ایجاد مدل های چندوجهی می گوید: «این در مقایسه با رشد کودک عقب مانده است.
Hassabis معتقد است که آغشته کردن مدلهای هوش مصنوعی با درک عمیقتر از دنیای فیزیکی، کلید پیشرفتهای بیشتر در هوش مصنوعی و قویتر کردن سیستمهایی مانند Project Astra خواهد بود. او میگوید دیگر مرزهای هوش مصنوعی، از جمله کار Google DeepMind روی برنامههای هوش مصنوعی برای بازی کردن، میتواند کمک کند. Hassabis و دیگران امیدوارند که چنین کاری بتواند انقلابی برای روباتیک باشد، حوزه ای که گوگل نیز در آن سرمایه گذاری می کند.
Hassabis در مورد نقطه آینده مورد انتظار اما تا حد زیادی تعریف نشده که در آن ماشین ها می توانند هر کاری و هر کاری را که ذهن انسان می تواند انجام دهند، گفت: “یک عامل دستیار جهانی چند وجهی در راه هوش مصنوعی عمومی است.” “این AGI یا هر چیز دیگری نیست، اما شروع چیزی است.”
به روز شده در 2024/5/14 ساعت 4:15 بعد از ظهر EDT: این مقاله برای روشن شدن نام کامل پروژه گوگل به روز شده است.