با وجود وحشی موفقیت ChatGPT و دیگر مدل‌های زبان بزرگ، شبکه‌های عصبی مصنوعی (ANN) که زیربنای این سیستم‌ها هستند ممکن است در مسیر اشتباهی قرار داشته باشند.

کورنلیا فرمولر، دانشمند کامپیوتر در دانشگاه مریلند، می‌گوید: یک چیز، شبکه‌های عصبی مصنوعی «بسیار تشنه قدرت» هستند. و مشکل دیگر عدم شفافیت (آنها) است.» چنین سیستم هایی آنقدر پیچیده هستند که هیچ کس واقعاً نمی داند که چه می کنند یا چرا اینقدر خوب کار می کنند. این به نوبه خود، تقریباً غیرممکن می‌کند که آنها را به استدلال قیاسی، کاری که انسان‌ها انجام می‌دهند – با استفاده از نمادها برای اشیا، ایده‌ها و ارتباطات بین آنها انجام می‌دهند.

چنین کاستی‌هایی احتمالاً از ساختار فعلی شبکه‌های عصبی مصنوعی و بلوک‌های سازنده آن‌ها ناشی می‌شود: نورون‌های مصنوعی منفرد. هر نورون ورودی ها را دریافت می کند، محاسبات را انجام می دهد و خروجی ها را تولید می کند. ANN های مدرن شبکه های پیچیده ای از این واحدهای محاسباتی هستند که برای انجام وظایف خاص آموزش دیده اند.

با این حال محدودیت های شبکه های عصبی مصنوعی مدت هاست آشکار شده است. به عنوان مثال، یک ANN را در نظر بگیرید که بین دایره و مربع تمایز قائل می شود. یک راه برای انجام این کار این است که در لایه خروجی آن دو نورون وجود داشته باشد، یکی که دایره و دیگری یک مربع را نمایش می دهد. اگر می خواهید ANN شما رنگ یک شکل را نیز تشخیص دهد – مثلا آبی یا قرمز – به چهار نورون خروجی نیاز دارید: هر کدام برای یک دایره آبی، یک مربع آبی، یک دایره قرمز و یک مربع قرمز. ویژگی های بیشتر به معنای نورون های بیشتر است.

مغز ما نمی تواند جهان طبیعی را با تمام تغییرات آن به این شکل درک کند. برونو اولشاوزن، عصب شناس در دانشگاه کالیفرنیا، برکلی، می گوید: «شما باید پیشنهاد کنید که برای همه ترکیبات یک نورون دارید. بنابراین شما (مثلاً) یک آشکارساز فولکس واگن بنفش در مغز خود خواهید داشت.”

در عوض، اولشاوزن و دیگران استدلال می کنند که اطلاعات در مغز با فعالیت نورون های متعدد نشان داده می شود. بنابراین تصور یک فولکس واگن بنفش به عنوان اعمال یک نورون منفرد نیست، بلکه به عنوان اعمال هزاران نورون رمزگذاری شده است. همان مجموعه ای از نورون ها که به طور متفاوت کار می کنند، می توانند مفهومی کاملاً متفاوت را نشان دهند (شاید یک کادیلاک صورتی).

این نقطه شروع یک رویکرد کاملاً متفاوت به محاسبات است که به عنوان محاسبات ابربعدی شناخته می شود. نکته کلیدی این است که هر بخش از اطلاعات، مانند ایده یک ماشین یا ساخت، مدل یا رنگ آن، یا همه آنها، به عنوان یک موجودیت واحد نمایش داده می شود: یک بردار فوق بعدی.

یک بردار به سادگی یک آرایه مرتب از اعداد است. برای مثال یک بردار سه بعدی از سه عدد تشکیل شده است: ایکس، y و z مختصات یک نقطه در فضای سه بعدی یک بردار یا ابربردار می‌تواند آرایه‌ای از 10000 عدد باشد، مثلاً یک نقطه را در یک فضای 10000 بعدی نشان دهد. این اشیاء ریاضی و جبر برای دستکاری آنها به اندازه کافی انعطاف پذیر و قدرتمند هستند تا رایانه های مدرن را فراتر از برخی محدودیت های فعلی خود برانند و رویکرد جدیدی به هوش مصنوعی را تشویق کنند.

اولشاوزن گفت: «این چیزی است که من بیشتر از همه در مورد آن هیجان زده بودم، عملاً کل دوران حرفه ای من. برای او و بسیاری دیگر، محاسبات ابر بعدی نوید دنیای جدیدی را می دهد که در آن محاسبات کارآمد و پایدار هستند و تصمیمات ماشینی کاملاً شفاف هستند.

فضاهای با ابعاد بالا را وارد کنید

برای درک اینکه چگونه ابربردارها محاسبات را ممکن می‌کنند، اجازه دهید به تصاویر دایره قرمز و مربع آبی بازگردیم. ابتدا به بردارهایی برای نشان دادن متغیرهای SHAPE و COLOR نیاز داریم. در مرحله بعد، ما همچنین به بردارهایی برای مقادیری نیاز داریم که می توانند به متغیرها اختصاص داده شوند: CIRCLE، SQUARE، BLUE و RED.

بردارها باید متفاوت باشند. این وضوح را می توان با خاصیتی به نام orthogonality که به معنای قرار گرفتن در زوایای قائمه است، اندازه گیری کرد. در فضای سه بعدی، سه بردار متعامد با یکدیگر وجود دارد: یکی در ایکس جهت، دیگر در y و یک سوم در z. 10000 بردار متعامد متقابل در فضای 10000 بعدی وجود دارد.