متا همزمان با ارائه هوش مصنوعی خود برای پلتفرم‌های اجتماعی خود مانند اینستاگرام، واتس‌اپ و فیسبوک، مدل زبان Llama 3 را در اختیار ارائه‌دهندگان خدمات ابری مانند آمازون قرار داده است. این شرکت ادعا می کند که مدل زبان ذکر شده قادر است عملکرد بهتری نسبت به رقبا از خود نشان دهد و اغلب هوش مصنوعی مدرن از جمله جمینای گوگل را شکست می دهد.

مدل زبان لاما 3 چه ویژگی هایی دارد؟

مدل زبان Llama 3 در حال حاضر در دو نسخه یکی با 8 میلیارد و دیگری با 70 میلیارد پارامتر موجود است. هر چه این مقدار بیشتر باشد، پیچیدگی مدل بیشتر می شود و درک بهتری از تمرین ها خواهد داشت. اگرچه مدل فعلی فقط قادر به ارائه پاسخ های متنی است. اما متا می گوید که نسخه جدید پیشرفت های قابل توجهی را نسبت به نسل قبلی نشان داده است. به عنوان مثال، در حال حاضر میزان تنوع در پاسخ ها نسبت به گذشته بیشتر شده است و به ندرت با سؤالات اشتباه یا عدم پاسخ داده می شود. همچنین نحوه درک دستورات و نوشتن کدها نیز بهبود یافته است.

در یک انتشار رسمی، متا ادعا کرد که هر دو نسخه از مدل زبان Llama 3 از Gemma و Gemina گوگل، Mistral (نسخه با 7 میلیارد پارامتر) و Claude 3 در برخی معیارها بهتر عمل می کنند. به عنوان مثال، نسخه 8 میلیارد پارامتری Lama 3 در بنچمارک MMLU که به اطلاعات کلی نگاه می کند، توانست رتبه بهتری نسبت به پارامترهای 7 میلیاردی Gemma و Mistral کسب کند. نسخه 70 میلیارد پارامتری با اختلاف کمی نسبت به جمینا پرو 1.5 گوگل برتری دارد. شایان ذکر است که متا در مقایسه های خود مستقیماً به هوش مصنوعی پرچمدار OpenAI یعنی GPT-4 اشاره نکرده است.

لازم به ذکر است که اگرچه مقایسه مدل های زبانی می تواند راهی برای مقایسه عملکرد آنها باشد، اما گاهی اوقات می تواند به نتایج گمراه کننده ای منجر شود. به عنوان مثال، اگر داده‌های مورد استفاده در معیار در داده‌های آموزشی مدل زبان وجود داشته باشد، نمی‌توان به نتایج زیادی اعتماد کرد. زیرا هوش مصنوعی در گذشته با سوالات مشابهی روبرو بوده و پاسخ آنها را می داند.

با این حال، متا همچنان ادعا می‌کند که حتی رتبه‌بندی‌های انسانی نیز Llama 3 را بالاتر از GPT-3.5 قرار می‌دهد. در طی ارزیابی های گفته شده، داده های جدیدی برای آزمایش عملکرد مدل زبان برای شبیه سازی شرایط مشابه عملکرد دنیای واقعی تولید می شود. این ارزیابی ها شامل 1800 فرمان است که 12 محور اصلی را پوشش می دهد که از جمله آنها می توان به درخواست جهت، طبقه بندی، پاسخ به سؤالات، کدگذاری، نوشتن خلاق، داده کاوی، استدلال، بازنویسی و خلاصه سازی اشاره کرد.

انتظار می‌رود متا مدل زبان Llama 3 را در حجم‌های بزرگ‌تر ارائه کند که قادر به درک دستورات طولانی‌تر و پردازش داده‌های بیشتر خواهد بود. علاوه بر این، ویژگی ها و عملکردهای جدیدی مانند ایجاد تصویر یا تبدیل فایل صوتی به متن از جمله ویژگی هایی است که در نسخه 400 میلیارد پارامتری هوش مصنوعی فیس بوک در دسترس خواهد بود. البته پیش نمایش یا مقایسه مدل های بزرگتر با رقبای اصلی آن مانند GPT-4 وجود ندارد و باید منتظر انتشار اطلاعات جدید توسط متا باشیم.